Re: GraphCast - Il nuovo approccio di Google alle previsioni meteorologiche basato sull'IA (battuto ECMWF)
Faccio un copia/incolla di un messaggio scritto da Snowaholic su MNW, probabilmente uno degli personaggi più preparati del panorama meteo-amatoriale italiano, nel quale spiega in maniera eccellente il sistema di funzionamento dei modelli AI based
"
I modelli che utilizzano reti neurali non sono lineari, modelli come Graphcast individuano la dinamica che considerano più probabile a partire da una specifica condizione iniziale attraverso lo studio del dataset di reanalisi (le ERA5 1979-2017 in questo caso).
Non c'è nessun ostacolo teorico, se non il fatto che il modello non produce necessariamente output coerenti dal punto di vista fisico (ma avendo effettuato un training su un dataset che è costruito integrando anche i principi fisici anche l'output in linea di massima lo sarà).
Considerato che i modelli utilizzati attualmente sono delle approssimazioni dei processi fisici (quindi intrinsecamente soggette ad errori e bias nella dinamica) non è così scontato che un modello che cerca di simulare le dinamiche reali in base ai principi della fisica riesca a raggiungere una precisione maggiore di uno che fa una simulazione statistica (non lineare). Dopotutto lo vediamo anche con le stagionali quanta difficoltà hanno i modelli di simulazione in particolare sulle dinamiche polari, anche semplici modelli statistici riescono ad ottenere risultati migliori.
Di conseguenza il modello costruito sulle reti neurali ha il vantaggio di costruire la previsione "imitando" le dinamiche reali studiate nel dataset di inizializzazione, che sono prive degli errori di approssimazione impliciti in un modello deterministico, ma ha lo svantaggio di non utilizzare le conoscenze sui processi fisici. Dal punto di vista della propagazione dell'errore, non mi stupirebbe una maggiore robustezza dei modelli basati sulle reti neurali.
Dal punto di vista teorico non c'è un approccio superiore ad un altro, si tratta di approcci totalmente diversi quindi si può solo fare una valutazione relativa in termini di efficienza. In ogni caso, la parte di inizializzazione e reanalisi che fanno i modelli attuali rimane essenziale, si tratta solo di capire se nel costruire le dinamiche future sia più efficiente un approccio che cerca di risolvere le equazioni oppure uno che "ragioni" sostanzialmente per analogia dopo aver fatto un confronto con altre situazioni analoghe. Non mi stupirebbe se in futuro dei modelli globali attuali rimanesse prevalentemente la parte di inizializzazione e reanalisi, mentre per le previsioni prevalesse un approccio più leggero fondato sul machine learning.
"
Fantastico
