En el marco del Workshop "Machine Intelligence Training and applications to regional challenges” el Laboratorio de Computación Científica de la FACET-UNT nos propone un desafío en el cual la IA puede ayudar a problemas concretos de la comunidad. Lograr la mejor predicción de lluvias en el noroeste argentino comparando modelos climáticos con datos de la realidad.
Rank | Usuario | Intentos | Puntaje Público |
---|---|---|---|
1 | ivansadofschi | 39 | 15.32739 |
2 | sebastian_incicco | 27 | 19.82355 |
3 | aosatinsky | 152 | 22.28204 |
4 | cortesjpb | 30 | 23.76554 |
5 | javieralvarez.ic | 5 | 23.91826 |
6 | scmartinmarfia | 44 | 25.65732 |
7 | victoradrianjimenez | 13 | 26.16872 |
8 | mariorivas87 | 10 | 26.70387 |
9 | nicovaras22 | 26 | 28.00000 |
10 | nicoomacian | 7 | 29.90478 |
11 | francotralice | 6 | 30.01869 |
12 | alefasan | 1 | 30.03681 |
13 | camilo.plata | 14 | 31.57396 |
14 | fernandocuccorese | 3 | 32.17525 |
15 | ijmermet | 17 | 32.35503 |
16 | lbellomo | 2 | 33.03750 |
17 | lucianoabrum | 11 | 36.24008 |
18 | javier.chatruc | 5 | 37.38345 |
19 | myllemao | 20 | 40.40000 |
20 | juantarletta | 1 | 49.76749 |
La competencia ha finalizado el 2 de Marzo de 2020
21/2 Nos complace anunciar que el Ente de Turismo de la Provincia de Tucumán se suma a los premios y nos ofrece un Voucher de alojamiento en el hotel Sol San Javier para 2 personas por 2 noches. Sol San Javier es un hotel 4 estrellas ubicado en la cima de cerro San Javier, rodeado de la imponente yunga tucumana y con vista excepcional de la ciudad de San Miguel de Tucumán.
2/3 Estamos muy agradecidos con todos por haber participado de la competencia. Les estaremos comunicando por mail los resultados. En caso de haber quedado entre los cinco primeros tienen tiempo hasta las 23:59 del martes 3/3 para enviar el informe. Enviarlo a metadata@fundacionsadosky.org.ar con asunto "competencia llevo paraguas".
2/3 Error en la tabla de scores. Hubo un reseteo de la tabla. Pedimos disculpas por el inconveniente, estaremos resolviendolo hoy a la tarde.
2/3 Mañana podrá verse la tabla de scores definitiva la cual hemos enviado hoy mismo por mail.
3/3 Ya se encuentra restablecida la tabla de scores.
El análisis del comportamiento de la lluvia presenta fundamental importancia tanto para la gestión del recurso hídrico como para la mitigación de desastres ocasionados por efecto de eventos extremos.
La producción agrícola tiene una gran importancia económica en la Región del Noroeste argentino (Jujuy, Salta, Catamarca, La Rioja, Santiago del Estero y Tucumán), donde se encuentran regímenes hídricos bien diferenciados por la variabilidad espacial. Así mismo, al encontrarse muchos de sus centros poblados en la zona del piedemonte, es necesario desarrollar acciones para su preservación frente a la ocurrencia de aluviones y crecientes repentinas. En un contexto de cambio climático es necesario contar con la mejor información para optimizar la planificación.
Desafortunadamente, las series de datos de lluvia disponibles en la región raramente poseen una longitud suficiente y, por lo general, no cubren todo el territorio de análisis, siendo frecuente encontrar las series más completas en las cercanías de los centros más poblados. Para salvar este hecho, se propone complementar los registros de observaciones con datos provenientes de reanálisis, los cuales combinan observaciones de distintas variables atmosféricas con modelos de predicción numérica, obteniéndose campos reticulados con cobertura global. Actualmente, existen numerosos reanálisis disponibles en línea, tales como ERA 20 C, NCEP-NCAR 1 y ERA INTERIM, con datos diarios cuya resolución espacial va de 0.7° x 0.7° a 2.5° x 2.5° (lat x lon), y diferente longitud de sus periodos de cobertura.
Los datos de las estaciones meteorológicas disponibles para análisis se encuentran en el dataset “Estaciones.xlsx” y las variables que podrían tener incidencia en la lluvia regional en el archivo “variables e indices NDEFM.xlsx”. Por su parte, los datos resultantes de reanálisis a emplear se encuentran en los datasets del archivo "datos NCEP NCAR.xlsx".
Ayuda: ¿cómo elegir el punto de grilla para comparar con una determinada estación?
Si estamos trabajando, por ejemplo, con la estación San Luis cuya lat = 26.06 y lon = 66.0, se debe seleccionar el punto de grilla más cercano a la estación. La latitud más cercana de la grilla es 25°, la longitud más cercana de la grilla es 65°, por lo tanto, se debe escoger el punto de grilla cuyo indicativo es "V13".
Archivos “Estaciones.xlsx” y "datos NCEP NCAR.xlsx":
Archivo “variables e indices NDEFM.xlsx”:
La evaluación consta de tres partes:
1- La métrica para la predicción es el MAE. Se debe submitir un archivo csv sin encabezado con el siguiente formato: la primer columna debe ser el id (integer) y la segunda columna debe tener la predicción (float). Es importante que los id comiencen desde cero y se asigne uno por cada año en el orden correspondiente. Puede descargar este ejemplo si tiene alguna duda y copiar el formato.
2- La nota la otorgará un jurado ad-hoc de especialistas en el tema evaluando el informe sobre el trabajo realizado con el análisis de contrastación entre los datos reales y los datos generados por los modelos numéricos.
3- Al final de la competencia se le pedirá a los primeros cinco competidores en el ranking de predicciones un informe adicional (puede adjuntarse con el punto 1), donde explique el modelo aplicado.
Finalmente el score total que determinará los ganadores se compondrá en un 70% por el score privado conseguido con la predicción y el 30% restante se sumará con los informes.
Importante: para el análisis se debe de tener en cuenta el cuadrante que le corresponde a cada estación con el reanálisis (latitud y longitud).
Soluciones tramposas serán detectadas y quedarán descalificadas.
Ante cualquier duda nos puede contactar al correo metadata@fundacionsadosky.org.ar