card-image

¿Llevo paraguas? Pronosticando la lluvia

En el marco del Workshop "Machine Intelligence Training and applications to regional challenges” el Laboratorio de Computación Científica de la FACET-UNT nos propone un desafío en el cual la IA puede ayudar a problemas concretos de la comunidad. Lograr la mejor predicción de lluvias en el noroeste argentino comparando modelos climáticos con datos de la realidad.


¡Quiero participar!

Leaderboard

Rank Usuario Intentos Puntaje Público
1 ivansadofschi 39 15.32739
2 sebastian_incicco 27 19.82355
3 aosatinsky 152 22.28204
4 cortesjpb 30 23.76554
5 javieralvarez.ic 5 23.91826
6 scmartinmarfia 44 25.65732
7 victoradrianjimenez 13 26.16872
8 mariorivas87 10 26.70387
9 nicovaras22 26 28.00000
10 nicoomacian 7 29.90478
11 francotralice 6 30.01869
12 alefasan 1 30.03681
13 camilo.plata 14 31.57396
14 fernandocuccorese 3 32.17525
15 ijmermet 17 32.35503
16 lbellomo 2 33.03750
17 lucianoabrum 11 36.24008
18 javier.chatruc 5 37.38345
19 myllemao 20 40.40000
20 juantarletta 1 49.76749

premio-icon Premios

Fechas

La competencia ha finalizado el March 2, 2020

Introducción

Novedades

  • 21/2 Nos complace anunciar que el Ente de Turismo de la Provincia de Tucumán se suma a los premios y nos ofrece un Voucher de alojamiento en el hotel Sol San Javier para 2 personas por 2 noches. Sol San Javier es un hotel 4 estrellas ubicado en la cima de cerro San Javier, rodeado de la imponente yunga tucumana y con vista excepcional de la ciudad de San Miguel de Tucumán.

  • 2/3 Estamos muy agradecidos con todos por haber participado de la competencia. Les estaremos comunicando por mail los resultados. En caso de haber quedado entre los cinco primeros tienen tiempo hasta las 23:59 del martes 3/3 para enviar el informe. Enviarlo a metadata@fundacionsadosky.org.ar con asunto "competencia llevo paraguas".

  • 2/3 Error en la tabla de scores. Hubo un reseteo de la tabla. Pedimos disculpas por el inconveniente, estaremos resolviendolo hoy a la tarde.

  • 2/3 Mañana podrá verse la tabla de scores definitiva la cual hemos enviado hoy mismo por mail.

  • 3/3 Ya se encuentra restablecida la tabla de scores.


El análisis del comportamiento de la lluvia presenta fundamental importancia tanto para la gestión del recurso hídrico como para la mitigación de desastres ocasionados por efecto de eventos extremos.

La producción agrícola tiene una gran importancia económica en la Región del Noroeste argentino (Jujuy, Salta, Catamarca, La Rioja, Santiago del Estero y Tucumán), donde se encuentran regímenes hídricos bien diferenciados por la variabilidad espacial. Así mismo, al encontrarse muchos de sus centros poblados en la zona del piedemonte, es necesario desarrollar acciones para su preservación frente a la ocurrencia de aluviones y crecientes repentinas. En un contexto de cambio climático es necesario contar con la mejor información para optimizar la planificación.

Desafortunadamente, las series de datos de lluvia disponibles en la región raramente poseen una longitud suficiente y, por lo general, no cubren todo el territorio de análisis, siendo frecuente encontrar las series más completas en las cercanías de los centros más poblados. Para salvar este hecho, se propone complementar los registros de observaciones con datos provenientes de reanálisis, los cuales combinan observaciones de distintas variables atmosféricas con modelos de predicción numérica, obteniéndose campos reticulados con cobertura global. Actualmente, existen numerosos reanálisis disponibles en línea, tales como ERA 20 C, NCEP-NCAR 1 y ERA INTERIM, con datos diarios cuya resolución espacial va de 0.7° x 0.7° a 2.5° x 2.5° (lat x lon), y diferente longitud de sus periodos de cobertura.

Los datos de las estaciones meteorológicas disponibles para análisis se encuentran en el dataset “Estaciones.xlsx” y las variables que podrían tener incidencia en la lluvia regional en el archivo “variables e indices NDEFM.xlsx”. Por su parte, los datos resultantes de reanálisis a emplear se encuentran en los datasets del archivo "datos NCEP NCAR.xlsx".

Objetivos:

  • Analizar la correspondencia entre los datos generados por modelos numéricos ("datos NCEP NCAR.xlsx") y los datos reales dados por las estaciones meteorológicas (“Estaciones.xlsx”). Es decir, ver si se comportan con cierta similitud.
  • Pronosticar el valor de la lluvia máxima para la estación de "San Luis Tucumán" para el período 2006-2015.

Ayuda: ¿cómo elegir el punto de grilla para comparar con una determinada estación?

Si estamos trabajando, por ejemplo, con la estación San Luis cuya lat = 26.06 y lon = 66.0, se debe seleccionar el punto de grilla más cercano a la estación. La latitud más cercana de la grilla es 25°, la longitud más cercana de la grilla es 65°, por lo tanto, se debe escoger el punto de grilla cuyo indicativo es "V13".

Premios:

  • $7000 en efectivo
  • Voucher Hotel Sol San Javier (para 2 personas por 2 noches)
  • Libro + Pen + Taza
  • Parlante bluetooth + Pen + Taza
  • Auriculares bluetooth + Pen + Taza

Descripción

Archivos “Estaciones.xlsx” y "datos NCEP NCAR.xlsx":

  • Precipitación Máxima Diaria Anual (PMDA). Pestaña del archivo “Maximo”. Número real positivo.
  • Precipitación Total Anual (PTA). Pestaña del archivo “Total”. Número real positivo.
  • Número de días con Precipitación mayor al percentil 95 (Np95). Pestaña del archivo “dias P95”. Número natural.

Archivo “variables e indices NDEFM.xlsx”:

  • Año.
  • Humedad específica (q) media en 850 hPa de NDEFM en el NOA. Rango 0 a 10 [g/kg].
  • Velocidad vertical en 500 hPa media de NDEFM en el NOA. Rango -0.2 a 0.2 [Pa/seg].
  • Presión a nivel del mar (SLP) media de NDEFM* en los anticiclones de los Océanos Atlántico y - Pacífico Sur. Rango 1010 a 1025 [hPa]. *NDEFM: periodo noviembre, diciembre, enero, febrero y marzo.
  • Índice anual de Oscilación del Sur (SOI). Rango -4 a 4.
  • Índice de Marshall anual del Modo Anular del Sur (SAM). Rango -6 a 6.

Evaluación

La evaluación consta de tres partes:

1- La métrica para la predicción es el MAE. Se debe submitir un archivo csv sin encabezado con el siguiente formato: la primer columna debe ser el id (integer) y la segunda columna debe tener la predicción (float). Es importante que los id comiencen desde cero y se asigne uno por cada año en el orden correspondiente. Puede descargar este ejemplo si tiene alguna duda y copiar el formato.

2- La nota la otorgará un jurado ad-hoc de especialistas en el tema evaluando el informe sobre el trabajo realizado con el análisis de contrastación entre los datos reales y los datos generados por los modelos numéricos.

3- Al final de la competencia se le pedirá a los primeros cinco competidores en el ranking de predicciones un informe adicional (puede adjuntarse con el punto 1), donde explique el modelo aplicado.

Finalmente el score total que determinará los ganadores se compondrá en un 70% por el score privado conseguido con la predicción y el 30% restante se sumará con los informes.

Importante: para el análisis se debe de tener en cuenta el cuadrante que le corresponde a cada estación con el reanálisis (latitud y longitud).

Soluciones tramposas serán detectadas y quedarán descalificadas.

Ante cualquier duda nos puede contactar al correo metadata@fundacionsadosky.org.ar

Escribinos