¿Llevo paraguas? Pronosticando la lluvia

La competencia ha finalizado el 2 de Marzo de 2020.

Introducción

Novedades

  • 21/2 Nos complace anunciar que el Ente de Turismo de la Provincia de Tucumán se suma a los premios y nos ofrece un Voucher de alojamiento en el hotel Sol San Javier para 2 personas por 2 noches. Sol San Javier es un hotel 4 estrellas ubicado en la cima de cerro San Javier, rodeado de la imponente yunga tucumana y con vista excepcional de la ciudad de San Miguel de Tucumán.

  • 2/3 Estamos muy agradecidos con todos por haber participado de la competencia. Les estaremos comunicando por mail los resultados. En caso de haber quedado entre los cinco primeros tienen tiempo hasta las 23:59 del martes 3/3 para enviar el informe. Enviarlo a metadata@fundacionsadosky.org.ar con asunto "competencia llevo paraguas".

  • 2/3 Error en la tabla de scores. Hubo un reseteo de la tabla. Pedimos disculpas por el inconveniente, estaremos resolviendolo hoy a la tarde.

  • 2/3 Mañana podrá verse la tabla de scores definitiva la cual hemos enviado hoy mismo por mail.

  • 3/3 Ya se encuentra restablecida la tabla de scores.


El análisis del comportamiento de la lluvia presenta fundamental importancia tanto para la gestión del recurso hídrico como para la mitigación de desastres ocasionados por efecto de eventos extremos.

La producción agrícola tiene una gran importancia económica en la Región del Noroeste argentino (Jujuy, Salta, Catamarca, La Rioja, Santiago del Estero y Tucumán), donde se encuentran regímenes hídricos bien diferenciados por la variabilidad espacial. Así mismo, al encontrarse muchos de sus centros poblados en la zona del piedemonte, es necesario desarrollar acciones para su preservación frente a la ocurrencia de aluviones y crecientes repentinas. En un contexto de cambio climático es necesario contar con la mejor información para optimizar la planificación.

Desafortunadamente, las series de datos de lluvia disponibles en la región raramente poseen una longitud suficiente y, por lo general, no cubren todo el territorio de análisis, siendo frecuente encontrar las series más completas en las cercanías de los centros más poblados. Para salvar este hecho, se propone complementar los registros de observaciones con datos provenientes de reanálisis, los cuales combinan observaciones de distintas variables atmosféricas con modelos de predicción numérica, obteniéndose campos reticulados con cobertura global. Actualmente, existen numerosos reanálisis disponibles en línea, tales como ERA 20 C, NCEP-NCAR 1 y ERA INTERIM, con datos diarios cuya resolución espacial va de 0.7° x 0.7° a 2.5° x 2.5° (lat x lon), y diferente longitud de sus periodos de cobertura.

Los datos de las estaciones meteorológicas disponibles para análisis se encuentran en el dataset “Estaciones.xlsx” y las variables que podrían tener incidencia en la lluvia regional en el archivo “variables e indices NDEFM.xlsx”. Por su parte, los datos resultantes de reanálisis a emplear se encuentran en los datasets del archivo "datos NCEP NCAR.xlsx".

Objetivos:

  • Analizar la correspondencia entre los datos generados por modelos numéricos ("datos NCEP NCAR.xlsx") y los datos reales dados por las estaciones meteorológicas (“Estaciones.xlsx”). Es decir, ver si se comportan con cierta similitud.
  • Pronosticar el valor de la lluvia máxima para la estación de "San Luis Tucumán" para el período 2006-2015.

Ayuda: ¿cómo elegir el punto de grilla para comparar con una determinada estación?

Si estamos trabajando, por ejemplo, con la estación San Luis cuya lat = 26.06 y lon = 66.0, se debe seleccionar el punto de grilla más cercano a la estación. La latitud más cercana de la grilla es 25°, la longitud más cercana de la grilla es 65°, por lo tanto, se debe escoger el punto de grilla cuyo indicativo es "V13".

Premios:

  • $7000 en efectivo
  • Voucher Hotel Sol San Javier (para 2 personas por 2 noches)
  • Libro + Pen + Taza
  • Parlante bluetooth + Pen + Taza
  • Auriculares bluetooth + Pen + Taza

Evaluación

La evaluación consta de tres partes:

1- La métrica para la predicción es el MAE. Se debe submitir un archivo csv sin encabezado con el siguiente formato: la primer columna debe ser el id (integer) y la segunda columna debe tener la predicción (float). Es importante que los id comiencen desde cero y se asigne uno por cada año en el orden correspondiente. Puede descargar este ejemplo si tiene alguna duda y copiar el formato.

2- La nota la otorgará un jurado ad-hoc de especialistas en el tema evaluando el informe sobre el trabajo realizado con el análisis de contrastación entre los datos reales y los datos generados por los modelos numéricos.

3- Al final de la competencia se le pedirá a los primeros cinco competidores en el ranking de predicciones un informe adicional (puede adjuntarse con el punto 1), donde explique el modelo aplicado.

Finalmente el score total que determinará los ganadores se compondrá en un 70% por el score privado conseguido con la predicción y el 30% restante se sumará con los informes.

Importante: para el análisis se debe de tener en cuenta el cuadrante que le corresponde a cada estación con el reanálisis (latitud y longitud).

Soluciones tramposas serán detectadas y quedarán descalificadas.

Ante cualquier duda nos puede contactar al correo metadata@fundacionsadosky.org.ar

Descripción

Archivos “Estaciones.xlsx” y "datos NCEP NCAR.xlsx":

  • Precipitación Máxima Diaria Anual (PMDA). Pestaña del archivo “Maximo”. Número real positivo.
  • Precipitación Total Anual (PTA). Pestaña del archivo “Total”. Número real positivo.
  • Número de días con Precipitación mayor al percentil 95 (Np95). Pestaña del archivo “dias P95”. Número natural.

Archivo “variables e indices NDEFM.xlsx”:

  • Año.
  • Humedad específica (q) media en 850 hPa de NDEFM en el NOA. Rango 0 a 10 [g/kg].
  • Velocidad vertical en 500 hPa media de NDEFM en el NOA. Rango -0.2 a 0.2 [Pa/seg].
  • Presión a nivel del mar (SLP) media de NDEFM* en los anticiclones de los Océanos Atlántico y - Pacífico Sur. Rango 1010 a 1025 [hPa]. *NDEFM: periodo noviembre, diciembre, enero, febrero y marzo.
  • Índice anual de Oscilación del Sur (SOI). Rango -4 a 4.
  • Índice de Marshall anual del Modo Anular del Sur (SAM). Rango -6 a 6.