Proyectando el comportamiento de la soja

La competencia ha finalizado el 29 de Septiembre de 2019.

Introducción

Envio de Resultados:

Para ser evaluado debe enviar sus proyecciones en un archivo adjunto por mail a metadata@fundacionsadosky.org.ar. El archivo con los resultados finales debe tener el formato que se detalla en la sección evaluación.

Incluir en el encabezado del mail "Competencia Soja: nombre_de_usuario". Esos mismos archivos serán utilizados para calcular los scores finales. Su nombre de usuario se encuentra en la tabla de scores.

Importante: recuerden que para que la solución sea válida deben estar registrados en la competencia. El domingo 29/09 es el último día para envíar sus resultados.


Novedades

Última actualización del dataset oficial a partir de ahora proyectamos hacia el futuro sin red de seguridad.

Premios adicionales!! además de los ya mencionados, Amazon Web Services apoyará a los participantes con créditos para que puedan desarrollarse. A los ganadores se les dará un voucher valuado en 5K dólares para utilizar en servicios de AWS. Esto como parte del Programa Activate directamente dedicado a ayudarlos.

Disponible: el video del tercer webinar.

Tercer webinar: jueves 26/09 de 15 a 16hs. Santiago Rossi quien nos va a mostrar cómo se puede usar el data set provisto por la Bolsa de Cereales de Buenos Aires. Para participar utilizar el siguiente link.

  • Disponible la presentación del segundo webinar sobre series de tiempo y deep learning. Para descargarlo utilize el link.

  • Dataset Oficial: nueva actualización!

  • Nuevos datasets accesorios: se encuentran disponibles datasets con variables meteorológicas.

  • Se encuentra disponible online el video del segundo webinar organizado por los patrocinadores sobre modelos deep learning en time series. Disponible en el link.

  • Se encuentra disponible online el video del webinar del jueves 12/09 en el siguiente link


Descripción

Buscamos aquellas personas que no se asusten fácilmente con la volatilidad y la incertidumbre de los mercados financieros. Es en este contexto, en el cual proponemos un concurso para desarrollar algoritmos que proyecten el comportamiento de la Soja.

El mercado de futuros por excelencia, Matba Rofex, en conjunto con la Bolsa de Comercio de Rosario y la Bolsa de Cereales de Buenos Aires, unen fuerzas para vincular al ecosistema de los científicos de datos con especialistas financieros, es de esta unión que creemos saldrán los mejores trabajos.

Lanzamos este desafío a la comunidad "metadatera" con ánimos de conseguir la mejor aproximación a los retornos diarios del contrato de la Soja basada en múltiples datasets.

Si llegaste hasta acá y pensás que no tenés futuro en esta competencia porque no sabés nada de finanzas; no desesperes. Primero, dejanos tentarte con los premios, esta competencia no se priva de nada, ¡hasta tendremos una caja misteriosa! Segundo, llegamos con la ayuda, toda la info necesaria para entender el fascinante mundo de las finanzas será provista por nuestros patrocinadores que son unos expertos en el tema (manual).

Premios:
Modo de inscripción

Para inscribirte deberás subir un archivo con respuestas. No es necesario que sean tus respuestas finales, sino que podes subir un archivo demo que armamos con este fin para que puedas probar! Al inscribirte estarás recibiendo información sobre diversos eventos y capacitaciones que estaremos organizando.

Patrocinadores:

  • Matba Rofex
  • Bolsa de Cereales de Buenos Aires
  • Bolsa de Comercio de Rosario

Evaluación

Objetivos

  1. Lograr el mejor fit para la serie de retornos simples diarios (p1-p0)/p0. Serie desde la Fecha de Cierre del Concurso (FCC) + 10 días hábiles.
  2. Lograr la mejor proyección para el último valor de la serie contínua de la soja al fin del concurso. Cierra a la FCC + 10 días hábiles.
  3. Lograr el mejor fit para la serie de retornos simples diarios de 4 semanas. Desde FCC - 10 días hábiles, hasta FCC + 10 días hábiles.

Cronograma

Métrica

La calificación de la solución propuesta se hace con el error absoluto medio (MAE por su sigla en inglés) y se calcula como el promedio de las diferencias (en valor absoluto) entre las respuestas enviadas y las correctas:

Formato de respuesta

Debe enviarse un archivo en formato csv sin encabezado con 4 columnas y 20 filas.

  • Primer columna debe contener al número de fila (int).
  • Segunda columna debe contener las fechas correspondientes en formato "dd/mm/YYYY."
  • Tercer columna debe contener los retornos (float).
  • Cuarta columna debe contener el precio (cierre del día) del contrato (float).

Las filas 1 a 10 corresponden a FCC - 10 días hábiles y las filas 11 a 20 corresponden a la proyección futura.

Fechas Importantes

  • 2/9/2019 | Comienzo de la competencia.
  • 27/9/2019 | Última actualización del dataset oficial.
  • 29/9/2019 | Último día para enviar los resultados e inscribirse. Corresponde a la Fecha de Cierre del Concurso (FCC).
  • 30/9/2019 | Comienza período de evaluación.

Aclaración: a los diez primeros se les pedirá un informe que explique el modelo en el cual basaron la proyección que será definitorio en caso de un empate.

Bueno, ya ¡dame la data!

Dataset oficial

Dataset; la información que contiene este archivo es hasta el día 27/9/2019. El score de la página sigue habiliado, pero no muestra un resultado que deba ser tomado en cuenta. A partir de este momento todas las proyecciones son al futuro que nadie conoce.

Además del dataset oficial brindado por Metadata, se podrá utilizar cualquier dataset que sea de acceso público para realizar lo modelos. En instancias de revisión, se podrá solicitar a los participantes los dataset utilizados, junto con la explicación y presentación del modelo realizado.

Datasets complementarios

Dataset Bolsa de Cereales de Buenos Aires, link, el dataset contiene resultados de las encuestas de uso de tecnología para cada campaña relevada por el Relevamiento de Tecnología Agrícola Aplicada (Retaa), y las series de estimaciones agrícolas para el total nacional y cada una de las regiones. En este último archivo encontrarán datos de área, producción y rendimiento desde la campaña 2000/01.

Datasets accesorios

Datasets accesorios (variables meteorológicas)

  • INTA.
  • ATMO-FCEN. Banco de datos del Departamento de Ciencias de la Atmósfera y los Oceanos, FCEN-UBA.
  • METEOZAM.

Contacto

Inquietudes, dudas, consultas o comentarios no duden en escribirnos un mail a metadata@fundacionsadosky.org.ar

Descripción

  • Fecha. Fecha de referencia para el precio.
  • Open. Precio de apertura del día.
  • High. Precio máximo del día.
  • Low. Precio mínimo del día.
  • Last. Precio último operado del día.
  • Cierre. Precio de ajuste del día. Ésta es la serie a proyectarse.
  • Aj.Dif. Diferencia nominal respecto del día anterior.
  • Mon. Moneda de denominación del contrato.
  • Oi.Vol. Interés abierto del contrato.
  • Oi.Dif. Diferencia del interés abierto respecto del día anterior.
  • Vol.Ope. Volumen Operado medido en contratos.
  • Unidad. Unidad en que se miden los contratos.
  • DolarB.N. Precio del dólar del Banco de la Nación Argentina.
  • DolarItau. Precio del dólar del Banco Itaú.
  • Diff.Sem. Diferencia Semanal.