Detección de Transacciones Apócrifas

La competencia ha finalizado el 31 de Agosto de 2018.

Introducción

En Despegar, la agencia online de viajes más grande de Latinoamérica, se procesa una gran cantidad de transacciones todos los días. Algunas de éstas son apócrifas, otras no. El objetivo de la competencia es estudiar los datos, construir nuevas variables y un modelo de Aprendizaje Automático que permita detectar si una transacción es apócrifa o no a partir de un dataset aportado por Despegar.com

Premios

Primer puesto:

  • Un Voucher por un monto de $20000 por parte de Despegar.
  • Una GPU 1080Ti por parte de la Fundación Sadosky.

Segundo Puesto:

  • Un Voucher por un monto de $10000 por parte de Despegar.

Los vouchers son para adquirir productos comercializados en la página de Despegar.com y tienen vigencia de ser utilizados hasta el 31/12/2018.

Evaluación

Se debe enviar un archivo con las respuestas generadas por el modelo (ver más abajo el formato). Sobre el mismo se computarán dos puntajes, a partir del área debajo de la curva, teniendo en cuenta distintas filas elegidas al azar: uno público y otro privado. El público estará disponible inmediatamente y servirá de orientación a quienes participen.

El puntaje privado dará lugar al 80% de la puntuación final. Para el 20% restante se debe enviar un reporte en PDF describiendo el método utilizado. Un jurado asignará el resto del puntaje teniendo en cuenta originalidad, claridad expositiva y conceptual de la solución propuesta.

El formato para la respuesta deberá ser como en el archivo de ejemplo: dos columnas, la primera con cada uno de los números enteros correspondientes a las transactionId presetes en el archivo de evaluación y la segunda columna deberá indicar la probabilidad de que la transacción correspondiente sea fraudulenta.

13301482301,0.77
12375854401,0.36
13893441801,0.11
...
12360309601,0.16
12847456801,0.03
13368891501,0.12

Observar que el archivo no debe poseer encabezado.

Bueno, ya ¡dame la data!

Descripción

Para esta competencia se suministra descripción adicional de los datos, deben interpretarse tal y como fueron suministrados, lo que es parte del desafío.