card-image

Predicción de éxitos en oportunidades comerciales

La empresa de consultoría AlixPartners nos propone nuevamente adentrarnos en un caso de negocio. El objetivo es ayudar a una empresa cliente que comercializa equipos de aire acondicionado para grandes superficies. ¿Será posible predecir qué oportunidades comerciales se van a concretar?


¡Quiero participar!

Leaderboard

Rank Usuario Intentos Puntaje Público
1 nicovaras22 110 0.07472
2 tzalan91 208 0.07640
3 unlam-fcdin 3 0.07661
4 dawoonchoi330 33 0.07738
5 ramirogalvez7f6d969919164f9f 38 0.07819
6 fabriborghini 92 0.07904
7 fran.dorr 128 0.07955
8 damianmarti 3 0.08522
9 elmecos 26 0.08552
10 aledebus 16 0.08577
11 luchitosoles99 202 0.08684
12 rios.mauro 26 0.08992
13 romina.paola.m 15 0.09025
14 ijmermet 34 0.09031
15 cnexans 58 0.09196
16 lbellomo 3 0.09361
17 mmmuraro 107 0.09589
18 eugenusb 91 0.09675
19 ivansadofschi 4 0.09789
20 santiagodonikian 29 0.10038
21 juan.s.aued 11 0.10195
22 JonathanLoscalzo 45 0.10243
23 damianealeman 50 0.10770
24 marsancoo 26 0.12585
25 baslaleandro 22 0.12911
26 santiher14 11 0.14882
27 dgraselli 83 0.14940
28 sdibuccio 8 0.15529
29 daleman 3 0.25512
30 leanahabedian 5 0.26487
31 martinehman90 40 0.47175
32 lucas.ramirez1616 43 0.47333
33 tomaskappa 8 0.49143
34 jarem.seba 13 0.49279
35 ErosPanuccio 19 0.49650
36 damiangrillo 79 0.51877
37 amiune 8 0.52823
38 nikolayevichmyshkin68 4 0.52999
39 lrvlr 38 0.55000
40 garrigo 12 0.55319
41 anadiedrichs 4 0.55352
42 federicobaiocco 107 0.55491
43 fmcurti 63 0.56898
44 f41420a451dd36c60e4fcf20574624 2 0.58231
45 leonel.anid 3 0.58304
46 giovannirescia89 22 0.59247
47 luciocuestameyer 4 0.63605
48 ariel.groisman 15 0.65308
49 matisyo 4 0.65838
50 sebamariof 9 0.71861
51 tkn-67 5 1.01932
52 fonseca.196 1 1.01932
53 javier.chatruc 3 1.01932
54 csarome 1 1.01932
55 mcnanton 1 1.01932
56 lewinalejandro 1 1.01932
57 miguelmsoler 1 1.01932
58 martimiliano 1 1.01932
59 jowisaidman 2 1.01932
60 marama70132786 1 1.01932
61 valeria.ayelen 1 1.01932
62 marianoramirez353 1 1.01932
63 pablomolteni5d17a621c7d04f5e 1 1.01932
64 angelbrisco 4 1.01932
65 sebastian_incicco 1 1.01932
66 ovejarenga 1 1.01932
67 efacundoarganab82195a238144a4b 1 1.01932
68 laracavic132 1 1.01932
69 alfonso 1 1.01932
70 pablowmartinez 1 1.01932
71 elsalatino 1 1.01932
72 celiayaninapacheco 1 1.01932
73 rafa1485 2 1.01932
74 gabrielaranda8023feb26cc8243b6 4 1.01932
75 jpadillamontani3168c65286e04435 2 1.01932
76 mab9913 1 1.01932
77 julianlopezba 17 1.03165
78 ngaggion 4 1.26690

premio-icon Premios

  1. 50.000 (ARS)
  2. 30.000 (ARS)
  3. 10.000 (ARS)
  4. 5.000 (ARS)
  5. 5.000 (ARS)

Lo premios serán otorgados a través de Gift Cards.

Fechas

La competencia ha finalizado el July 8, 2020

Introducción

Novedades:

  • Entrega de premios: el evento será el viernes 24/7 a las 19:00 hs. Para participar inscribirse en el siguiente formulario, también se transmitirá en vivo por la cuenta de Youtube de ECI.

  • Informes, fechas y formatos: ver sección evaluación.

  • Nos estamos aproximando al final queremos avisarles que sus modelos pueden contener una bomba de tiempo, ojo con hacer target leakage, ver sección evaluación.

Les presentamos a la empresa “Frío Frío”, dedicada a la venta e instalación de equipos de aire acondicionado para grandes superficies. Al ser una empresa B2B (“Business To Business”), es esencial para ellos optimizar los esfuerzos de los representantes comerciales, ayudándolos a priorizar las oportunidades en el pipeline.

Una “oportunidad” consiste en un proyecto de venta o instalación de equipos para un cliente. La venta se estructura alrededor de TRF (Toneladas de refrigeración) y puede estar compuesta por varios productos distintos. El "pipeline" hace referencia al flujo de oportunidades prospecto que la empresa está desarrollando. El equipo comercial asigna a distintos momentos, para cada oportunidad, un estado en la negociación. En la Ilustración se muestran los estados que las oportunidades tienen dentro del pipeline.

Pipeline

La variable que se está tratando de predecir es “Probabilidad de éxito” para cada oportunidad. ¿Cuál es la probabilidad de que la oportunidad se convierta en un caso Closed Won?
El dataset cuenta con información de cada oportunidad, como por ejemplo información sobre el vendedor a cargo de la venta, información geográfica de los clientes, TRS pedidas, fecha prevista de entrega de los equipos, etc. A partir de dichas variables es posible entrenar un modelo que prediga para un tiempo futuro el éxito o fracaso de cada oportunidad. Idealmente, “Frío Frío” podrá usar este modelo para predecir la probabilidad de éxito de cada oportunidad comercial, para mejorar el rendimiento y optimizar el esfuerzo de los vendedores.

El objetivo de esta competencia es, en base a los datos de oportunidades históricas, predecir el éxito de todas las oportunidade comerciales surgidas en los últimos cuatro meses.

Recuerden que para estar inscriptos en la competencia deben hacer por lo menos 1 submit, les recomendamos utilizar el archivo de prueba para ese fin.

Bueno, ya ¡dame la data!

Se entregan dos datasets:

El dataset de evaluación consiste en todas las oportunidades que fueron creadas en los últimos cuatro meses sobre los que se cuenta información.

Dataset prueba

  • Primer submit subiendo este archivo se registran en la competencia.

Descripción

Diccionario de variables

  • ID: id único del registro (Entero).
  • Región: región de la oportunidad (Categórica).
  • Territory: territorio comercial de la oportunidad (Categórica).
  • Pricing, Delivery_Terms_Quote_Approval: variable que denomina si la oportunidad necesita aprobación especial de su precio total y los términos de la entrega (Binaria).
  • Pricing, Delivery_Terms_Approved: variable que denomina si la oportunidad obtuvo aprobación especial de su precio total y los términos de la entrega (Binaria).
  • Bureaucratic_Code_0_Approval: variable que denomina si la oportunidad necesita el código burocrático 0 (Binaria).
  • Bureaucratic_Code_0_Approved: variable que denomina si la oportunidad obtuvo el código burocrático 0 (Binaria).
  • Submitted_for_Approval: variable que denomina si fue entregada la oportunidad para la aprobación (Binaria).
  • Bureaucratic_Code: códigos burocráticos que obtuvo la oportunidad (Categórica).
  • Account_Created_Date: fecha de creación de la cuenta del cliente (Datetime).
  • Source: fuente de creación de la oportunidad (Categórica).
  • Billing_Country: país donde se emite la factura (Categórica).
  • Account_Name: nombre de la cuenta del cliente (Categórica).
  • Opportunity_Name: nombre de la oportunidad (Categórica).
  • Opportunity_ID: id de la oportunidad (Entero).
  • Sales_Contract_No: número de contrato (Entero).
  • Account_Owner: vendedor del equipo comercial responsable de la cuenta cliente (Categórica).
  • Opportunity_Owner: vendedor del equipo comercial responsable de la oportunidad comercial (Categórica).
  • Account_Type: tipo de cuenta cliente (Categórica).
  • Opportunity_Type: tipo de oportunidad (Categórica).
  • Quote_Type: tipo de presupuesto (Categórica).
  • Delivery_Terms: términos de entrega (Categórica).
  • Opportunity_Created_Date: fecha de creación de la oportunidad comercial (Datetime).
  • Brand: marca del producto (Categórica).
  • Product_Type: tipo de producto (Categórica).
  • Size: tamaño del producto (Categórica).
  • Product_Category_B: categoría 'B' del producto (Categórica).
  • Price: precio (Decimal).
  • Currency: moneda (Categórica).
  • Last_Activity: fecha de la última actividad (Datetime).
  • Quote_Expiry_Date: fecha de vencimiento del presupuesto (Datetime).
  • Last_Modified_Date: fecha de ultima modificación en la oportunidad (Datetime).
  • Last_Modified_By: usuario responsable de la última modificación en la oportunidad (Categórica).
  • Product_Family: familia de producto (Categórica).
  • Product_Name: nombre del producto (Categórica).
  • ASP_Currency: moneda del precio promedio (Categórica).
  • ASP: (Average Selling Price) precio promedio a la venta (Decimal).
  • ASP_(converted)_Currency: moneda del precio promedio convertido en la variable (Categórica)
  • ASP_(converted): precio promedio a la venta convertido a otra moneda (Decimal).
  • Planned_Delivery_Start_Date: límite inferior del rango previsto para la fecha de entrega (Datetime).
  • Planned_Delivery_End_Date: límite superior del rango previsto para la fecha de entrega (Datetime).
  • Month: mes-año de Planned_Delivery_Start_Date (Fecha).
  • Delivery_Quarter: trimestre de Planned_Delivery_Start_Date (Categorica).
  • Delivery_Year: año de Planned_Delivery_Start_Date (Fecha).
  • Actual_Delivery_Date: fecha real de la entrega (Datetime).
  • Total_Power: potencia del producto (Entero).
  • Total_Amount_Currency: moneda del monto total (Decimal).
  • Total_Amount: monto total (Decimal).
  • Total_Taxable_Amount_Currency: moneda del monto gravado total (Categórica).
  • Total_Taxable_Amount: monto gravado total (Categórica).
  • Stage: variable target. Estado de la oportunidad (Categórica).
  • Prod_Category_A: categoría 'A' del producto (Categórica).
  • Total_Power_Discreet: categorización de la variable Total Power en bins (Categórica).

Evaluación

La calificación de la competencia se logra, en un 50%, con el resultado de las predicciones. La métrica elegida para el set de validación es la función de Logistic Loss (Log Loss).

En el tablero se puede ver la evaluación de la solución propuesta en una muestra del set de validación. Esta muestra puede variar durante la competencia. El total del conjunto de datos de validación se reserva hasta el final de la competencia.

El 50% restante se obtiene presentando un informe donde se deberá explicar qué tratamiento hicieron en los datos y una explicación sobre el modelo propuesto. La nota la otorga un jurado ad-hoc de especialistas en el tema evaluando el informe.

Una de las variables que se encuentra en los datasets de entrenamiento y test genera un problema conocido como target leakage, detectarla y explicar el motivo por el cual no debe utilizarse para predecir sumará muchos puntos en el informe. No detectarla puede llevar a penalizaciones severas.

Las predicciones se deben enviar en un archivo CSV sin encabezado conteniendo solamente la identificación de la oportunidad (Opportunity_ID) del dataset de valuación y la columna de predicciones (score). A continuación, se muestran tres filas de un archivo de predicciones típico:

Opportunity_ID, score

10689, 0.33

10690, 0.9853289

10691, 0.70956707

etc.

El jurado podrá requerir reproducir el puntaje correspondiente al último intento registrado en la competencia.


Informe

En esta competencia vamos a aceptar los informes de todos los participantes que deseen entregarlo, no hay límite por la posición en el ranking. No olviden que el informe tiene un peso enorme en el score final (50%).

El período para entregar el informe es del 8/7/2020 al 14/7/2020 (inclusive). Se debe enviar un mail a metadata@fundacionsadosky.org.ar que contenga:

  • Encabezado: competencia ALIX informe.
  • Un archivo adjunto con el informe. El nombre del archivo debe ser su nombre de usuario, por ejemplo "datosky.zip". En caso de necesitar mandar más de un archivo utilizar algún sistema de compresión.
  • En el cuerpo del mail pueden escribir lo que gusten, aunque si quieren expresar alguna cuestión relacionada al informe ponerlo en el informe.

Por favor les pedimos que respeten el formato

Guía

Pueden entregar el informe en el formato que gusten, sin embargo, les dejamos una guía que seguramente los ayudará a sumar más puntos:

De más deseable a menos deseable:

  1. Notebook (Jupyter).
  2. PDF.
  3. Presentación en diapositivas.

Contenido:

  • Detalle del análisis exploratorio realizado.
  • ¿Cuáles variables utilizaste? ¿Cuáles dejaste afuera?
  • ¿Qué modelo utilizaste? ¿Cómo ajustaste los parámetros del mismo?
  • ¿Qué aprendizajes te dejó?
  • ¿Qué valor agrega tu modelo al cliente?
  • ¿Qué le recomendarías al cliente si fueras un consultor trabajando para él?
  • Si hubieras tenido más tiempo, ¿Qué cosas mejorarías? ¿Qué idea te gustaría probar?

Escribinos