Valuación de Inmuebles

La competencia ha finalizado el 31 de Agosto de 2018.

Introducción

El valor de una propiedad depende de muchos factores, la zona, el estado del inmueble, las dimensiones, la cantidad de habitaciones, cuánta humedad tiene la misma, lo ruidoso de los vecinos y la coyuntura económica del momento. Ojo, esta competencia no es solamente la reedición del ejemplo con el que todos aprendimos a hacer una regresión lineal, sino que la realidad es (un poco) más compleja que una función lineal. El mismo fue propuesto por el grupo de I+D de Navent en base a su experiencia con ZonaProp. Navent es una empresa que se dedica a que sus usuarios consigan empleos y hogares de la mejor manera posible y nuestro objetivo es generar herramientas para que los usuarios puedan conocer mejor el valor de sus propiedades.

Premios

Primer puesto

  • Una GiftCard por un monto de $20000 por parte de Navent
  • Una GPU 1080Ti por parte de la Fundación Sadosky.

Segundo Puesto

  • Una GiftCard por un monto de $10000 por parte de Navent.

Evaluación

Se debe enviar un archivo con las respuestas generadas por el modelo (ver más abajo el formato). Sobre el mismo se computarán dos puntajes, usando RMSLE, teniendo en cuenta distintas filas elegidas al azar: uno público y otro privado. El público estará disponible inmediatamente y servirá de orientación a quienes participen.

El puntaje privado dará lugar al 80% de la puntuación final. Para el 20% restante se debe enviar un reporte en PDF describiendo el método utilizado. Un jurado asignará el resto del puntaje teniendo en cuenta originalidad, claridad expositiva y conceptual de la solución propuesta.

En esta competencia solo estará permitido (pero no es obligatorio) el uso de datos externos de índole general (demográfico/económico) y de acceso público y libre. En particular, no está permitido el uso de datos de cualquier sitio de transacciones de inmuebles. En caso de dudas sobre una fuente de datos, consultar con el equipo de organización.

El formato para la respuesta deberá ser como en el archivo de ejemplo: 60000 filas organizadas en dos columnas. La primera con cada uno de los números enteros correspondientes a los identificadores presetes en el archivo de evaluación y la segunda columna deberá indicar el valor estimado para la propieda correspondiente.

4941,6657020.0
51775,1038531.9
115253,2581300.9
...
138313,1196769.98
271268,1576840.0
72612,3424900.0

Observar que el archivo no debe poseer encabezado.

  • Métrica utilizada

El puntaje se computará con la medida del error conocida como root mean squared logarithmic error. La misma se define, para Y el vector de respuestas correctas e Ŷ vector de estimaciones, por la siguiente fórmula:

RMSLE

Bueno, ya ¡dame la data!

Descripción

El dataset consta de propiedades en venta en México entre los años 2012 y 2016, valuadas en pesos mexicanos. El archivo train.csv tiene 240K filas y 22 columnas, el archivo test.csv tiene 60K filas y 21 columnas. El equipo de Navent preparó un tutorial, en formato de jupyter notebook.

  • id: Un id numérico para identificar la propiedad
  • titulo: El título de la propiedad publicada
  • descripcion: La descripción de la propiedad publicada
  • direccion: La dirección de la propiedad
  • ciudad: La ciudad de la propiedad
  • provincia: La provincia donde está localizada la propiedad
  • lat: Latitud
  • lng: Longitud
  • tipodepropiedad: El tipo de propiedad (Casa, departamento, etc)
  • metrostotales: Metros totales de la propiedad
  • metroscubiertos: Metros cubiertos de la propiedad
  • antiguedad: Antigüedad de la propiedad
  • habitaciones: Cantidad de habitaciones
  • garages: Cantidad de garages
  • banos: Cantidad de baños
  • fecha: Fecha de publicación
  • gimnasio: Si el edificio o la propiedad tiene un gimnasio
  • usosmultiples: Si el edificio o la propiedad tiene un SUM
  • piscina: Si el edificio o la propiedad tiene un piscina
  • escuelascercanas: Si la propiedad tiene escuelas cerca
  • centroscomercialescercanos: Si la propiedad tiene centros comerciales cerca
  • precio: Valor de publicación de la propiedad en pesos mexicanos