top of page
Introducion

University Hack 2017 Cajamar

 

Reto IBM Card Analytics

Introducción 

  El siguiente trabajo presenta el análisis sobre los datos anonimizados de transacciones con tarjeta en la ciudad de Valencia del Grupo Cajamar durante los años 2015 y 2016. Esta página web/aplicación se dedica al reto IBM Card Analytics organizado por la competición online Cajamar UniversityHack 2017.  

  Como objetivo principal del estudio se quiere descubrir la información contenida de los datos. Hemos pensado en analizar desde un punto de vista global, cada localización comercial perteneciente a la provincia de Valencia para poder observar en detalle el comportamiento del consumidor. Para la fase general de conocimiento se describen los ángulos de análisis “Día vs Importe” y “Localización vs Importe”. El bloque “Análisis de Negocio” presenta el conocimiento sobre las zonas comerciales. Se ha elaborado este análisis utilizando los siguientes programas: R, Python, Watson por IBM y Tableau para enriquecer su diversidad. Además, como la parte de Tableau en la página web no se visualiza en versión de dispositivo móvil, ofrecemos una App para poder ver el análisis en móvil. Haz clic aquí para descargarla.

to Services

Importe por sector

 Ángulos de Análisis   

Día vs Importe

  Desde el punto de vista del impacto del tiempo en el comportamiento de los consumidores de Cajamar, se analiza la suma del importe por cada sector estudiando su evolución durante 2015 y 2016. 

Localización vs Importe

 Durante esta parte de análisis se realiza especial hincapié en encontrar el principal perfil de usuario de Cajamar para cada sector, durante 2015 y 2016.

Análisis de Negocio

 

 Se ofrece un Dashboard con 2 dimensiones: Cliente y Comercio mostrando más detalles para ayudar en tomar decisión.  

to Día vs Importe

   Día vs Importe    

Visión 

   En las diferentes temporadas del año los usuarios de Cajamar prefieren gastar dinero en distintos sectores. Se saca ésta conclusión teniendo en cuenta los cambios del comportamiento de los clientes que están muy pendientes de los períodos vacacionales o días festivos. Esta parte de análisis tiene como objetivo encontrar los hábitos de compra de los clientes Cajamar. A continuación, se presenta el análisis de cluster sobre los días de la semana, el análisis gráfico sobre el importe de cada franja horaria, el impacto de IPC y ETCL en los niveles de consumo durante los dos años de referencia y un análisis  cluster sobre periodo.

1/5  Evolución del importe de cada sector durante 2015 y 2016

    Este gráfico muestra la evolución del importe de cada sector durante el año 2015 y 2016. Se observa que los clientes de Cajamar gastaron más en el sector de Alimentación y el sector de Moda y Complementos. En particular, durante las Navidades el consumo general aumenta, sobre todo el importe de Alimentación, Moda y Complementos e Hipermercado alcanza el pico más alto del año en éste período. Al contrario, en agosto el importe de todos los sectores sufre un decrecimiento fuerte. Tal vez esto puede pasar por la salida de los usuarios de Cajamar a otros destinos turísticos no valencianos. Además, con los motivos de los dos periodos de rebajas, enero y julio, el importe de Moda y Complementos mantiene una tendencia al alza. Los sectores más consumidos tienen una fuerte volatilidad. En cambio, el importe de los sectores como Hogar, Belleza, Tecnología y Auto es muy estable.

Análisis Cluster : Periodo 

   Se tiene como objetivo clasificar los periodos de los niveles de consumo según las distintas percepciones de ciertos factores: gastos y número de transacciones por sector, humedad, temperatura y velocidad del viento diaria, días festivos o días en los cuales se juegan partidos de fútbol. El análisis de cluster de k-medias se ha llevado a cabo usando la distancia Euclidea (dado que todos los datos son cuantitativos) y estandarización de los datos. A continuación, se detalla este análisis.

 Gráfico radar de cada cluster

   El primer cluster presenta una posición superior, frente al resto de clústeres, en las dimensiones de Restauración, Tecnología, Ocio y Tiempo libre, y Hogar. El cluster dos presenta una clara ventaja en las dimensiones de Salud, Belleza y Otros. En las dimensiones Hipermercado, Alimentación, Moda y Complementos el tercer cluster tiene una posición superior.

  Se observa que el cluster 1 pertenece a los días de domingo, a las dos últimas semanas de agosto, a los días de semana santa y los días festivos a nivel nacional. El cluster 2 hace referencia a los días laborales. El cluster 3 se refiere a los días de sábado, días cercanos a la Navidad y Reyes, durante el mes de julio y la primera semana de agosto.

localizacion

Localización vs Importe

Visión 

  Este ángulo de análisis tiene como objetivo extraer información para ayudar a las compañías en la toma de decisiones para cada zona comercial. De los 25 códigos postales de los comercios es interesante conocer el centro comercial favorito de los clientes Cajamar, de dónde vienen sus clientes principales y en que consumen más. Por consiguiente, se muestra un análisis del importe por sector de cada código postal del comercio, con su respectiva distribución.

Sector y código postal comercial 

   Los códigos postales de los comercios con mayor importe total durante 2015 y 2016 son: 46015,46009,46014 y 46004. Estos centros se sitúan alrededor del casco histórico de la ciudad. En cuanto a las características principales de los comercios mencionado, se observa que el comercio con código postal 46015 tiene el mayor importe total y contiene casi todos los sectores (hay que tener en cuenta que está ubicado en una zona de gran variedad de distribución comercial). El sector de Hipermercados representa la mayor parte del importe total. Se dan las mismas características para los comercios con código postal 46014 y 46009. El comercio con código postal 46004 tiene el mayor porcentaje del importe proveniente del sector Moda y Complementos. Con el siguiente mapa se quieren dar a conocer más detalles sobre cada uno de ellos, con el fin de poder investigar cuándo, de dónde vienen los clientes Cajamar y cuáles son sus compras.

Análisis Cluster : Cliente

   Se tiene como objetivo clasificar los códigos postales de los usuarios Cajamar por el nivel de consumo según las distintas percepciones de determinados atributos de la marca: gastos por sector, número de transacciones por sector. A partir del análisis Cluster se obtiene la mejor clasificación dividiendo las zonas en 3 niveles de consumo. Los tres clústeres representados corresponden a los códigos postales de clientes de las afueras de Valencia y alrededores de las zonas comerciales respectivamente. El análisis de cluster de k-medias se ha llevado a cabo usando la distancia Euclidea (dado que todos los datos son cuantitativos) y estandarización de los datos. A continuación, se detalla este análisis.

Para entender mejor dónde están los clusteres, se presenta en el siguiente mapa.

punto verde:cluster 1      punto rojo:cluster 2         punto azul:cluster 3

Densidad de Población

   Según los datos del Instituto Nacional de Estadística la provincia de Valencia en el año 2016 tenía 2.544.264 habitantes. El mapa refleja la densidad de población por municipios de la provincia. La zona de color más oscuro corresponde a una alta densidad de población. Comparando con los resultados anteriores, se observa que las zonas más oscuras corresponden con la localización de los usuarios pertenecientes al tercer cluster. La mayoría de las zonas oscuras se sitúan en el centro de la provincia. También se observa que la distribución de las zonas oscuras y la distribución de los códigos postales de los comercios son similares. En conclusión, las empresas buscan abrir centros comerciales en las zonas con muchos clientes, es decir con alto potencial de consumo.

Video: Patrones de gasto en Valencia durante 2015 y 2016

Con el objetivo de dar una visualización más dinámica, presentamos el siguiente video   poniendo un punto final para los dos análisis anteriores.
Analisis de negocio

Análisis de Negocio

Visión 

   Con este ángulo de análisis se plantea el objetivo de extraer información para ayudar a las compañías en la toma de decisiones para cada una de las zonas comerciales. Se contemplan dos dimensiones de las cuales se presentan resultados: las actividades comerciales de cada localización comercial y de cada zona de clientes. También, se tiene en cuenta la densidad de población de la provincia de Valencia en los años de referencia.

Dashboard

  Con el siguiente Dashboard se quieren dar a conocer más detalles sobre cada uno de ellos con el fin de poder investigar cuándo y de dónde vienen los clientes Cajamar y qué es los que compran. De esta manera se hace posible la consulta para cada local con la disposición de filtrar por cada sector y periodo temporal.
  Es interesante conocer de la dimensión de Comercio su distribución de negocio, la diferencia de importe por cada sector entre 2015-2016, los periodos con más consumo, el origen de sus principales clientes y en qué consumen más. En la dimensión de Cliente se puede observar la estructura de consumo de los usuarios Cajamar, cuando consumen más o menos.

conclusion

Conclusión y Recomendación

  Mediante los análisis anteriores se llega a la conclusión de que el comportamiento de los consumidores Cajamar es predecible. El horario del día, los días laborables y festivos, la localización de centro comercial y la densidad de población son factores que influyen en el comportamiento de los consumidores. Con ayuda de esta información se pueden detectar patrones de gasto en la provincia valenciana. A partir del conjunto de datos se visualizan geográficamente dónde están los comercios y los clientes.  

 

  Este análisis es considerado útil para  las empresas de la provincia de Valencia, sobre todo para los usuarios Cajamar. Por ejemplo, en el caso de los nuevos entrantes en el sector, estos pueden decidir con facilidad la ubicación adecuada para su comercio teniendo en cuenta la siguiente información: las zonas comerciales se sitúan en las zona con mayor densidad de población. Teniendo conocimiento sobre la competencia existente en el mercado, los nuevos entrantes necesitan encontrar un lugar con clientes con potencial de compra y con el menor número de competidores. En el caso de las empresas, ya existentes en el mercado, este estudio les ofrece la información para atraer nuevos clientes y presentar sus nuevos productos. Es decir, una vez ubicados los clientes con alto potencial de compra, las empresas pueden mejorar su fidelización de clientes proponiendo promociones en los lugares más frecuentados por su público objetivo. De esta manera los usuarios pueden conocer qué tipo de productos ofrece cada zona comercial y facilitar la decisión de compra del cliente.

app

Descargar App

Escanear QR código

Versión Android
Contenido de App
Acerca de nosotras

Sobre nosotras

 Fan Yang

Universidad Carlos III de Madrid

Máster Universitario en Métodos Analíticos para Datos Masivos

Universidad de Finanzas y Economía de Xi'an

Grado en Ciencias de la Computación e Información

EMAIL: ogirr102@gmail.com 

Jinghua Li

Universidad Carlos III de Madrid

Máster Universitario en Métodos Analíticos para Datos Masivos

Universidad Carlos III de Madrid

Grado en Estadística y Empresa

EMAIL: jinghuali0417@gmail.com

bottom of page