

Introducción
El siguiente trabajo presenta el análisis sobre los datos anonimizados de transacciones con tarjeta en la ciudad de Valencia del Grupo Cajamar durante los años 2015 y 2016. Esta página web/aplicación se dedica al reto IBM Card Analytics organizado por la competición online Cajamar UniversityHack 2017.
Como objetivo principal del estudio se quiere descubrir la información contenida de los datos. Hemos pensado en analizar desde un punto de vista global, cada localización comercial perteneciente a la provincia de Valencia para poder observar en detalle el comportamiento del consumidor. Para la fase general de conocimiento se describen los ángulos de análisis “Día vs Importe” y “Localización vs Importe”. El bloque “Análisis de Negocio” presenta el conocimiento sobre las zonas comerciales. Se ha elaborado este análisis utilizando los siguientes programas: R, Python, Watson por IBM y Tableau para enriquecer su diversidad. Además, como la parte de Tableau en la página web no se visualiza en versión de dispositivo móvil, ofrecemos una App para poder ver el análisis en móvil. Haz clic aquí para descargarla.

Importe por sector
Ángulos de Análisis
Día vs Importe
Desde el punto de vista del impacto del tiempo en el comportamiento de los consumidores de Cajamar, se analiza la suma del importe por cada sector estudiando su evolución durante 2015 y 2016.
Localización vs Importe
Durante esta parte de análisis se realiza especial hincapié en encontrar el principal perfil de usuario de Cajamar para cada sector, durante 2015 y 2016.
Análisis de Negocio
Se ofrece un Dashboard con 2 dimensiones: Cliente y Comercio mostrando más detalles para ayudar en tomar decisión.
Día vs Importe
Visión
En las diferentes temporadas del año los usuarios de Cajamar prefieren gastar dinero en distintos sectores. Se saca ésta conclusión teniendo en cuenta los cambios del comportamiento de los clientes que están muy pendientes de los períodos vacacionales o días festivos. Esta parte de análisis tiene como objetivo encontrar los hábitos de compra de los clientes Cajamar. A continuación, se presenta el análisis de cluster sobre los días de la semana, el análisis gráfico sobre el importe de cada franja horaria, el impacto de IPC y ETCL en los niveles de consumo durante los dos años de referencia y un análisis cluster sobre periodo.
Análisis Cluster : Periodo
Se tiene como objetivo clasificar los periodos de los niveles de consumo según las distintas percepciones de ciertos factores: gastos y número de transacciones por sector, humedad, temperatura y velocidad del viento diaria, días festivos o días en los cuales se juegan partidos de fútbol. El análisis de cluster de k-medias se ha llevado a cabo usando la distancia Euclidea (dado que todos los datos son cuantitativos) y estandarización de los datos. A continuación, se detalla este análisis.
Gráfico radar de cada cluster

El primer cluster presenta una posición superior, frente al resto de clústeres, en las dimensiones de Restauración, Tecnología, Ocio y Tiempo libre, y Hogar. El cluster dos presenta una clara ventaja en las dimensiones de Salud, Belleza y Otros. En las dimensiones Hipermercado, Alimentación, Moda y Complementos el tercer cluster tiene una posición superior.
Se observa que el cluster 1 pertenece a los días de domingo, a las dos últimas semanas de agosto, a los días de semana santa y los días festivos a nivel nacional. El cluster 2 hace referencia a los días laborales. El cluster 3 se refiere a los días de sábado, días cercanos a la Navidad y Reyes, durante el mes de julio y la primera semana de agosto.
Localización vs Importe
Visión
Este ángulo de análisis tiene como objetivo extraer información para ayudar a las compañías en la toma de decisiones para cada zona comercial. De los 25 códigos postales de los comercios es interesante conocer el centro comercial favorito de los clientes Cajamar, de dónde vienen sus clientes principales y en que consumen más. Por consiguiente, se muestra un análisis del importe por sector de cada código postal del comercio, con su respectiva distribución.
Sector y código postal comercial

Los códigos postales de los comercios con mayor importe total durante 2015 y 2016 son: 46015,46009,46014 y 46004. Estos centros se sitúan alrededor del casco histórico de la ciudad. En cuanto a las características principales de los comercios mencionado, se observa que el comercio con código postal 46015 tiene el mayor importe total y contiene casi todos los sectores (hay que tener en cuenta que está ubicado en una zona de gran variedad de distribución comercial). El sector de Hipermercados representa la mayor parte del importe total. Se dan las mismas características para los comercios con código postal 46014 y 46009. El comercio con código postal 46004 tiene el mayor porcentaje del importe proveniente del sector Moda y Complementos. Con el siguiente mapa se quieren dar a conocer más detalles sobre cada uno de ellos, con el fin de poder investigar cuándo, de dónde vienen los clientes Cajamar y cuáles son sus compras.
Análisis Cluster : Cliente
Se tiene como objetivo clasificar los códigos postales de los usuarios Cajamar por el nivel de consumo según las distintas percepciones de determinados atributos de la marca: gastos por sector, número de transacciones por sector. A partir del análisis Cluster se obtiene la mejor clasificación dividiendo las zonas en 3 niveles de consumo. Los tres clústeres representados corresponden a los códigos postales de clientes de las afueras de Valencia y alrededores de las zonas comerciales respectivamente. El análisis de cluster de k-medias se ha llevado a cabo usando la distancia Euclidea (dado que todos los datos son cuantitativos) y estandarización de los datos. A continuación, se detalla este análisis.
Para entender mejor dónde están los clusteres, se presenta en el siguiente mapa.
punto verde:cluster 1 punto rojo:cluster 2 punto azul:cluster 3
Densidad de Población
Según los datos del Instituto Nacional de Estadística la provincia de Valencia en el año 2016 tenía 2.544.264 habitantes. El mapa refleja la densidad de población por municipios de la provincia. La zona de color más oscuro corresponde a una alta densidad de población. Comparando con los resultados anteriores, se observa que las zonas más oscuras corresponden con la localización de los usuarios pertenecientes al tercer cluster. La mayoría de las zonas oscuras se sitúan en el centro de la provincia. También se observa que la distribución de las zonas oscuras y la distribución de los códigos postales de los comercios son similares. En conclusión, las empresas buscan abrir centros comerciales en las zonas con muchos clientes, es decir con alto potencial de consumo.
Video: Patrones de gasto en Valencia durante 2015 y 2016
Con el objetivo de dar una visualización más dinámica, presentamos el siguiente video poniendo un punto final para los dos análisis anteriores.
Análisis de Negocio
Visión
Con este ángulo de análisis se plantea el objetivo de extraer información para ayudar a las compañías en la toma de decisiones para cada una de las zonas comerciales. Se contemplan dos dimensiones de las cuales se presentan resultados: las actividades comerciales de cada localización comercial y de cada zona de clientes. También, se tiene en cuenta la densidad de población de la provincia de Valencia en los años de referencia.
Dashboard
Con el siguiente Dashboard se quieren dar a conocer más detalles sobre cada uno de ellos con el fin de poder investigar cuándo y de dónde vienen los clientes Cajamar y qué es los que compran. De esta manera se hace posible la consulta para cada local con la disposición de filtrar por cada sector y periodo temporal.
Es interesante conocer de la dimensión de Comercio su distribución de negocio, la diferencia de importe por cada sector entre 2015-2016, los periodos con más consumo, el origen de sus principales clientes y en qué consumen más. En la dimensión de Cliente se puede observar la estructura de consumo de los usuarios Cajamar, cuando consumen más o menos.
Conclusión y Recomendación
Mediante los análisis anteriores se llega a la conclusión de que el comportamiento de los consumidores Cajamar es predecible. El horario del día, los días laborables y festivos, la localización de centro comercial y la densidad de población son factores que influyen en el comportamiento de los consumidores. Con ayuda de esta información se pueden detectar patrones de gasto en la provincia valenciana. A partir del conjunto de datos se visualizan geográficamente dónde están los comercios y los clientes.
Este análisis es considerado útil para las empresas de la provincia de Valencia, sobre todo para los usuarios Cajamar. Por ejemplo, en el caso de los nuevos entrantes en el sector, estos pueden decidir con facilidad la ubicación adecuada para su comercio teniendo en cuenta la siguiente información: las zonas comerciales se sitúan en las zona con mayor densidad de población. Teniendo conocimiento sobre la competencia existente en el mercado, los nuevos entrantes necesitan encontrar un lugar con clientes con potencial de compra y con el menor número de competidores. En el caso de las empresas, ya existentes en el mercado, este estudio les ofrece la información para atraer nuevos clientes y presentar sus nuevos productos. Es decir, una vez ubicados los clientes con alto potencial de compra, las empresas pueden mejorar su fidelización de clientes proponiendo promociones en los lugares más frecuentados por su público objetivo. De esta manera los usuarios pueden conocer qué tipo de productos ofrece cada zona comercial y facilitar la decisión de compra del cliente.
Descargar App
Escanear QR código

Versión Android
Contenido de App




Sobre nosotras



Fan Yang
Universidad Carlos III de Madrid
Máster Universitario en Métodos Analíticos para Datos Masivos
Universidad de Finanzas y Economía de Xi'an
Grado en Ciencias de la Computación e Información
EMAIL: ogirr102@gmail.com
Jinghua Li
Universidad Carlos III de Madrid
Máster Universitario en Métodos Analíticos para Datos Masivos
Universidad Carlos III de Madrid
Grado en Estadística y Empresa
EMAIL: jinghuali0417@gmail.com