Data Mining o Minería de Datos
Consiste en la búsqueda de correlaciones entre los datos que se investiga, tal que dichas correlaciones sean suficientemente significativas para que constituyan patrones que permitan explicar diversos comportamientos. Esta labor aplicada a los datos de los clientes permite predecir con anticipación entre otras cosas:
- Los que se irán si no realizan acciones para retenerlos. - Los que tienen buen potencial de crecimiento. - Los que tienen riesgo de insolvencia.
- Los que podrían ser fraude.
- Los que tienen mejor potencial de recepción ante determinada campaña de marketing.
Además permite caracterizarlos de tal manera que se desarrollen estrategias comerciales especializadas en sus particulares preferencias o necesidades.
Aplicado a su stock de mercancías permitiría predecir:
- Cuales son los productos que tienen riesgo de quiebre de stock.
- Los productos que probablemente no se venderá salvo acciones especiales.
En suma la Minería de Datos permite hoy en día establecer una diferencia competitiva importante en relación a la competencia en todas las áreas que se decida incorporar, mejorando el margen, sus volúmenes de venta, la fidelidad de clientes, la rotación de inventarios, reduciendo sus riegos por incobrables etc.
Como se hace Data Mining:
Se requiere para ello de sofisticados software los que con la ayuda de un especialista, realizan un proceso compuesto de diversas fases con distintos tipos de análisis matemáticos adaptados especialmente para los particulares datos de que se dispone, hasta que gradualmente permiten identificar tales patrones.
¿Puede nuestra empresa comprar un software de Data Mining y hacer el trabajo solos?
Se puede perfectamente pero la recuperación de su inversión depende de que halla utilizado la herramienta correcta, sepa como normalizar sus datos, sepa elegir los modelos matemáticos más convenientes y sepa utilizarlos correctamente. La mayoría de las empresas inician el uso de estas herramientas con el apoyo de especialistas, en algunos casos tienen personal interno con la formación básica necesaria como para que posteriormente se capaciten y continúen su propio proceso y en muchos otros casos esta labor la encargan en forma permanente a consultores externos especializados.
Que requisitos deben cumplir los datos de una empresa para aplicar exitosamente Data Mining sobre sus clientes:
Básicamente los datos deben ser de buena calidad en cuanto a que reflejen la realidad de manera veraz, se disponga de una cantidad de atributos mínimas de los clientes (Ej ; edad, sexo, ocupación, etc ) para establecer correlaciones valiosas, los vínculos entre los datos estén libres de errores e inconsistencias y exista una cantidad de datos suficientes.
Siempre puedo establecer patrones valiosos utilizando Data Mining:
Si estos son de buena calidad y abundantes Ud., puede confiar en que probablemente obtendrá modelos valiosos.
¿Como se sabe si los datos de las ventas son suficientes para predecir el comportamiento de los clientes ?
El alcance de los modelos depende del nivel de profundidad de la información que se disponga, es decir, a mayor cantidad de tipos de atributos y registros que describan a los clientes existirán mayores probabilidades de encontrar un modelo útil. Si no tiene ningún dato de los clientes no es razonable que espere establecer un análisis diferenciado por tipo de cliente.
Sin embargo , en el caso de cifras pobres para caracterizar a los clientes se pueden establecer algunas relaciones globales muy útiles en una 1º fase como por ejemplo los productos que probablemente se agotarán y sobre cuales existe riesgo de quedar con stock al fin de la temporada.
Alguien puede garantizar la utilidad del uso de Data Mining en la empresa:
La calidad de los modelos que se puedan desarrollar con el uso de Data Mining depende principalmente de la calidad, diversidad y abundancia de sus datos, de una buena herramienta para identificar los modelos buscados y de la calidad y experiencia de los expertos que buscan tales patrones en sus datos. Un experto con experiencia podría anticipar el nivel de utilidad, pero difícilmente podría garantizarlo.
Los mismos datos sirven para todo lo que deseo saber:
Muchos datos son comunes a diversos modelos, pero dependiendo de lo que se busca se requerirá de diversas combinaciones de ellos para los diversos modelos. Es probable que para algunos aspectos que Ud. desea saber no disponga de una riqueza de información suficiente para obtener modelos útiles en una primera fase hasta que logré construir la base mínima necesaria luego de un tiempo de recolectarlos.
Por qué se llama Data Mining o Minería de datos:
El proceso Data Mining o Minería de Datos se llama de esa forma por que la labor que se realiza es similar a una labor de prospección minera en cuanto a que el mineral buscado es equivalente a los patrones de datos, estos minerales se esconden debajo de una superficie terrestre que los oculta, similar al enorme manto de datos cuyas relaciones no son comprensibles para un ser humano, que solo se puede hacer visible luego de diversas exploraciones con diversa herramientas (herramientas de Data Mining), realizadas por especialistas (geólogos en minería como expertos en Data Mining en Minería de Datos) cuyas evidencias del mineral (modelos de datos) a veces afloran a la superficie como cuando los expertos en el negocio lo intuyen y finalmente no se sabe la calidad del mineral (calidad del modelo) hasta que se realiza una prospección o investigación.
Sin embargo existe una enorme diferencia entre el Data Mining y la prospección de minerales y que es que si Ud. se lo propone, en caso que a través de un primera investigación se apreciare que falta suficiente información, luego de un tiempo razonable Ud. podría revertir totalmente esa situación enriqueciendo la calidad de su fuente de datos que es una de las principales claves para obtener buenos modelos de comportamiento.
Los modelos que se crean con data Mining se pueden entender por un ser humano sin formación matemática:
Los modelos matemáticos son internamente en general muy complejos sin embargo en varios de ellos se generan expresiones visibles muy fáciles de comprender para un ser humano normal como por ejemplo los árboles de decisión Ej: Si el cliente es mujer, tiene entre 18 y 40 y vive en Provincia entonces aceptará la oferta con 75% de probabilidad. ( es decir 8 de cada 10 aceptarán la oferta).
Existen otros modelos muy exitosos como por ejemplo en los que participan redes neuronales que actúan como cajas negras es decir luego que se logran construir y afinar, no son comprensible para ningún tipo de ser humano sin embargo son capaces de predecir lo que sucederá e incluso aprenden de la experiencia y autoajustan el modelo de manera automática de tal manera de aprender con los cambios que suceden en el tiempo en la realidad sin que requiera participación humana para dicho proceso de aprendizaje.
|