¿por qué data mining?

Cuando empresas y organizaciones empezaron a archivar digitalmente todo el caudal de información que generaban día a día, comenzó a generarse un valioso recurso que puede ser explotado para descubrir patrones estadísticos y modelos predictivos mucho más eficaces que sencillas reglas de negocios. La siguiente es una aplicación común y altamente rentable de la minería de datos: usar historial de campañas de venta y datos de clientes para segmentarlos según la probabilidad de aceptar un producto que se les ofrezca en futuras campañas.

Imagen a modo ilustrativo. Los modelos suelen trabajar con cientos de variables y reglas más complejas.

Con esta probabilidad a disposición, las próximas campañas de ventas podrán dirigir con más precisión sus esfuerzos, mejorando los resultados y disminuyendo sus costos. En aplicaciones reales, es común que nuestros modelos encuentran segmentos que contienen más de 30 veces más compradores que la media.

En el caso previamente mencionado, el algoritmo predictor es aplicado a una tabla que contiene una fila por cliente y una columna por variable, como por ejemplo edad, ingreso y productos. Finalmente, se cuenta con la respuesta al estímulo de ventas.

Las variables EDAD, INGRESO y CROSS_SELL se usarán para predecir la respuesta del cliente ante el estímulo de ventas.

Generalizando, esta tabla representa diferentes instancias, sus características individuales y el resultado de interés a predecir. Una vez que este concepto básico es entendido, se puede comprender que la minería de datos tiene aplicación a una enorme cantidad de campos y situaciones, como prevención de abandono, gestión de riesgo, detección de fraude, tratamiento médico, investigación científica, juegos, etc. ¿Recuerda a la NSA investigando a ciudadanos estadounidenses? Simplemente juntan información, la ordenan en una forma similar a esta e intentan predecir si es un terrorista o no. Suena simplista, pero en esencia así funciona.