La minería de datos proporciona el vínculo entre los sistemas de transacción y de análisis independiente en el mundo de la tecnología de la información a gran escala. Los distintos tipos de software de data mining que pueden encontrarse en el mercado analizan las relaciones y patrones que se dan en las consultas abiertas de los usuarios.
Clusters: ayudan a detectar afinidades de consumo, el precursor de los segmentos de mercado de a cuerdo a relaciones lógicas de agrupación.
Asociaciones: interdependencias entre datos que sirvan para identificar una tendencia o ayuden a comprender un hábito.
Patrones secuenciales: revelan comportamientos encadenados o situaciones que se producen en cascada en un alto porcentaje de ocasiones.
Su aplicación al mundo de los negocios tiene infinitas posibilidades que, en cualquiera de sus vertientes, se sustentan en un mejor y más profundo conocimiento de los clientes, sus costumbres y sus motivaciones.
Créditos fotográficos: istock mindscanner
La minería de datos comprende cinco elementos principales:
1. Procesos ETL: extraer, transformar y cargar datos transaccionales en los sistemas de almacenamiento de datos.
2. Almacén de datos: recopilar y gestionar los datos en un sistema de base de datos multidimensional.
3. Acceso a los datos: proporcionar acceso a los datos a los analistas de negocio, profesionales de tecnología de información y usuarios autorizados.
4. Análisis de datos: analizar los datos de todas las aplicaciones.
5. Presentación: de los datos en un formato útil, como un gráfico o una tabla, que facilite una buena interpretación de su contenido.
El análisis es una parte sustancial de la minería de datos pero no se lleva a cabo siempre de la misma forma. De hecho, existen diferentes niveles de análisis disponibles entre los que destacan las visualizaciones de datos, que se basan en modelos gráficos; las redes neuronales artificiales, que aprenden a través de la formación; los árboles de decisión, que generan reglas para la clasificación de conjuntos de datos; o los algoritmos genéticos, que no son otra cosa que técnicas de optimización que utilizan procesos como combinación genética, mutación y la selección natural en un diseño basado en los conceptos de evolución natural.
Hoy en día, las aplicaciones de minería de datos están disponibles para todos los sistemas y bolsillos. Sin embargo, a la hora de bucear entre toda la oferta al alcance de cualquier organización, hay dos factores tecnológicos críticos a tener muy en cuenta:
Tamaño de la base de datos: cuantos más datos se necesite procesar y mayor volumen informacional sea preciso mantener, mayor potencia requerirá el sistema.
Complejidad de consultas: de la misma forma que sucedía con el tamaño, cuanto mayor sea el volumen de las consultas lanzadas y más elevado su nivel de complejidad, mayor potencia se requerirá.
Conocer ambas variables es el mejor punto de partida para una elección de éxito, en lo que a sistemas de minería de datos respecta. Por supuesto, estos factores no son los únicos a considerar ya que, por ejemplo, hablar de infraestructura tecnológica es imposible sin mencionar aspectos como la escalabilidad, que sería otra de las cualidades a buscar.
Post relacionados: