La minería de datos es la herramienta que permite llevar a cabo predicciones que ayudan a guiar a la organización hacia sus metas, a través de una toma de decisiones revestida de precisión. Conocer el proceso de data mining facilita la tarea de escoger una buena solución de minería de datos, el primer paso hacia el progreso del negocio.
Créditos fotográficos: "Arrows Surrounding Red Question Shows Choice" by Stuart Miles
Qué hay que tener en cuenta a la hora de elegir un sistema de minería de datos
La selección de una otra herramienta de minería de datos habrá de hacerse previa evaluación de sus características. Entre las más importantes a tener en cuenta, destacan las siguientes:
1. Tipos de datos: no todos los datos son iguales y, en el mercado, no todas las herramientas están preparadas para ellos, por eso, hay que comprobar con qué formato exacto puede trabajar el sistema de minería de datos escogido. Entre los ejemplos más extendidos se encuentran el texto con formato, los datos basados en registros y los datos relacionales.
2. Compatibilidad entre sistemas: la herramienta de minería de datos deberá interactuar con los sistemas operativos existentes, por lo que habrá que tener esto en cuenta. En ocasiones, la compatibilidad se reduce a una opción, mientras que hay casos en que se extiende a varios sistemas. Por último, es necesario saber que también existen sistemas de minería de datos que proporcionan interfaces de usuario basadas en web y permiten el uso de datos XML como entrada.
3. Fuentes de datos: cuanto más versátiles sean las capacidades de minería de datos aplicables a la obtención de información de orígenes diversos más interesa. Si estas opciones están limitadas no se puede hacer frente a la heterogeneidad de fuentes, algo muy común en este tipo de procesos.
4. Funciones y metodologías: hay algunos sistemas de minería de datos que proporcionan una única función, como puede ser la clasificación, mientras que otros proporcionan múltiples funciones, tales como la descripción, análisis OLAP, descubrimiento, análisis estadístico, clasificación, predicción, agrupamiento o búsqueda de similitudes. No hace falta escoger el que más funciones tiene, sino el que tiene todas las funciones que se van a necesitar.
5. Acoplamiento con bases de datos o sistemas de almacenamiento de datos: los sistema de minería de datos deben complementarse con los sistemas de almacenamiento de datos o de base de datos. Los componentes acoplados se integran en un entorno de procesamiento de información uniforme. Este acoplamiento puede producirse de distintas formas, como las que se indican a continuación:
-
Sin acoplamiento.
-
Acoplamiento débil.
-
Acoplamiento semi - estanco.
-
Acoplamiento estanco.
6. Escalabilidad: esta cualidad puede evaluarse desde dos perspectivas diferentes:
-
Escalabilidad de fila (tamaño de base de datos): el sistema de minería de datos se considera escalable cuando el número de filas se amplía en una determinada proporción y el sistema no tarda más tiempo del estimado (incrementado proporcionalmente) en ejecutar la consulta.
-
Escalabilidad de columna (dimensión): el sistema de minería de datos se considera escalable si el tiempo de ejecución de consulta aumenta linealmente a la vez que lo hace el número de columnas.
7. Herramientas de visualización: la selección de la solución de minería de datos debe tener en cuenta la visibilidad que ofrecerá, que puede determinarse en función de los datos y los resultados o mostrar todo el proceso.
8. Interfaz gráfica de usuario: por último, hay que valorar la capacidad de interacción que la solución permite y la sencillez de su manejo.
Post relacionados: