Data Mining (minería de datos) es el proceso de extracción de información significativa de grandes bases de datos, información que revela inteligencia del negocio, a través de factores ocultos, tendencias y correlaciones para permitir al usuario realizar predicciones que resuelven problemas del negocio proporcionando una ventaja competitiva. Las herramientas de Data Mining predicen las nuevas perspectivas y pronostican la situación futura de la empresa, esto ayuda a los mismos a tomar decisiones de negocios proactivamente.
La minería de datos, Data Mining, es un proceso de descubrimiento de nuevas y significativas relaciones, patrones y tendencias al examinar grandes cantidades de datos. La disponibilidad de grandes volúmenes de información y el uso generalizado de herramientas informáticas ha transformado el análisis de datos orientándolo hacia determinadas técnicas especializadas englobadas bajo el nombre de minería de datos o Data Mining. Las técnicas de minería de datos persiguen el descubrimiento automático del conocimiento contenido en la información almacenada de modo ordenado en grandes bases de datos. Estas técnicas tienen como objetivo descubrir patrones, perfiles y tendencias a través del análisis de los datos utilizando tecnologías de reconocimiento de patrones, redes neuronales, lógica difusa, algoritmos genéticos y otras técnicas avanzadas de análisis de datos. (Pérez, p.1)
SAS Institute define el concepto de Data Mining como el proceso de Seleccionar (Selecting), Explorar (Exploring), Modificar (Modifying), Modelizar (Modeling) y Valorar (Assessment) grandes cantidades de datos con el objetivo de descubrir patrones desconocidos que puedan ser utilizados como ventaja comparativa respecto a los competidores. Este proceso es resumido con las siglas SEMMA. La siguiente figura ilustra las fases del proceso de minería de datos según SAS Institute. (Pérez, p.7)
La minería de datos está incluida en un proceso mayor denominado Descubrimiento de Conocimientos en Base de Datos, Knowledge Discovery in Database (KDD). Rigurosamente el Data Mining se restringe a la obtención de modelos, restando las etapas anteriores y el propio Data Mining como instancias del KDD. La siguiente figura presenta el esquema para la generación de conocimiento en bases de datos KDD (Vieira, p.15)
En el siguiente video se presenta qué es y para qué les sirve a los empresarios la minería de datos.
Bibliografía
- Pérez López, César. Minería de datos: técnicas y herramientas, Editorial Paraninfo, 2007.
- Vieira Braga, Luis Paulo y Otros. Introducción a la Minería de Datos, Editora E-papers, 2009.