La Minería de Datos es un campo de las Ciencias de la Computación que consiste en el proceso de descubrir patrones en grandes repositorios de datos (normalmente llamados “Data Warehouse” o “Almacén de Datos”) mediante el empleo de la Inteligencia Artificial, Aprendizaje de las Máquinas, Estadísticas y Sistemas de Base de Datos. El objetivo principal del proceso de minería de datos es extraer la información de un conjunto de datos y transformarlo en una estructura más fácil de interpretar, para usos futuros. Aparte del paso del análisis inicial de los datos, comprende aspectos concernientes a bases de datos y gestión de base de datos, pre-procesamiento de datos, consideraciones de modelaje e inferencia, métricas para medir, consideraciones de complejidad, post-procesamiento de las estructuras obtenidas, visualización y actualización en línea.
La expresión está mal empleada, porque el objetivo no es extraer los datos como tales sino los patrones y el conocimiento de una gran cantidad de datos. Se dice que el término se empleó sólo por razones de mercadeo.
El Almacén de Datos o “Data Warehouse” es un sistema usado para análisis y reportes de datos. Son repositorios centrales de data integrada de una o más fuentes, donde se almacenan datos actuales e históricos para crear reportes de tendencias para comparaciones y métricas, normalmente en el área de mercadeo y ventas.
En esta edición de la Revista “De Tecnología y Otras Cosas” se presentan las siguientes aplicaciones para llevar a cabo la Minería de Datos:
- Apara Dlife y dVelox
- IBM dB2 Warehouse Enterprise Edition
- Knime
- Microsoft SQL Server
- Microestrategy Data Mining Services
- Orange
- SAS Analytics y Enterprise
Un comentario en “Minería de Datos: Introducción”
Los comentarios están cerrados.