Minería de Datos: Introducción
La Minería de Datos es un campo de las Ciencias de la Computación que consiste en el proceso de descubrir patrones en grandes repositorios de datos (normalmente llamados “Data Warehouse” o “Almacén de Datos”) mediante el empleo de la Inteligencia Artificial, Aprendizaje de las Máquinas, Estadísticas y Sistemas de Base de Datos. El objetivo principal del proceso de minería de datos es extraer la información de un conjunto de datos y transformarlo en una estructura más fácil de interpretar, para usos futuros. Aparte del paso del análisis inicial de los datos, comprende aspectos concernientes a bases de datos y gestión de base de datos, pre-procesamiento de datos, consideraciones de modelaje e inferencia, métricas para medir, consideraciones de complejidad, post-procesamiento de las estructuras obtenidas, visualización y actualización en línea.
La expresión está mal empleada, porque el objetivo no es extraer los datos como tales sino los patrones y el conocimiento de una gran cantidad de datos. Se dice que el término se empleó sólo por razones de mercadeo.
El Almacén de Datos o “Data Warehouse” es un sistema usado para análisis y reportes de datos. Son repositorios centrales de data integrada de una o más fuentes, donde se almacenan datos actuales e históricos para crear reportes de tendencias para comparaciones y métricas, normalmente en el área de mercadeo y ventas.
En esta edición de la Revista “De Tecnología y Otras Cosas” se presentan las siguientes aplicaciones para llevar a cabo la Minería de Datos:
- Apara Dlife y dVelox
- IBM dB2 Warehouse Enterprise Edition
- Knime
- Microsoft SQL Server
- Microestrategy Data Mining Services
- Orange
- SAS Analytics y Enterprise
Referencias
Publicado el 02/05/2015 en Año 02, Mineria de Datos y etiquetado en año 02, introduccion, luis castellanos, mineria de datos. Guarda el enlace permanente. 1 comentario.
Pingback: Año 02 Número 08: Minería de Datos | DTyOC