Minería de Datos
Profesor Jonatan Gómez Perdomo
Objetivo
La creciente capacidad de almacenamiento (y computo) de los computadores le ha permitido a todo tipo de entidad (comercial, científica y/o académica), el almacenar grandes volúmenes de información “aparentemente” útil. Sin embargo, no toda esta información resulta realmente útil. En algunos casos, alguna de la información almacenada puede ser errónea, incompleta o conducer a conclusiones equivocadas. En general, la información útil se encuentra inmersa y oculta en esos grandes volúmenes de información.
El encontrar dicha información útil y convertirla en conocimiento no es una tarea fácil. Tradicionalmente, los analistas de datos cumplían esta labor. En la actualidad, el proceso de extracción de información útil requiere la aplicación de técnicas de análisis de datos automáticas que sean capaces de procesar grandes volúmenes de información. La minería de datos es el proceso de aplicar metodologías basadas en computadores, conceptos estadísticos y administración para extraer conocimiento útil de grandes volúmenes de información.
El objetivo del curso es introducir a los estudiantes en el campo de la minería de datos haciendo énfasis particular en la aplicación de técnicas computacionales. Al terminar el curso el estudiante debe estar en capacidad de determinar cuando y como aplicar el proceso de minería de datos. Esto implica determinar que técnicas de minería usar en un caso particular y ejecutar de manera apropiada dicho proceso.
Metodología
El curso sera dirigido en clases magistrales en las que el profesor presentará los temas relevantes de minería de datos. El curso dispondra de sesiones prácticas en las salas de computo. En dichas prácticas el estudiante podra apreciar el funcionamiento de algunas técnicas de minería de datos. Adicionalmente, el estudiante debera desarrollar algunos programas de computador, en los cuales se implementen algunas de las técnicas presentadas en las clases magistrales. Por lo tanto, es importante que el estudiante se encuentre en capacidad de desarrollar programas de computador de un nivel de complejidad moderado.
- [T&S&K] Pang-Ning Tan, Michael Steinbach y Vipin Kumar, "Introduction to Data Mining". Addison Wesley. 2005
- [H&K] Jiawei Han y Micheline Kamber, "Data Mining: Concepts and Techniques". Morgan Kaufmann Publishers.
- [K] Mehmed Kantardzic, "Data Mining: Concepts, Models, Methods, and Algorithms", John Wiley – IEEE Inter-science Publishers.
- Presentaciones del curso
- Sitio Web del libro guía [T&S&K]
- Sitio Web del libro [H&K]
- Sitio Web de la herramienta de minería Weka
- Sitio Web de la herramienta de inteligencia de negocios y minería Rapid I (Rapid Miner)
- Por definir
- Por definir
- Por definir

