Práctica: Aprendizaje No Supervisado

Diplomado en Inteligencia de Negocios

Universidad Nacional de Colombia


  1. Abre Weka y cargue el conjunto IRIS
  2. Use el algoritmo coweb para agrupar los datos
    1. Ignore el atributo de clase
    2. Use la clase para evaluar el clustering
    3. Describa el clustering obtenido y su desempeño
    4. Visualice los resultados del agrupamiento y analice el resultado
  3. Use el algoritmo k-means para agrupar los datos
    1. Use 3 clases (k=3)
    2. Describa el clustering obtenido y su desempeño
    3. Visualice los resultados del agrupamiento y analice el resultado
    4. Agrupe usando diferentes valores de k=1,2,3,4,5
    5. Tome nota de el SSE  para cada k y grafíquelo
    6. Cuál es el mejor valor de k?
  4. Descargue el archivo credit-simple.arff y cárguelo en Weka.
  5. Use el algoritmo k-means para agrupar los datos:
    1. Ignore el atributo de clase
    2. Use la clase para evaluar el clustering
    3. Use 2 clases (k=2)
    4. Describa el clustering obtenido y su desempeño
    5. Agrupe usando diferentes valores de k=1,2,3,4,5
    6. Tome nota de el SSE  para cada k y grafíquelo
    7. Cuál es el mejor valor de k?
    8. Describa el clustering obtenido para este k y su desempeño
    9. Convierta los datos nominales a variables binarias y normalice
    10. Repita el clustering, mejoran los resultados?