Tratamiento Inteligente de Datos
(Curso Académico 2023 - 2024)
Mostrar Todo


Nota informativa: Atendiendo a la normativa de Protección de Datos y propiedad intelectual en la que se limita la publicación de imágenes de terceras personas sin su consentimiento, aquellos que difundan grabaciones de las sesiones de clase sin previo consentimiento de las personas implicadas, serán responsables ante la ley del uso prohibido de las citadas grabaciones.



1. Datos descriptivos de la asignatura
  • Código: 139263125
  • Centro: Escuela Superior de Ingeniería y Tecnología
  • Lugar de impartición: Escuela Superior de Ingeniería y Tecnología
  • Titulación: Grado en Ingeniería Informática
  • Plan de Estudios: 2010 (publicado en 21-03-2011)
  • Rama de conocimiento: Ingeniería y Arquitectura
  • Itinerario/Intensificación: Computación
  • Departamento/s:
  • Área/s de conocimiento:
    • Ciencia de la Computación e Inteligencia Artificial
    • Ingeniería Telemática
    • Lenguajes y Sistemas Informáticos
  • Curso: 3
  • Carácter: Obligatoria
  • Duración: Segundo cuatrimestre
  • Créditos ECTS: 6,0
  • Modalidad de impartición: Presencial
  • Horario: Ver horario
  • Dirección web de la asignatura: Ver web de la asignatura
  • Idioma: Español e Inglés
2. Requisitos de matrícula y calificación
No existen requisitos para cursar la asignatura
3. Profesorado que imparte la asignatura

Profesor/a Coordinador/a: JOSE MARCOS MORENO VEGA

General:
Nombre:
JOSE MARCOS
Apellido:
MORENO VEGA
Departamento:
Ingeniería Informática y de Sistemas
Área de conocimiento:
Ciencia de la Computación e Inteligencia Artificial
Grupo:
Grupos completo, PA y PE
Contacto:
Teléfono 1:
922318175
Teléfono 2:
Correo electrónico:
jmmoreno@ull.es
Correo alternativo:
Tutorías primer cuatrimestre:
DesdeHastaDíaHora incialHora finalLocalizaciónPlantaDespacho
Todo el cuatrimestre Martes 08:00 10:00 Escuela Superior de Ingeniería y Tecnología - Módulo A - AN.4A ESIT 3 P3.019
Todo el cuatrimestre Jueves 08:00 12:00 Escuela Superior de Ingeniería y Tecnología - Módulo A - AN.4A ESIT 3 P3.019
Observaciones:
Tutorías segundo cuatrimestre:
DesdeHastaDíaHora incialHora finalLocalizaciónPlantaDespacho
Todo el cuatrimestre Martes 09:00 11:00 Escuela Superior de Ingeniería y Tecnología - Módulo A - AN.4A ESIT 3 P3.019
Todo el cuatrimestre Viernes 08:00 12:00 Escuela Superior de Ingeniería y Tecnología - Módulo A - AN.4A ESIT 3 P3.019
Observaciones:
General:
Nombre:
PATRICIO
Apellido:
GARCIA BAEZ
Departamento:
Ingeniería Informática y de Sistemas
Área de conocimiento:
Ciencia de la Computación e Inteligencia Artificial
Grupo:
Grupos completos, PA y PE
Contacto:
Teléfono 1:
922845038
Teléfono 2:
Correo electrónico:
pgarcia@ull.es
Correo alternativo:
Tutorías primer cuatrimestre:
DesdeHastaDíaHora incialHora finalLocalizaciónPlantaDespacho
Todo el cuatrimestre Lunes 12:30 13:30 Escuela Superior de Ingeniería y Tecnología - Módulo C - AN.4A ESIT 2 P2.102
Todo el cuatrimestre Martes 12:30 13:30 Escuela Superior de Ingeniería y Tecnología - Módulo C - AN.4A ESIT 2 P2.102
Todo el cuatrimestre Jueves 09:30 12:00 Escuela Superior de Ingeniería y Tecnología - Módulo C - AN.4A ESIT 2 P2.102
Todo el cuatrimestre Viernes 10:30 12:00 Escuela Superior de Ingeniería y Tecnología - Módulo C - AN.4A ESIT 2 P2.102
Observaciones: Consultar actualizaciones y modificaciones puntuales de este horario en perfil del profesor del Campus Virtual. Se ruega solicitar cita previa
Tutorías segundo cuatrimestre:
DesdeHastaDíaHora incialHora finalLocalizaciónPlantaDespacho
Todo el cuatrimestre Lunes 09:30 10:30 Escuela Superior de Ingeniería y Tecnología - Módulo C - AN.4A ESIT 2 P2.102
Todo el cuatrimestre Lunes 11:30 13:30 Escuela Superior de Ingeniería y Tecnología - Módulo C - AN.4A ESIT 2 P2.102
Todo el cuatrimestre Lunes 14:30 16:30 Escuela Superior de Ingeniería y Tecnología - Módulo C - AN.4A ESIT 2 P2.102
Todo el cuatrimestre Viernes 09:30 10:30 Escuela Superior de Ingeniería y Tecnología - Módulo C - AN.4A ESIT 2 P2.102
Observaciones: Consultar actualizaciones y modificaciones puntuales de este horario en perfil del profesor del Campus Virtual. Se ruega solicitar cita previa
4. Contextualización de la asignatura en el plan de estudio
  • Bloque formativo al que pertenece la asignatura: Itinerario 1: Computación
  • Perfil profesional: Ingeniero Técnico en Informática
5. Competencias

Tecnología Específica / Itinerario: Computación

  • C45 - Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.

Competencias Generales

  • CG4 - Capacidad para definir, evaluar y seleccionar plataformas hardware y software para el desarrollo y la ejecución de sistemas, servicios y aplicaciones informáticas, de acuerdo con los conocimientos adquiridos según lo establecido en el apartado 5 de este anexo.
  • CG6 - Capacidad para concebir y desarrollar sistemas o arquitecturas informáticas centralizadas o distribuidas integrando hardware, software y redes de acuerdo con los conocimientos adquiridos según lo establecido en el apartado 5 de este anexo.
  • CG9 - Capacidad para resolver problemas con iniciativa, toma de decisiones, autonomía y creatividad. Capacidad para saber comunicar y transmitir los conocimientos, habilidades y destrezas de la profesión de Ingeniero Técnico en Informática.

Transversales

  • T7 - Capacidad de comunicación efectiva (en expresión y comprensión) oral y escrita, con especial énfasis en la redacción de documentación técnica.
  • T10 - Capacidad de integrarse rápidamente y trabajar eficientemente en equipos unidisciplinares y de colaborar en un entorno multidisciplinar.
  • T21 - Capacidad para el razonamiento crítico, lógico y matemático.
  • T23 - Capacidad de abstracción: capacidad de crear y utilizar modelos que reflejen situaciones reales.
6. Contenidos de la asignatura

Contenidos teóricos y prácticos de la asignatura

Módulo: INTRODUCCIÓN
              (Profesorado: J. Marcos Moreno Vega, Patricio García Báez  (teoría y práctica))

- Tema 1. El proceso de extracción de conocimiento en grandes volúmenes de datos
. Tema 2. Recuperación de información en documentos electrónicos

Módulo: CLASIFICACIÓN, REGRESIÓN Y AGRUPAMIENTO
              (Profesorado: J. Marcos Moreno Vega (teoría y práctica))

- Tema 3. Árboles de decisión y regresión
- Tema 4. Clasificadores bayesianos
- Tema 5. Agrupamiento basado en prototipos
- Tema 6. Agrupamiento basado en densidad
- Tema 7. Agrupamiento jerárquico
- Tema 8. Detección de anomalías

Módulo: PREPROCESADO DE DATOS
              (Profesorado: J. Marcos Moreno Vega (teoría y práctica))

- Tema 9. Preparación de datos
- Tema 10: Reducción de la dimensionalidad

Módulo: CLASIFICACIÓN Y AGRUPAMIENTO MEDIANTE REDES NEURONALES
              (Profesorado: Patricio García Báez  (teoría y práctica))

- Tema 11. Clasificadores neuronales
- Tema 12. Agrupamiento mediante redes neuronales


Módulo: MINERÍA DE PATRONES DE ASOCIACIÓN
              (Profesorado: J. Marcos Moreno Vega (teoría y práctica))

- Tema 13. Reglas de asociación

Actividades a desarrollar en otro idioma

El software utilizado en la prácticas de laboratorio está documentado en inglés. También lo están los manuales y tutoriales que usarán los alumnos para el desarrollo de las prácticas asociadas a esta asignatura. Además, gran parte del material bibliográfico y de trabajo de la asignatura está escrito en este idioma. Se refuerza con ello la comprensión lectora de este idioma por parte de los alumnos.

Por otro lado, la memoria del proyecto (que se describe en el apartado Metodología y volumen del trabajo del estudiante) incluirá un breve resumen en inglés y los alumnos expondrán oralmente las conclusiones de su trabajo en este idioma. La evaluación de estas actividades se incluyen en la evaluación del proyecto, según lo descrito en el apartado Sistema de evaluación y calificación.
7. Metodología y volumen de trabajo del estudiante

Descripción


Los contenidos de la asignatura serán explicados por los profesores en las horas semanales presenciales de teoría. Durante las clases prácticas, se explicará la herramienta de tratamiento de datos usada como apoyo a los contenidos teóricos. Esta herramienta será usada por los alumnos para realizar las actividades prácticas que así lo requieran.
Para fomentar la comprensión del proceso de extracción de conocimiento y de las técnicas asociadas, se usará la metodología de enseñanza aprendizaje basada en proyectos, junto con la realización de pruebas prácticas. 

Proyecto de datos.-
  • Con la realización del proyecto se persigue favorecer el aprendizaje efectivo, potenciar el trabajo autónomo, reforzar la motivación e implicación y favorecer la actitud reflexiva y crítica de los alumnos.
  • Se formarán grupos de alumnos que tendrán que recopilar, preparar y tratar datos con el propósito de extraer conocimiento útil de los mismos. Además, deberán interpretar los resultados obtenidos y proponer estrategias para difundir y usar el conocimiento extraído. Se procurará que los datos a analizar sean de interés para el alumnado. Así, se usarán datos sobre hábitos de compra, perfiles de usuarios de algún servicio o relativos a variables económicas o medioambientales.
  • El trabajo realizado se recogerá en una memoria del proyecto que deberá ser presentada oralmente en las fechas de examen fijadas por  la Escuela Superior de Ingeniería y Tecnología. El resumen del proyecto y las conclusiones derivadas del mismo se redactarán en inglés.
  • La memoria escrita y la exposición se usarán como base para la evaluación continua.
Pruebas prácticas.-
  • Con estas actividades se pretende que el alumnado profundice en los fundamentos teóricos del análisis de datos y en su uso para afrontar supuestos prácticos reales.
  • Se contempla la realización de pruebas prácticas que tratarán sobre clasificación, agrupamiento y regresión con técnicas clásicas y mediante redes neuronales.

Actividades formativas en créditos ECTS, su metodología de enseñanza-aprendizaje y su relación con las competencias que debe adquirir el estudiante

Actividades formativas Horas presenciales Horas de trabajo autónomo Total horas Relación con competencias
Clases teóricas 16,00 0,00 16,0 [T23], [C45]
Clases prácticas (aula / sala de demostraciones / prácticas laboratorio) 14,00 0,00 14,0 [T23], [T21], [C45]
Realización de seminarios u otras actividades complementarias 8,00 10,00 18,0 [T21], [T10], [T7]
Realización de trabajos (individual/grupal) 7,00 40,00 47,0 [T23], [T21], [T10], [T7], [CG9], [CG6], [CG4], [C45]
Estudio/preparación de clases teóricas 0,00 10,00 10,0 [T23], [T21], [C45]
Realización de exámenes 3,00 0,00 3,0 [T7], [CG9], [CG6], [CG4]
Asistencia a tutorías 7,00 0,00 7,0 [C45]
Estudio autónomo individual o en grupo 0,00 30,00 30,0 [T23], [T21], [T10], [CG9], [CG6], [CG4]
Exposición oral por parte del alumno 5,00 0,00 5,0 [T10], [T7]
Total horas
Total ECTS
8. Bibliografía / Recursos

Bibliografía básica

José Hernández Orallo, M.José Ramírez Quintana, Cesar Ferri Ramírez. Introducción a la Minería de Datos Editorial Pearson, 2004.
Ethem Alpaydin, Introduction to Machine Learning, The MIT Press, 2004
Ian H. Witten, Eibe Frank, Mark A. Hall, Data Mining, Morgan Kaufmann, 2011
P. N. Tan, M. Steinbach, V. Kumar. Introduction to Data Mining, Addison-Wesley, 2006
C. C. Data Mining. The Textbook. Springer, 2015
S. García, J. Luengo, F. Herrera. Data preprocessing in Data Mining. Springer. 2015

Bibliografía complementaria

Tom Mitchell, Machine Learning, McGraw Hill, 1997
Trevor Hastie, Robert Tibshirani, Jerome Friedman. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer, 2009

Otros recursos

9. Sistema de evaluación y calificación

Descripción

La evaluación de la asignatura se rige por el Reglamento de Evaluación y Calificación de la Universidad de La Laguna, aprobado el 21 de junio de 2022, modificado por acuerdos del Consejo de Gobierno de 13 de julio de 2022, 8 de noviembre de 2022 y 31 de mayo de 2023, además de por lo establecido en la Memoria de Verificación inicial del título o posteriores modificaciones.

Atendiendo a lo establecido en los Estatutos de la Universidad de La Laguna, la modalidad de evaluación continua será obligatoria en la primera convocatoria de la asignatura para todo el alumnado (excepto para quienes se acojan a la evaluación única según se dispone en el artículo 5.5 del Reglamento de Evaluación y Calificación de la Universidad de La Laguna). 

Podrán acogerse a la modalidad de evaluación única, en la primera convocatoria, quiénes lo comuniquen, a través del procedimiento habilitado en el aula virtual de la asignatura, antes de haberse presentado a las actividades cuya ponderación compute el 40% de la evaluación continua.

Una convocatoria se entenderá agotada cuando el/la alumno/a se presente, al menos, a las actividades cuya ponderación compute el 60% de la evaluación continua.

El alumnado que no haya superado la asignatura en la primera convocatoria, o el que se haya acogido a la modalidad de evaluación única, deberá examinarse de todas las actividades obligatorias de la evaluación continua que no haya superado en dicha convocatoria. 

El alumnado que se encuentre en la quinta o posteriores convocatorias y desee ser evaluado por un Tribunal, deberá presentar una solicitud a través del procedimiento habilitado en la sede electrónica, dirigida a la Dirección de la Escuela Superior de Ingeniería y Tecnología. Dicha solicitud deberá realizarse con una antelación mínima de diez días hábiles al comienzo del periodo de exámenes.

Evaluación continua.-
La evaluación continua tiene en cuenta las siguientes actividades relacionadas con las pruebas descritas en el apartado "Metodología y volumen de trabajo":
  • Proyecto de datos
  • Pruebas prácticas.
 El proyecto tiene un peso del  50%en la nota final ( 20% corresponde al informe y 30% al trabajo y su defensa), correspondiendo el 50% restante a cinco pruebas prácticas. Estas pruebas se ponderarán como sigue:
  • Práctica 1: Recuperación de información de la Web: 2%
  • Práctica 2: Clasificación/regresión con técnicas clásicas: 16,7%
  • Práctica 3: Agrupamiento con técnicas clásicas: 16,7%
  • Práctica 4: Clasificadores neuronales: 7,3%
  • Práctica 5: Agrupamiento mediante redes neuronales: 7,3%
Todas las actividades de la evaluación continua tienen carácter obligatorio.
En el apartado Cronograma/calendario de la asignatura se recogen las fechas estimadas de presentación de las pruebas prácticas. Los resultados de las mismas serán comunicados a los alumnos aproximadamente 15 días después de su presentación. La defensa del proyecto se llevará a cabo en la fecha de examen establecida por la Escuela Superior de Ingeniería y Tecnología dentro del calendario académico anual.

Evaluación única.-
Consistirá en la entrega y defensa oral del proyecto y la entrega de las pruebas prácticas descritas en el apartado "Metodología y volumen de trabajo" en las fechas establecidas para ello por la Universidad de La Laguna y la Escuela Superior de Ingeniería y Tecnología.

Si el alumnado así lo manifiesta, se trasladará la calificación de las actividades obligatorias que haya superado en la evaluación continua a la evaluación única. En ningún caso, existe la posibilidad de presentarse a una actividad obligatoria ya aprobada para subir nota.

Tal como se ha indicado anteriormente, el software utilizado en las prácticas de laboratorio, así como los manuales y tutoriales que usarán los alumnos para el desarrollo de las mismas, están documentados en inglés. Se evaluará la comprensión de los mismos en la calificación de prácticas.

En la tabla siguiente se muestra la ponderación de las diferentes actividades de la evaluación continua.

Estrategia Evaluativa

Tipo de prueba Competencias Criterios Ponderación
Valoración de las actividades prácticas en el laboratorio [T23], [T21], [T10], [T7], [CG9], [CG6], [CG4], [C45]
  • Grado de conocimiento adquirido en el manejo de las herramientas para el tratamiento inteligente de datos.
  • Rigor en el análisis de los datos y coherencia de las conclusiones.
50,00 %
Elaboración de informes [CG4], [CG6], [T7], [T10], [T21], [T23], [CG9], [C45]
  • Memoria/s: estructura calidad y claridad de la redacción, fuentes consultadas, rigor en el análisis de los datos y coherencia de las conclusiones.
  • Defensa oral: estructura de la exposición, lengiuaje empleado y respuesta a las preguntas.
20,00 %
Realización de trabajos y su defensa y/o exposición [CG4], [CG6], [T7], [T21], [T23], [CG9], [C45]
  • Adecuación de las respuestas dadas a los ejercicios y claridad de redacción de las mismas.
30,00 %
10. Resultados de Aprendizaje
Diseñar, implementar y evaluar técnicas de aprendizaje computacional y de extracción automática de conocimiento a partir de grandes volúmenes de datos.

En el contexto de un grupo de trabajo, recopilar, analizar y estructurar documentación técnica sobre los aspectos claves de las técnicas de aprendizaje computacional y extracción automática de información y conocimiento a partir de grandes volúmenes de datos para realizar una síntesis por escrito y una presentación oral
11. Cronograma / calendario de la asignatura

Descripción

Los contenidos de la asignatura serán explicados por el profesorado en las horas semanales presenciales de teoría. Para afianzar estos contenidos, se han programado diferentes tareas prácticas que los alumnos deberán hacer individualmente y de forma autónoma. En el enunciado de estas tareas se especificarán los criterios de evaluación y, en su caso, la fecha límite de entrega.

Se pondrá a disposición de los alumnos las transparencias de clase, ejemplos y enlaces a material complementario.

La asignatura sigue una metodología de enseñanza aprendizaje basada en proyectos por lo que los alumnos deberán realizar, en grupo, un proyecto en el que tendrán que recopilar, preparar y tratar datos con el propósito de extraer conocimiento útil de los mismos. Además, deberán interpretar los resultados obtenidos y proponer estrategias para difundir y usar el conocimiento extraído. Semanalmente se irá trabajando en este proyecto que deberá ser expuesto oralmente al finalizar el cuatrimestre. 

El cronograma que se muestra tiene carácter orientativo, de modo que el profesorado podrá modificar la planificación propuesta si así fuese necesario para una correcta marcha del proceso de enseñanza-aprendizaje.

Segundo cuatrimestre

Semana Temas Actividades de enseñanza aprendizaje Horas de trabajo presencial Horas de trabajo autónomo Total
Semana 1: Tema 1 Explicar el tema 1 (El proceso de extracción de conocimiento en bases de datos)

Explicar las principales funcionalidades y entornos del software de análisis de datos
4.00 3.00 7.00
Semana 2: Tema 2 Explicar el tema 2 (Recuperación de información en documentos electrónicos).

Entrega o realización de la prueba práctica 1: Recuperación de información en la Web

Describir el proyecto que los alumnos deben realizar en grupo
4.00 0.00 4.00
Semana 3: Tema 3 Explicar el tema 3 (Árboles de decisión y regresión)

Ejercicios y práctica: Árboles de decisión y regresión

Desarrollo del proyecto
4.00 6.00 10.00
Semana 4: Tema 4 Explicar el tema 4 (Clasificadores bayesianos)

Ejercicios y práctica: Clasificadores bayesianos

Desarrollo del proyecto
4.00 5.00 9.00
Semana 5: Tema 5 Explicar el tema 5 (Agrupamiento basado en prototipos)

Ejercicios y práctica: Agrupamiento basado en prototipos

Entrega o realización de la prueba práctica 2: Clasificación con técnicas clásicas

Desarrollo del proyecto
4.00 4.00 8.00
Semana 6: Tema 6 Explicar el tema 6 (Agrupamiento basado en densidad)

Ejercicios y práctica: Agrupamiento basado en densidad

Desarrollo del proyecto
 
4.00 6.00 10.00
Semana 7: Tema 7 Explicar el tema 7 (Agrupamiento jerárquico)

Ejercicios y práctica: Agrupamiento jerárquico

Desarrollo del proyecto
4.00 6.00 10.00
Semana 8: Tema 8 Explicar el tema 8 (Detección de anomalías)

Ejercicios y práctica: Detección de anomalías

Desarrollo del proyecto
4.00 6.00 10.00
Semana 9: Tema 9 Explicar el tema 9 (Preparación de datos)

Ejercicios y práctica: Preparación de datos

Entrega o realización de la prueba práctica 3: Agrupamiento con técnicas clásicas

Desarrollo del proyecto
4.00 5.00 9.00
Semana 10: Tema 10 Explicar el tema 10 (Reducción de la dimensionalidad)

Ejercicios y práctica: Reducción de la dimensionalidad

Desarrollo del proyecto
4.00 6.00 10.00
Semana 11: Tema 11 Explicar el tema 11 (Clasificadores neuronales)

Entrega o realización de la prueba práctica 4: Clasificadores neuronales

Desarrollo del proyecto
 
4.00 5.00 9.00
Semana 12: Tema 11 Explicar el tema 11 (Clasificadores neuronales)

Entrega o realización de la prueba práctica 4: Clasificadores neuronales

Desarrollo del proyecto
 
4.00 6.00 10.00
Semana 13: Tema 12 Explicar el tema 12 (Agrupamiento mediante redes neuronales)

Entrega o realización de la prueba práctica 5: Agrupamiento mediante redes neuronales

Desarrollo del proyecto
4.00 6.00 10.00
Semana 14: Tema 12 Explicar el tema 12 (Agrupamiento mediante redes neuronales)

Entrega o realización de la prueba práctica 5: Agrupamiento mediante redes neuronales

Desarrollo del proyecto
 
4.00 6.00 10.00
Semana 15: Tema 13 Explicar el tema 13 (Reglas de asociación)

Ejercicios y práctica: Reglas de asociación

Desarrollo del proyecto
 
4.00 5.00 9.00
Semana 16 a 18: Redacción de la memoria y presentación del proyecto de la evaluación continua

En su caso, realización de la  prueba única

 
0.00 15.00 15.00
Total 60.00 90.00 150.00
Fecha de última modificación: 28-06-2023
Fecha de aprobación: 10-07-2023