Extracción de Conocimiento en Bases de Datos
(Curso Académico 2025 - 2026)
Mostrar Todo


Nota informativa: Atendiendo a la normativa de Protección de Datos y propiedad intelectual en la que se limita la publicación de imágenes de terceras personas sin su consentimiento, aquellos que difundan grabaciones de las sesiones de clase sin previo consentimiento de las personas implicadas, serán responsables ante la ley del uso prohibido de las citadas grabaciones.



1. Datos descriptivos de la asignatura
  • Código: 835870903
  • Centro: Escuela de Doctorado y Estudios de Postgrado
  • Lugar de impartición: -
  • Titulación: Máster Universitario en Ciberseguridad e Inteligencia de Datos
  • Plan de Estudios: 2018 (publicado en 19-09-2018)
  • Rama de conocimiento: Ingeniería y Arquitectura
  • Itinerario/Intensificación:
  • Departamento/s:
  • Área/s de conocimiento:
    • Ciencia de la Computación e Inteligencia Artificial
  • Curso: 1
  • Carácter:
  • Duración: Primer cuatrimestre
  • Créditos ECTS: 3,0
  • Modalidad de impartición: Semipresencial
  • Horario: Ver horario
  • Dirección web de la asignatura: Ver web de la asignatura
  • Idioma: Castellano e Inglés (0,15 ECTS en Inglés)
2. Requisitos de matrícula y calificación
3. Profesorado que imparte la asignatura

Profesor/a Coordinador/a: JOSE LUIS GONZALEZ AVILA

General:
Nombre:
JOSE LUIS
Apellido:
GONZALEZ AVILA
Departamento:
Ingeniería Informática y de Sistemas
Área de conocimiento:
Ciencia de la Computación e Inteligencia Artificial
Grupo:
Contacto:
Teléfono 1:
922845987
Teléfono 2:
Correo electrónico:
jlgavila@ull.es
Correo alternativo:
Tutorías primer cuatrimestre:
DesdeHastaDíaHora incialHora finalLocalizaciónPlantaDespacho
Todo el cuatrimestre Miércoles 15:30 17:30 Escuela Superior de Ingeniería y Tecnología - Módulo A - AN.4A ESIT 2 P2.048
Todo el cuatrimestre Jueves 15:30 19:30 Escuela Superior de Ingeniería y Tecnología - Módulo A - AN.4A ESIT 2 P2.048
Observaciones:
Tutorías segundo cuatrimestre:
DesdeHastaDíaHora incialHora finalLocalizaciónPlantaDespacho
Todo el cuatrimestre Miércoles 15:30 17:30 Escuela Superior de Ingeniería y Tecnología - Módulo A - AN.4A ESIT 2 P2.048
Todo el cuatrimestre Jueves 15:30 19:30 Escuela Superior de Ingeniería y Tecnología - Módulo A - AN.4A ESIT 2 P2.048
Observaciones:
4. Contextualización de la asignatura en el plan de estudio
  • Bloque formativo al que pertenece la asignatura:
  • Perfil profesional:
5. Competencias

Generales

  • CG1 - Ser capaces de aplicar los conocimientos adquiridos para resolver problemas en entornos nuevos o poco conocidos dentro de contextos relacionados con seguridad informática o inteligencia de datos
  • CG3 - Mantener una actitud de permanente actualización, que les permita estudiar de manera autónoma mediante formación continua en su futuro desempeño profesional como expertos en seguridad informática e inteligencia de datos
  • CG7 - Desarrollar las capacidades de trabajo en equipo y las habilidades de comunicación para mantener relaciones con otros profesionales y con organizaciones relevantes
  • CG8 - Tener la capacidad analítica y de resolución para atender a los problemas reales de acuerdo con los valores éticos y sociales y con el máximo respeto a la legalidad vigente

Básicas

  • CB6 - Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación
  • CB7 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio
  • CB8 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios
  • CB10 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo

Específicas

  • CE7 - Conocer las diferentes técnicas de análisis y explotación de datos y valorar su correcta aplicación en la extracción de información relevante
  • CE11 - Ser capaz de comunicar efectivamente las conclusiones alcanzadas tras analizar un conjunto de datos
6. Contenidos de la asignatura

Contenidos teóricos y prácticos de la asignatura

Módulo 1. Fundamentos del proceso de extracción de conocimiento desde fuentes de datos

  • Tema 1. Introducción a la extracción de conocimiento: ciclo KDD, fuentes de datos tradicionales y modernas
    • (Incluye: ciclo CRISP-DM, calidad del dato, scraping básico, APIs públicas y datos abiertos institucionales como ISTAC y datos.gob.es)

Módulo 2. Aprendizaje supervisado: clasificación y regresión

  • Tema 2. Árboles de decisión, Random Forest y Gradient Boosting en entornos R y Python
    • (Incluye XGBoost, LightGBM, y herramientas de visualización de árboles y SHAP)
  • Tema 3. Clasificadores probabilísticos: Naive Bayes, regresión logística y clasificación textual en redes sociales
    • (Aplicado a análisis de sentimiento, detección de bots y polarización política en Twitter/X)
  • Tema 4. Reglas de clasificación y aprendizaje automático interpretativo (IA explicable)
    • (Incluye uso de reglas de asociación para auditoría de decisiones automáticas, fairness y detección de sesgos)
  • Tema 5. Evaluación de modelos de clasificación: métricas, validación cruzada, matrices de confusión y curvas ROC-AUC
    • (Análisis comparativo aplicado sobre datasets abiertos reales)

Módulo 3. Aprendizaje no supervisado: agrupamiento y minería de estructuras ocultas

  • Tema 6. Métodos de agrupamiento: k-means, k-medoids y clustering en datos geoespaciales y demográficos
    • (Aplicado a datos del ISTAC y movilidad urbana)
  • Tema 7. Agrupamiento avanzado: DBSCAN, OPTICS y algoritmos basados en densidad para detección de comunidades
    • (Uso en datos abiertos y sociales; análisis de foros, chats y redes)
  • Tema 8. Agrupamiento jerárquico, dendrogramas y reducción de dimensionalidad (PCA, t-SNE, UMAP)
    • (Aplicado a datos heterogéneos; análisis exploratorio visual en plotly, seaborn y ggplot2)

Módulo 4. Detección de anomalías y patrones no evidentes

  • Tema 9. Detección de anomalías con algoritmos de distancia, densidad y autoencoders
    • (Aplicación en fraudes, ciberseguridad y vigilancia epidemiológica con datos abiertos)

Módulo 5. Reglas de asociación y minería de patrones complejos

  • Tema 10. Minería de patrones frecuentes y algoritmos Apriori/FP-Growth en comercio, redes y comportamiento
    • (Incluye extracción de relaciones en logs, historiales y secuencias temporales)
  • Tema 11. Evaluación de reglas de asociación y visualización interactiva con dashboards (Shiny, Dash, Power BI)
    • (Proyectos finales con informes automatizados y orientados a la toma de decisiones)

Actividades a desarrollar en otro idioma

En esta asignatura se contempla la impartición de 1,5 horas de docencia en lengua inglesa. Asimismo, el software empleado durante las sesiones prácticas de laboratorio dispone de documentación técnica en inglés, al igual que los manuales y tutoriales que el alumnado utilizará para la realización de las prácticas correspondientes. De igual modo, una parte sustancial de la bibliografía y de los materiales de trabajo está redactada en este idioma, favoreciendo así la adquisición y consolidación de la comprensión lectora en lengua inglesa.

Por otra parte, de forma análoga a lo que se exige en el Trabajo Fin de Grado (TFG), la memoria del proyecto —descrita en el apartado relativo a la Metodología y volumen de trabajo del estudiante— deberá incluir una sección redactada en inglés que resuma los aspectos esenciales del mismo. Asimismo, los estudiantes deberán exponer oralmente las conclusiones de su trabajo en este idioma. La valoración de estas actividades se integrará en la evaluación del proyecto, conforme a lo establecido en el apartado correspondiente al Sistema de evaluación y calificación.
7. Metodología y volumen de trabajo del alumnado

Descripción

Metodología docente
La metodología de las sesiones teóricas se fundamentará en clases en las que el profesorado expondrá los conceptos clave de cada tema, cuya asimilación resultará esencial para el estudiantado. Estas explicaciones se desarrollarán tanto de forma presencial como mediante retransmisiones online, ya sea en directo a través de videoconferencia o en diferido mediante grabaciones accesibles en el entorno virtual de aprendizaje.
Las clases prácticas de laboratorio presenciales se organizarán en grupos reducidos y consistirán en sesiones supervisadas en las que se abordarán ejercicios de dificultad progresiva. En ellas, el alumnado aplicará los contenidos tratados en las sesiones teóricas, familiarizándose con diversas herramientas y entornos —reales o simulados— y con metodologías específicas vinculadas a la materia. La asignatura se diseñará para mantener un enfoque actualizado y vanguardista, incorporando como eje la extracción de conocimiento a partir de datos procedentes de redes sociales, contexto de gran relevancia y actualidad.
En cuanto a la elaboración de informes, trabajos y proyectos, la metodología perseguirá el desarrollo de la capacidad del estudiantado para aplicar los conocimientos adquiridos y resolver problemas en contextos novedosos o poco explorados, de forma integrada y multidisciplinar.
Se prevén igualmente seminarios orientados a profundizar en determinados aspectos teóricos o prácticos de especial interés, complementados con charlas y debates impartidos por profesionales del sector, quienes aportarán una visión real y aplicada del ámbito de estudio.
Las tutorías individuales servirán de apoyo para reforzar la comprensión de los contenidos, resolver dudas específicas y orientar al alumnado en la realización de las prácticas.
Para fomentar la comprensión del proceso de extracción de conocimiento y de las técnicas correspondientes, se utilizará una metodología basada en el aprendizaje por proyectos, combinada con la realización de pruebas prácticas.

Proyecto
El desarrollo del proyecto tendrá como finalidad favorecer un aprendizaje significativo, estimular la autonomía, incrementar la motivación y fomentar una actitud crítica y reflexiva. A partir de fuentes de datos proporcionadas por el profesorado, el alumnado deberá recopilar, preparar y procesar datos con el fin de extraer información útil, interpretarla y proponer estrategias para su difusión y aplicación. Todo el trabajo se recogerá en una memoria final que incluirá un resumen y las conclusiones redactadas en inglés, siguiendo la línea de buenas prácticas establecida, por ejemplo, en el Trabajo Fin de Grado.
La memoria constituirá un elemento esencial para la evaluación continua. Asimismo, se fomentará la participación en foros, la búsqueda y análisis de información reciente sobre el tratamiento de datos y sus implicaciones legales, éticas y sociales. Algunas de estas actividades podrán desarrollarse de forma virtual a través de las herramientas de la plataforma docente de la Universidad de La Laguna.

Pruebas teórico-prácticas
Mediante las pruebas teórico-prácticas se pretende profundizar en los fundamentos teóricos del análisis de datos y en su aplicación para la resolución de casos reales. Estas pruebas podrán incluir cuestionarios, ejercicios prácticos de corta duración y otras actividades de evaluación continua.
En caso de que se declare una situación de riesgo que afecte a la planificación y desarrollo de las actividades docentes, se actuará conforme a lo establecido en el plan específico del centro.
Por último, se recuerda que el estudiantado no podrá hacer un uso de la inteligencia artificial que obstaculice su progreso académico o la comprensión de los contenidos de la asignatura. El profesorado indicará expresamente, en su caso, las actividades en las que se permita su uso y la forma adecuada de emplear dichas herramientas.

Actividades formativas en créditos ECTS, su metodología de enseñanza-aprendizaje y su relación con las competencias que debe adquirir el estudiante

Actividades formativas Horas presenciales Horas de trabajo autónomo Total horas Relación con competencias
Clases teóricas 5,00 5,00 10,0 [CB6], [CE7]
Clases prácticas (aula / sala de demostraciones / prácticas laboratorio) 8,00 8,00 16,0 [CG1], [CB7], [CE7]
Realización de seminarios u otras actividades complementarias 1,00 1,00 2,0 [CB6], [CE7]
Realización de trabajos (individual/grupal) 0,00 0,00 0,0 [CB10]
Estudio/preparación de clases teóricas 0,00 10,00 10,0 [CG3], [CG7], [CB10], [CE7]
Estudio/preparación de clases prácticas 0,00 6,00 6,0 [CG3], [CG7], [CB10], [CE7]
Preparación de exámenes 0,00 0,00 0,0 [CG8]
Realización de exámenes 1,00 0,00 1,0 [CE7], [CE11]
Asistencia a tutorías 0,00 6,00 6,0 [CE7]
Informes, trabajos y proyectos 0,00 24,00 24,0 [CG8], [CB7], [CB8], [CE11]
Total horas
Total ECTS
8. Bibliografía / Recursos

Bibliografía básica

Charu C. Aggarwal. Data Mining: The Textbook. Springer, 2015.
Referencia completa para fundamentos de minería de datos y técnicas supervisadas y no supervisadas.
 

Pang-Ning Tan, Michael Steinbach, Anuj Karpatne, Vipin Kumar. Introduction to Data Mining. Pearson/Addison-Wesley, 2018.
Buen manual introductorio, actualizado con casos prácticos.

Ethem Alpaydin. Introduction to Machine Learning. The MIT Press, 2020.
Para afianzar conceptos de clasificación, agrupamiento y modelos supervisados.


Bibliografía complementaria

Ian H. Witten, Eibe Frank, Mark A. Hall, Christopher J. Pal. Data Mining: Practical Machine Learning Tools and Techniques. 4th Ed., Morgan Kaufmann, 2017.

Foster Provost, Tom Fawcett. Data Science for Business. O’Reilly Media, 2013.
Enfoque aplicado, ejemplos de casos reales y decisiones basadas en datos.

Yanchang Zhao. R and Data Mining: Examples and Case Studies. Academic Press, 2012.
Muy útil para prácticas en R, minería y visualización.

Emilio Ferrara, Onur Varol, Filippo Menczer. Detection of Bot Activity in Social Networks. Communications of the ACM, vol. 61, no. 6, 2018.
Artículo clave sobre análisis de bots y desinformación en Twitter.

Michael J. Crawley. The R Book. 3rd Ed., Wiley, 2021.
Manual de referencia para análisis estadístico avanzado y visualización con R.

Otros recursos

R Project for Statistical Computing https://www.r-project.org/

Python Libraries: Scikit-learn, pandas, seaborn, plotly, SHAP.

Kaggle: Plataforma de datasets y casos prácticos. https://www.kaggle.com/

9. Sistema de evaluación y calificación

Descripción

La evaluación de la asignatura se rige por el Reglamento de Evaluación y Calificación de la Universidad de La Laguna, aprobado el 21 de junio de 2022, modificado por acuerdos del Consejo de Gobierno de 13 de julio de 2022, 8 de noviembre de 2022 y 31 de mayo de 2023, además de por lo establecido en la Memoria de Verificación inicial del título o posteriores modificaciones.

Atendiendo a lo establecido en los Estatutos de la Universidad de La Laguna, la modalidad de evaluación continua será obligatoria en la primera convocatoria de la asignatura para todo el alumnado (excepto para quienes se acojan a la evaluación única según se dispone en el artículo 5.5 del Reglamento de Evaluación y Calificación de la Universidad de La Laguna). 

Podrán acogerse a la modalidad de evaluación única, en la primera convocatoria, quiénes lo comuniquen, a través del procedimiento habilitado en el aula virtual de la asignatura, antes de haberse presentado a las actividades cuya ponderación compute el 40% de la evaluación continua.

Una convocatoria se entenderá agotada cuando el/la alumno/a se presente, al menos, a las actividades cuya ponderación compute el 50% de la evaluación continua.

El alumnado que no haya superado la asignatura en la primera convocatoria, o el que se haya acogido a la modalidad de evaluación única, deberá examinarse de todas las actividades obligatorias de la evaluación continua que no haya superado en dicha convocatoria. 

El alumnado que se encuentre en la quinta o posteriores convocatorias y desee ser evaluado por un Tribunal, deberá presentar una solicitud a través del procedimiento habilitado en la sede electrónica, dirigida al Decanato de la Escuela. Dicha solicitud deberá realizarse con una antelación mínima de diez días hábiles al comienzo del periodo de exámenes.

Evaluación continua.-
La evaluación continua tiene en cuenta las siguientes actividades relacionadas con las pruebas descritas en el apartado "Metodología y volumen de trabajo":
  • Trabajo y defensa del proyecto
  • Ejercicios teórico prácticos
La calificación del proyecto tiene un peso del 80% de la nota (incluidas las actividades desarrolladas en inglés que se describen en el apartado Metodología y volumen de trabajo), correspondiendo el 20% restante a los ejercicios teórico prácticos.

Todas las actividades de la evaluación continua tienen carácter obligatorio.

En el apartado Cronograma/calendario de la asignatura se recogen las fechas estimadas de presentación de las pruebas prácticas. Los resultados de las mismas serán comunicados a los alumnos aproximadamente 15 días después de su presentación. La defensa del proyecto se llevará a cabo en la fecha de examen establecida por la Escuela Superior de Ingeniería y Tecnología dentro del calendario académico anual. Esta fecha es también la fecha límite de entrega del informe del proyecto.

Evaluación única.-

Consistirá en la entrega y defensa oral del proyecto y la entrega de los ejercicios teórico prácticos descritos en el apartado "Metodología y volumen de trabajo" en las fechas establecidas para ello por la Universidad de La Laguna y la Escuela Superior de Ingeniería y Tecnología.

Si el alumnado así lo manifiesta, se trasladará la calificación de las actividades obligatorias que haya superado en la evaluación continua a la evaluación única. En ningún caso, existe la posibilidad de presentarse a una actividad obligatoria para subir nota.

El software utilizado en las prácticas de laboratorio, así como los manuales y tutoriales que usarán los alumnos para el desarrollo de las mismas, están documentados en inglés. Se evaluará la comprensión de los mismos en la calificación del proyecto y de los ejercicios teórico prácticos.

En la tabla siguiente se muestra la ponderación de las diferentes actividades de la evaluación continua.

Estrategia Evaluativa

Tipo de prueba Competencias Criterios Ponderación
Proyecto [CG1], [CG3], [CG7], [CG8], [CB6], [CB7], [CB8], [CB10], [CE7], [CE11]
  • Memoria 
    • Estructura, calidad y claridad de la redacción, fuentes consultadas, rigor en el análisis de los datos y coherencia de las conclusiones.
  • Análisis de datos
    • Grado de conocimiento adquirido en el manejo de las herramientas para el tratamiento inteligente de datos.
    • Rigor en el análisis de los datos y coherencia de las conclusiones.
80,00 %
Evaluación de teoría (pruebas individuales) [CG1], [CG3], [CG7], [CG8], [CB6], [CB7], [CB8], [CB10], [CE7], [CE11] • -Frecuencia y pertinencia de las intervenciones en los foros.
• Adecuación de las respuestas dadas a los ejercicios y claridad de redacción de las
mismas.
20,00 %
10. Resultados de Aprendizaje
El estudiantado deberá ser capaz de localizar, recopilar, preparar y analizar datos provenientes de múltiples fuentes y en diversos formatos, valorando de manera crítica su calidad y pertinencia. Para ello, aplicará de forma fundamentada técnicas avanzadas de análisis y minería de datos, tanto supervisadas como no supervisadas —incluyendo clasificación, regresión, agrupamiento y detección de anomalías o patrones complejos—. Además, integrará enfoques y herramientas actuales como web scraping, consulta de datos mediante servicios web y la explotación de APIs abiertas, especialmente aquellas orientadas a la extracción de información en redes sociales. Todo este proceso se orientará a interpretar los resultados de manera sólida y a generar conclusiones útiles y aplicables a contextos reales relacionados con la ciberseguridad, la inteligencia de datos y la toma de decisiones basada en datos.

11. Cronograma / calendario de la asignatura

Descripción

Dado el carácter semipresencial del máster, esta asignatura combinará de manera equilibrada sesiones presenciales, actividades online y trabajo autónomo del estudiantado. Está previsto que la docencia presencial se organice en bloques de aproximadamente 3 horas semanales durante las semanas 1 a 5 y de la 8 a la 12 del primer cuatrimestre, mientras que en el segundo cuatrimestre se podrán alternar semanas de 3 a 4 horas presenciales, en función de las necesidades específicas de prácticas avanzadas, talleres de herramientas o presentación de proyectos.

La planificación de la asignatura se estructura en módulos coherentes que abarcan desde los fundamentos del proceso de extracción de conocimiento y la evaluación de la calidad de los datos hasta la aplicación de técnicas y herramientas actuales, como web scraping, consumo de datos mediante APIs abiertas, minería de datos en redes sociales y aplicación de modelos de aprendizaje automático y Deep Learning con frameworks de última generación. Esta organización facilita la puesta en práctica de metodologías activas, como el Aprendizaje Basado en Proyectos y la resolución de casos reales vinculados a la ciberseguridad y la inteligencia de datos.

Por último, el calendario académico se adaptará de forma flexible al ritmo de avance del grupo y podrá ser revisado y actualizado por el profesorado cuando la dinámica de la asignatura así lo requiera. Las pruebas finales y la defensa de los proyectos se programarán en las semanas oficiales de cierre fijadas por el calendario académico de la Universidad.

Primer cuatrimestre

Semana Temas Actividades de enseñanza aprendizaje Horas de trabajo presencial Horas de trabajo autónomo Total
Semana 1: Tema 1. Introducción a la extracción de conocimiento: ciclo KDD, fuentes de datos tradicionales y modernas
Tema 2. Árboles de decisión, Random Forest y Gradient Boosting en entornos R y Python
Presentar el Tema 1, introduciendo los conceptos clave del ciclo KDD/CRISP-DM, la identificación de fuentes de datos y la importancia de la calidad del dato.

Describir las principales características de las herramientas y entornos de análisis de datos, incluyendo bibliotecas y paquetes relevantes en R y Python.

Exponer el Tema 2, profundizando en los métodos de aprendizaje supervisado y los algoritmos de clasificación y regresión que se utilizarán.

Explicar en qué consiste el proyecto que deberá desarrollar el alumnado, destacando la recopilación y tratamiento de datos —por ejemplo, mediante scraping o uso de APIs abiertas— y la interpretación de los resultados.

Introducir el uso de bibliotecas específicas, como tree, randomForest, XGBoost, LightGBM y técnicas de interpretación de modelos, enfatizando su aplicación práctica en conjuntos de datos reales.
2.00 6.00 8.00
Semana 2: Tema 3. Clasificadores probabilísticos: Naive Bayes, regresión logística y clasificación textual en redes sociales
Tema 4. Reglas de clasificación y aprendizaje automático interpretativo (IA explicable)
Tema 5. Evaluación de modelos de clasificación: métricas, validación cruzada, matrices de confusión y curvas ROC-AUC
Desarrollar el Tema 3, abordando clasificadores probabilísticos como Naive Bayes, regresión logística y su aplicación al análisis de texto y datos provenientes de redes sociales.

Plantear la Tarea 1, que consistirá en la resolución de un caso práctico de clasificación supervisada con datos reales y su enunciado detallado.

Exponer el Tema 4, centrado en el aprendizaje automático interpretativo y las reglas de clasificación, destacando su importancia en la auditoría de decisiones y la detección de sesgos.

Desarrollar el Tema 5, explicando las métricas de evaluación de modelos de clasificación, validación cruzada y análisis de resultados mediante curvas ROC y matrices de confusión.

Guiar al alumnado en el desarrollo del proyecto, aplicando las técnicas vistas a la recopilación y análisis de datos, con especial atención a la extracción desde redes sociales mediante scraping y APIs.
3.00 9.00 12.00
Semana 3: Tema 6. Métodos de agrupamiento: k-means, k-medoids y clustering en datos geoespaciales y demográficos
Tema 7. Agrupamiento avanzado: DBSCAN, OPTICS y algoritmos basados en densidad para detección de comunidades
Desarrollar el Tema 5, profundizando en la evaluación de modelos de clasificación, la interpretación de métricas, la validación cruzada y la comparación de resultados sobre conjuntos de datos reales.

Continuar con el desarrollo del proyecto, aplicando la validación de modelos y afinando la recopilación y preparación de datos procedentes de distintas fuentes, incluyendo redes sociales y APIs abiertas.

Explicar el Tema 6, abordando los métodos de agrupamiento basados en prototipos, como k-means y k-medoids, y su aplicación a datos geoespaciales, demográficos o sociales.

Realizar la Tarea 1, que consistirá en la entrega de la actividad práctica de clasificación para su evaluación.

Exponer el Tema 7, centrado en técnicas de agrupamiento basadas en densidad, como DBSCAN y OPTICS, aplicables a la detección de comunidades y patrones ocultos en datos no estructurados.

Plantear la Tarea 2, con el enunciado de un caso práctico de agrupamiento utilizando datos abiertos o extraídos mediante scraping de redes sociales.

Avanzar en el desarrollo del proyecto, integrando los resultados del agrupamiento y contrastando conclusiones preliminares.
3.00 9.00 12.00
Semana 4: Tema 8. Agrupamiento jerárquico, dendrogramas y reducción de dimensionalidad (PCA, t-SNE, UMAP)
Tema 9. Detección de anomalías con algoritmos de distancia, densidad y autoencoders
Desarrollar el Tema 8, presentando las técnicas de agrupamiento jerárquico, la construcción de dendrogramas y los métodos de reducción de dimensionalidad (PCA, t-SNE, UMAP) aplicados a conjuntos de datos heterogéneos.

Realizar la Tarea 2, que consistirá en la entrega para su evaluación del ejercicio práctico de agrupamiento, integrando la interpretación de resultados y visualizaciones.

Explicar el Tema 9, abordando las técnicas de detección de anomalías mediante algoritmos basados en distancia, densidad y autoencoders, con ejemplos aplicados a escenarios de ciberseguridad, fraude y vigilancia en datos de redes sociales.

Plantear la Tarea 3, en la que se presentará el enunciado de un caso práctico enfocado en la identificación de valores atípicos o patrones inusuales en datos reales.

Continuar con el desarrollo del proyecto, incorporando los resultados de las tareas de agrupamiento y detección de anomalías, y contrastando conclusiones parciales con la finalidad de integrarlas en la memoria final.
3.00 9.00 12.00
Semana 5: Tema 10. Minería de patrones frecuentes y algoritmos Apriori/FP-Growth en comercio, redes y comportamiento
Tema 11. Evaluación de reglas de asociación y visualización interactiva con dashboards (Shiny, Dash, Power BI)
Seminario
Desarrollar el Tema 10, presentando las técnicas de minería de patrones frecuentes y los principales algoritmos de extracción de reglas de asociación, como Apriori y FP-Growth, aplicados a la identificación de relaciones en datos de comportamiento, secuencias o historiales.

Exponer el Tema 11, centrado en la evaluación de la calidad de las reglas de asociación y en la construcción de visualizaciones interactivas mediante dashboards o paneles de control para facilitar la toma de decisiones basada en datos.

Realizar la Tarea 3, consistente en la entrega y evaluación de la actividad práctica de detección de anomalías, integrando los hallazgos con el resto de resultados del proyecto.

Avanzar en el desarrollo del proyecto, recopilando, consolidando y estructurando los resultados de las diferentes fases de análisis para la elaboración de la memoria final.

Celebrar el seminario “Extracción de conocimiento”, en el que el estudiantado podrá debatir, compartir conclusiones y presentar avances clave de sus proyectos, fomentando la reflexión crítica y la visión aplicada del análisis de datos.
3.00 9.00 12.00
Semana 6: Proyecto Final y Evaluativo de Datos
Redacción y revisión de la memoria del proyecto, estructurando claramente la descripción de la metodología empleada, los resultados obtenidos en cada fase (clasificación, agrupamiento, detección de anomalías, minería de patrones) y las conclusiones finales.

Preparación de la presentación final, organizando los materiales de apoyo y las visualizaciones interactivas que servirán de base para la exposición y defensa de los hallazgos ante el resto del grupo y el profesorado.
0.00 9.00 9.00
Semana 7: Proyecto Final y Evaluativo de Datos
Elaboración y revisión de la memoria del proyecto, documentando de forma estructurada todo el proceso de extracción de conocimiento: desde la obtención y preparación de datos —incluyendo scraping, uso de APIs y datos de redes sociales— hasta la aplicación de técnicas de clasificación, agrupamiento, detección de anomalías y minería de patrones complejos.

Diseño y preparación de la presentación final, organizando visualizaciones, dashboards y conclusiones clave para su exposición pública y defensa, poniendo en valor la interpretación de resultados y la propuesta de estrategias basadas en los datos analizados.
0.00 9.00 9.00
Semana 8:
0.00 0.00 0.00
Semana 15: Defensa del Proyecto Final y Evaluativo de Datos
1.00 0.00 1.00
Total 15.00 60.00 75.00
Fecha de última modificación: 10-07-2025
Fecha de aprobación: 03-09-2025