Análisis de datos masivos
(Curso Académico 2023 - 2024)
Mostrar Todo


Nota informativa: Atendiendo a la normativa de Protección de Datos y propiedad intelectual en la que se limita la publicación de imágenes de terceras personas sin su consentimiento, aquellos que difundan grabaciones de las sesiones de clase sin previo consentimiento de las personas implicadas, serán responsables ante la ley del uso prohibido de las citadas grabaciones.



1. Datos descriptivos de la asignatura
  • Código: 835941203
  • Centro: Escuela de Doctorado y Estudios de Postgrado
  • Lugar de impartición: Escuela Superior de Ingeniería y Tecnología. Sección de Ingeniería Informática
  • Titulación: Máster Universitario en Ingeniería Informática
  • Plan de Estudios: 2018 (publicado en )
  • Rama de conocimiento: Ingeniería y Arquitectura
  • Itinerario/Intensificación:
  • Departamento/s:
  • Área/s de conocimiento:
    • Ciencia de la Computación e Inteligencia Artificial
    • Lenguajes y Sistemas Informáticos
  • Curso: 1
  • Carácter: Obligatoria
  • Duración: Segundo cuatrimestre
  • Créditos ECTS: 6,0
  • Modalidad de impartición: Semipresencial
  • Horario: Ver horario
  • Dirección web de la asignatura: Ver web de la asignatura
  • Idioma: Castellano e Inglés (0,30 ECTS en Inglés)
2. Requisitos de matrícula y calificación
3. Profesorado que imparte la asignatura

Profesor/a Coordinador/a: JOSE MARCOS MORENO VEGA

General:
Nombre:
JOSE MARCOS
Apellido:
MORENO VEGA
Departamento:
Ingeniería Informática y de Sistemas
Área de conocimiento:
Ciencia de la Computación e Inteligencia Artificial
Grupo:
Contacto:
Teléfono 1:
922318175
Teléfono 2:
Correo electrónico:
jmmoreno@ull.es
Correo alternativo:
Tutorías primer cuatrimestre:
DesdeHastaDíaHora incialHora finalLocalizaciónPlantaDespacho
Todo el cuatrimestre Martes 08:00 10:00 Escuela Superior de Ingeniería y Tecnología - Módulo A - AN.4A ESIT 3 P3.019
Todo el cuatrimestre Jueves 08:00 12:00 Escuela Superior de Ingeniería y Tecnología - Módulo A - AN.4A ESIT 3 P3.019
Observaciones:
Tutorías segundo cuatrimestre:
DesdeHastaDíaHora incialHora finalLocalizaciónPlantaDespacho
Todo el cuatrimestre Martes 09:00 11:00 Escuela Superior de Ingeniería y Tecnología - Módulo A - AN.4A ESIT 3 P3.019
Todo el cuatrimestre Viernes 08:00 12:00 Escuela Superior de Ingeniería y Tecnología - Módulo A - AN.4A ESIT 3 P3.019
Observaciones:
General:
Nombre:
ISRAEL
Apellido:
LÓPEZ PLATA
Departamento:
Ingeniería Informática y de Sistemas
Área de conocimiento:
Lenguajes y Sistemas Informáticos
Grupo:
Contacto:
Teléfono 1:
Teléfono 2:
Correo electrónico:
ilopezpl@ull.es
Correo alternativo:
Tutorías primer cuatrimestre:
DesdeHastaDíaHora incialHora finalLocalizaciónPlantaDespacho
Todo el cuatrimestre Lunes 09:30 12:30 Escuela Superior de Ingeniería y Tecnología - Módulo C - AN.4A ESIT 2 P2.106
Todo el cuatrimestre Martes 09:30 12:30 Escuela Superior de Ingeniería y Tecnología - Módulo C - AN.4A ESIT 2 P2.106
Observaciones:
Tutorías segundo cuatrimestre:
DesdeHastaDíaHora incialHora finalLocalizaciónPlantaDespacho
Todo el cuatrimestre Lunes 09:30 12:30 Escuela Superior de Ingeniería y Tecnología - Módulo C - AN.4A ESIT 2 P2.106
Todo el cuatrimestre Jueves 09:30 12:30 Escuela Superior de Ingeniería y Tecnología - Módulo C - AN.4A ESIT 2 P2.106
Observaciones:
4. Contextualización de la asignatura en el plan de estudio
  • Bloque formativo al que pertenece la asignatura: Tecnologías Informáticas
  • Perfil profesional:
5. Competencias

Generales

  • CO1 - Capacidad para proyectar, calcular y diseñar productos, procesos e instalaciones en todos los ámbitos de la Ingeniería Informática
  • CO3 - Capacidad para dirigir, planificar y supervisar equipos multidisciplinares
  • CO4 - Capacidad para el modelado matemático, cálculo y simulación en centros tecnológicos y de ingeniería de empresa, particularmente en tareas de investigación, desarrollo e innovación en todos los ámbitos relacionados con la Ingeniería en Informática
  • CO7 - Capacidad para la puesta en marcha, dirección y gestión de procesos de fabricación de equipos informáticos, con garantía de la seguridad para las personas y bienes, la calidad final de los productos y su homologación
  • CO8 - Capacidad para la aplicación de los conocimientos adquiridos y de resolver problemas en entornos nuevos o poco conocidos dentro de contextos más amplios y mulitidisciplinares, siendo capaces de integrar estos conocimientos

Específicas

  • SL3 - Comprender, diseñar, evaluar y aplicar tecnologías, herramientas, recursos, estándares en el marco del desarrollo de software y su implantación en sistemas y entornos libres.
  • TI_7 - Capacidad para comprender y poder aplicar conocimientos avanzados de computación de altas prestaciones y métodos numéricos o computacionales a problemas de ingeniería
  • TI_9 - Capacidad para aplicar métodos matemáticos, estadísticos y de inteligencia artificial para modelar, diseñar y desarrollar aplicaciones, servicios, sistemas inteligentes y sistemas basados en el conocimiento
6. Contenidos de la asignatura

Contenidos teóricos y prácticos de la asignatura

  • Introducción al problema del análisis de datos a gran escala: desafíos actuales, tendencias y aplicaciones.
  • Algoritmos para el análisis de datos a gran escala: algoritmos de minería y aprendizaje automático que se han desarrollado específicamente para hacer frente a grandes conjuntos de datos.
  • Tecnologías para la gestión de datos a gran escala: paradigma Map-Reduce y sistemas de soporte.
  • Visualización de resultados.
  • Software libre en el análisis de datos masivos.

Actividades a desarrollar en otro idioma

En virtud de lo dispuesto en la normativa autonómica (decreto 168/2008, 22 de julio) un 5% del contenido será impartido en inglés. En la guía docente de cada asignatura se indicarán las actividades formativas a impartir en inglés y el método de evaluación del contenido correspondiente.
7. Metodología y volumen de trabajo del estudiante

Descripción

* Enseñanza expositiva: clases teóricas donde el profesor expone los conceptos teóricos de la asignatura y clases prácticas o de problemas donde se estudiarán ejemplos prácticos. Se espera que tanto las clases teóricas como las prácticas sean participativas
* Tutorías individuales presenciales o virtuales a través del portal de la asignatura.
* Realización de trabajos/proyectos propuestos por el profesor que serán de tipo práctico y podrán realizarse dentro o fuera del aula virtual, y que serán el material utilizado para la evaluación continua.
* Dentro de las actividades on-line que se realizan en la asignatura, vamos a distinguir dos modalidades:
a) Online asíncrona en las que las comunicaciones profesor/alumno se realizan mediante herramientas de mensajería (correo electrónico, foros de discusión, ...). En estas actividades, se propondrá un aspecto teórico/práctico de la asignatura que el alumno deberá abordar haciendo uso del material suministrado por el profesor. Mediante sistemas de mensajería se establecerá el canal para la resolución de dudas o discusiones y se propondrá el entregable asociado (máquina virtual configurada, cuestioario,...)
b) Online síncrona en las que se fija un horario en el que se establece una comunicación directa profesor/alumno usando herramientas como chats y videoconferencias

Actividades formativas en créditos ECTS, su metodología de enseñanza-aprendizaje y su relación con las competencias que debe adquirir el estudiante

Actividades formativas Horas presenciales Horas de trabajo autónomo Total horas Relación con competencias
Clases teóricas 13,00 0,00 13,0 [TI_9], [TI_7], [SL3], [CO8], [CO4]
Clases prácticas (aula / sala de demostraciones / prácticas laboratorio) 7,50 7,50 15,0 [TI_9], [TI_7], [SL3], [CO7], [CO3]
Realización de seminarios u otras actividades complementarias 2,70 9,30 12,0 [CO7], [CO1]
Realización de trabajos (individual/grupal) 0,00 24,00 24,0 [TI_9], [TI_7], [SL3], [CO3]
Estudio/preparación de clases teóricas 0,00 25,00 25,0 [TI_9], [TI_7], [SL3], [CO4]
Estudio/preparación de clases prácticas 0,00 11,00 11,0 [TI_9], [TI_7], [SL3], [CO7], [CO4], [CO3]
Preparación de exámenes 0,00 10,00 10,0 [TI_9], [TI_7], [SL3]
Realización de exámenes 5,00 0,00 5,0 [TI_9], [TI_7], [SL3]
Asistencia a tutorías 0,00 0,00 0,0 [TI_9], [TI_7], [SL3], [CO8], [CO4]
Preparación de informes u otros trabajos. 0,00 20,00 20,0 [TI_9], [TI_7], [SL3], [CO1]
Trabajos y proyectos 1,80 13,20 15,0 [TI_9], [TI_7], [SL3], [CO3], [CO1]
Total horas
Total ECTS
8. Bibliografía / Recursos

Bibliografía básica

José Hernández Orallo, M.José Ramírez Quintana, Cesar Ferri Ramírez. Introducción a la Minería de Datos. Editorial Pearson, 2004        
Ethem Alpaydin, Introduction to Machine Learning, The MIT Press, 2004
Pang-Ning Tan, Michael Steinbach, Anuj Karpatne, Vipin Kumar, Introduction to Data Mining, Addison-Wesley, 2006
Charu. C. Aggarwal, Data Mining. The Textbook. Springer, 2015

Bibliografía complementaria

Ian H. Witten, Eibe Frank, Mark A. Hall, Christopher J. Pal, Data MiningPractical Machine Learning Tools and Techniques, Morgan Kaufmann, 2017
Foster Provost, Tom Fawcett, Data Science for Business, O’Relly Media, 2013
Michael R. Berthold, Christian Borgelt, Frank Höppner, Frank Klawonn, Guide to Intelligent Data Analysis, Springer, 2010
Yanchang Zhao, R and Data Mining: Examples and Case Studies, Academic Press, 2012
Michael J. Crawley, The R Book, Wiley, 2013
9. Sistema de evaluación y calificación

Descripción


La evaluación de la asignatura se rige por el Reglamento de Evaluación y Calificación de la Universidad de La Laguna, aprobado el 21 de junio de 2022, modificado por acuerdos del Consejo de Gobierno de 13 de julio de 2022, 8 de noviembre de 2022 y 31 de mayo de 2023, además de por lo establecido en la Memoria de Verificación inicial del título o posteriores modificaciones.

Atendiendo a lo establecido en los Estatutos de la Universidad de La Laguna, la modalidad de evaluación continua será obligatoria en la primera convocatoria de la asignatura para todo el alumnado (excepto para quienes se acojan a la evaluación única según se dispone en el artículo 5.5 del Reglamento de Evaluación y Calificación de la Universidad de La Laguna). 

Podrán acogerse a la modalidad de evaluación única, en la primera convocatoria, quiénes lo comuniquen, a través del procedimiento habilitado en el aula virtual de la asignatura, antes de haberse presentado a las actividades cuya ponderación compute el 40% de la evaluación continua.

Una convocatoria se entenderá agotada cuando el/la alumno/a se presente, al menos, a las actividades cuya ponderación compute el 50% de la evaluación continua.

El alumnado que no haya superado la asignatura en la primera convocatoria, o el que se haya acogido a la modalidad de evaluación única, deberá examinarse de todas las actividades obligatorias de la evaluación continua que no haya superado en dicha convocatoria. 

El alumnado que se encuentre en la quinta o posteriores convocatorias y desee ser evaluado por un Tribunal, deberá presentar una solicitud a través del procedimiento habilitado en la sede electrónica, dirigida al Decanato de la Escuela. Dicha solicitud deberá realizarse con una antelación mínima de diez días hábiles al comienzo del periodo de exámenes.

Es obligatorio asistir a clases y hacer uso de los foros y tutorías tanto presenciales como on-line.

Evaluación continua.- 

La evaluación continua tiene en cuenta las siguientes actividades:
  1. Prácticas individuales a desarrollar en los laboratorios frente al ordenador y/o online a través del campus virtual.
  2. Proyectos prácticos de análisis y visualización de datos.
Todas las actividades de la evaluación continua tienen carácter obligatorio.

Evaluación única.-

Consistirá en la entrega y defensa oral de los proyectos y en la realización o entrega de las prácticas individuales anteriores en las fechas establecidas para ello por la Universidad de La Laguna y la Escuela Superior de Ingeniería y Tecnología.

Si el alumnado así lo manifiesta, se trasladará la calificación de las actividades obligatorias que haya superado en la evaluación continua a la evaluación única. En ningún caso, existe la posibilidad de presentarse a una actividad obligatoria ya aprobada para subir nota. Tampoco se mantendrá la calificación obtenida en las diferentes pruebas evaluativas de un curso al siguiente.

El software utilizado en las prácticas de laboratorio, así como los manuales y tutoriales que usarán los alumnos para el desarrollo de las mismas, están documentados en inglés. Se evaluará la comprensión de los mismos en la calificación del proyecto y de los ejercicios teórico prácticos.

La ponderación de las actividades en la calificación final será de 50% proyectos de análisis y visualización de datos y 50% prácticas individuales. Debe superarse cada actividad por separado para superar la asignatura.

Estrategia Evaluativa

Tipo de prueba Competencias Criterios Ponderación
Trabajos y proyectos [TI_9], [TI_7], [SL3], [CO8], [CO7], [CO4], [CO3], [CO1] Memoria

• Estructura, calidad y claridad de la redacción, fuentes consultadas, rigor en el análisis de los datos y coherencia de las conclusiones.

Análisis y visualización de datos

• Grado de conocimiento adquirido en el manejo de las herramientas para el tratamiento y la visualización de datos.
• Rigor en el análisis y visualización de los datos y coherencia de las conclusiones.
50,00 %
Informes memorias de prácticas [TI_9], [CO7], [CO3] • Pertinencia de las herramientas usadas para el análisis y la visualización de los datos.

• Adecuación de las respuestas dadas a las prácticas y claridad de redacción de las mismas.
 
50,00 %
10. Resultados de Aprendizaje
El alumnado se familiarizará con los conceptos fundamentales de administración y análisis de datos a gran escala. Será capaz de reconocer los desafíos a los que se enfrentan las aplicaciones que tratan con volúmenes muy grandes de datos, así como de proponer soluciones escalables para ellos. Además, será capaz de integrar las tecnologías para la gestión de datos a gran escala en contextos más amplios y multidisciplinares.
11. Cronograma / calendario de la asignatura

Descripción

 -El cronograma que se presenta a continuación describe las actividades que se van a desarrollar durante el cuatrimestre en elque se imparte la asignatura. Sin embargo, esta planificación puede ser modificada si así lo demanda el desarrollo de la asignatura.

En dicho cronograma se presentan actividades que son presenciales (A) y otras que se desarrollan de forma online utilizando las herramientas TIC disponibles. Dentro de estas actividades "online" , se indicará con "C" aquellas actividades online asíncronas y con "B", aquellas que sean síncronas.

Debido al carácter semipresencial del máster habrá semanas en las que las clases prácticas, trabajos y proyectos se desarrollarán en formato no-presencial según lo dispuesto en el horario de clases del máster.

Segundo cuatrimestre

Semana Temas Actividades de enseñanza aprendizaje Horas de trabajo presencial Horas de trabajo autónomo Total
Semana 1: Introducción al análisis de datos masivos Clase teórica. Laboratorio online (C) 1.00 8.00 9.00
Semana 2: Modelos de clasificación Clase teórica. Laboratorio presencial (A) 2.00 7.00 9.00
Semana 3: Modelos de clasificación Clase teórica. Laboratorio online (B) 2.00 7.00 9.00
Semana 4: Modelos de agrupamiento Clase teórica. Laboratorio online (C) 2.00 8.00 10.00
Semana 5: Modelos de agrupamiento Clase teórica. Laboratorio presencial (A) 2.00 8.00 10.00
Semana 6: Reglas de asociación Clase teórica. Laboratorio online (B) 2.00 7.00 9.00
Semana 7: Detección de anomalías Clase teórica. Laboratorio online (C) 2.00 7.00 9.00
Semana 8: Gestión de datos a gran escala: el paradigma Map-Reduce Clase teórica. Laboratorio presencial (A) 1.00 8.00 9.00
Semana 9: Sistemas de soporte a la gestión de datos a gran escala Clase teórica. Laboratorio online (B) 2.00 7.00 9.00
Semana 10: Sistemas de soporte a la gestión de datos a gran escala Clase teórica. Laboratorio online (C) 2.00 8.00 10.00
Semana 11: Técnicas y herramientas para la visualización de datos Clase teórica. Laboratorio presencial (A) 2.00 7.00 9.00
Semana 12: Técnicas y herramientas para la visualización de datos Clase teórica. Laboratorio online (B) 2.00 8.00 10.00
Semana 13: Técnicas y herramientas para la visualización de datos Clase teórica. Laboratorio online (C) 2.00 7.00 9.00
Semana 14: Herramientas basadas en software libre para el análisis de datos masivos Clase teórica. Laboratorio presencial (A) 2.00 8.00 10.00
Semana 15: Herramientas basadas en software libre para el análisis de datos masivos  Clase teórica. Laboratorio online (B) 2.00 7.00 9.00
Semana 16 a 18: Evaluación 2.00 8.00 10.00
Total 30.00 120.00 150.00
Fecha de última modificación: 20-06-2023
Fecha de aprobación: 10-07-2023