Preprocesado de Datos
(Curso Académico 2024 - 2025)
Mostrar Todo


Nota informativa: Atendiendo a la normativa de Protección de Datos y propiedad intelectual en la que se limita la publicación de imágenes de terceras personas sin su consentimiento, aquellos que difundan grabaciones de las sesiones de clase sin previo consentimiento de las personas implicadas, serán responsables ante la ley del uso prohibido de las citadas grabaciones.



1. Datos descriptivos de la asignatura
  • Código: 835870904
  • Centro: Escuela de Doctorado y Estudios de Postgrado
  • Lugar de impartición: -
  • Titulación: Máster Universitario en Ciberseguridad e Inteligencia de Datos
  • Plan de Estudios: 2018 (publicado en 19-09-2018)
  • Rama de conocimiento: Ingeniería y Arquitectura
  • Itinerario/Intensificación:
  • Departamento/s:
  • Área/s de conocimiento:
    • Estadística e Investigación Operativa
  • Curso: 1
  • Carácter:
  • Duración: Primer cuatrimestre
  • Créditos ECTS: 3,0
  • Modalidad de impartición: Semipresencial
  • Horario: Ver horario
  • Dirección web de la asignatura: Ver web de la asignatura
  • Idioma: Castellano e Inglés (0,15 ECTS en Inglés)
2. Requisitos de matrícula y calificación
3. Profesorado que imparte la asignatura

Profesor/a Coordinador/a: CARLOS PEREZ GONZALEZ

General:
Nombre:
CARLOS
Apellido:
PEREZ GONZALEZ
Departamento:
Matemáticas, Estadística e Investigación Operativa
Área de conocimiento:
Estadística e Investigación Operativa
Grupo:
Contacto:
Teléfono 1:
922318094
Teléfono 2:
Correo electrónico:
cpgonzal@ull.es
Correo alternativo:
Tutorías primer cuatrimestre:
DesdeHastaDíaHora incialHora finalLocalizaciónPlantaDespacho
Todo el cuatrimestre Martes 16:00 19:00 Edificio de Física y Matemáticas - AN.2B Pasillo Estadística e Investigación Operativa Despacho 82
Todo el cuatrimestre Jueves 16:00 19:00 Edificio de Física y Matemáticas - AN.2B Pasillo Estadística e Investigación Operativa Despacho 82
Observaciones: Las tutorías podrán variar dependiendo de la coincidencia con otras actividades académicas. El horario de tutorías se mantendrá actualizado en el aula virtual de la asignatura y los cambios en el mismo serán notificados a través de dicho medio. Asimismo, el profesor también podrá atender puntualmente sus tutorías: (a) presencialmente, en el despacho polivalente situado en la 2nda planta de la Torre Profesor Agustín Arévalo, despacho de la Unidad Mixta de Investigación, y (b) de forma online, utilizando Google Meet a través del enlace facilitado por el aula virtual. Por tanto, se ruega al alumnado que confirmen con antelación su asistencia a la tutoría (presencial u online) mediante correo electrónico.
Tutorías segundo cuatrimestre:
DesdeHastaDíaHora incialHora finalLocalizaciónPlantaDespacho
Todo el cuatrimestre Martes 16:00 19:00 Edificio de Física y Matemáticas - AN.2B Pasillo Estadística e Investigación Operativa Despacho 82
Todo el cuatrimestre Jueves 16:00 19:00 Edificio de Física y Matemáticas - AN.2B Pasillo Estadística e Investigación Operativa Despacho 82
Observaciones: Las tutorías podrán variar dependiendo de la coincidencia con otras actividades académicas. El horario de tutorías se mantendrá actualizado en el aula virtual de la asignatura y los cambios en el mismo serán notificados a través de dicho medio. Asimismo, el profesor también podrá atender puntualmente sus tutorías: (a) presencialmente, en el despacho polivalente situado en la 2nda planta de la Torre Profesor Agustín Arévalo, despacho de la Unidad Mixta de Investigación, y (b) de forma online, utilizando Google Meet a través del enlace facilitado por el aula virtual. Por tanto, se ruega al alumnado que confirmen con antelación su asistencia a la tutoría (presencial u online) mediante correo electrónico.
4. Contextualización de la asignatura en el plan de estudio
  • Bloque formativo al que pertenece la asignatura:
  • Perfil profesional:
5. Competencias

Generales

  • CG1 - Ser capaces de aplicar los conocimientos adquiridos para resolver problemas en entornos nuevos o poco conocidos dentro de contextos relacionados con seguridad informática o inteligencia de datos
  • CG3 - Mantener una actitud de permanente actualización, que les permita estudiar de manera autónoma mediante formación continua en su futuro desempeño profesional como expertos en seguridad informática e inteligencia de datos
  • CG7 - Desarrollar las capacidades de trabajo en equipo y las habilidades de comunicación para mantener relaciones con otros profesionales y con organizaciones relevantes
  • CG8 - Tener la capacidad analítica y de resolución para atender a los problemas reales de acuerdo con los valores éticos y sociales y con el máximo respeto a la legalidad vigente

Básicas

  • CB7 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio
  • CB8 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios
  • CB10 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo

Específicas

  • CE12 - Conocer los métodos y procedimientos par la preparación de conjuntos de datos para aplicar técnicas de análisis de forma adecuada
6. Contenidos de la asignatura

Contenidos teóricos y prácticos de la asignatura

  1. Preparación de datos (limpieza, transformación, normalización, imputación).
  2. Reducción de datos (selección de características, selección de instancias, discretización, análisis de componentes principales ...)
  3. Librerías y lenguajes de procesamiento de datos
    • Lenguaje R + Rstudio
    • Lenguaje Python+Jupyter

Actividades a desarrollar en otro idioma

En esta asignatura se impartirán 1,5 horas de clases en inglés.
En general, se trabajará preferentemente con bibliografía en inglés y el alumnado deberá ser capaz de extraer la información necesaria para seguir la asignatura a partir de dicha documentación, junto con los apuntes del profesorado.
Asimismo, el software utilizado en prácticas y los manuales de uso y ayuda estarán en dicho idioma.
7. Metodología y volumen de trabajo del estudiante

Descripción

La metodología docente de las clases teóricas consistirá en sesiones en las que el profesorado explicará los conceptos fundamentales de cada tema que deben ser asimilados por el alumnado, bien presencialmente, o no
presencialmente mediante retransmisión online, en directo usando videoconferencia o en diferido a través de grabaciones colgadas en el entorno virtual.
La metodología docente de las clases prácticas consistirá en sesiones supervisadas en grupos reducidos en el laboratorio en las que se realizarán diversas prácticas informáticas de dificultad creciente aplicando los conceptos expuestos en las clases de teoría. Además, el alumnado aprenderá a usar diversas herramientas, en entornos reales o de simulación, así como metodologías relacionadas con el contexto de la materia.
La metodología docente de los informes consistirá en el desarrollo por parte del alumnado de su capacidad para la aplicación de los conocimientos adquiridos y la resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios y multidisciplinares, siendo capaces de integrar estos conocimientos.
Las tutorías individuales ayudarán a reforzar los diferentes aspectos de la materia y ayudarán al alumnado en la comprensión de la teoría y la realización de las prácticas.

No se permitirá el uso de IA para superar las pruebas planteadas en la asignatura, pero sí se podrá usar en casos como los siguientes:
-Mejorar un texto redactado desde un punto de vista distinto que no haya tenido en cuenta (histórico, económico, legal, tecnológico, de perspectiva más amplia, etc.). 
-Revisar la redacción de un texto e indicar los puntos débiles o elementos de mejora que podría incorporarse.
-Mejorar el estilo de un texto.
-Recordar que la salida que se obtiene de la IA debe considerarse como un primer borrador sobre el que trabajar y se debe referenciar su uso.

Actividades formativas en créditos ECTS, su metodología de enseñanza-aprendizaje y su relación con las competencias que debe adquirir el estudiante

Actividades formativas Horas presenciales Horas de trabajo autónomo Total horas Relación con competencias
Clases teóricas 5,00 5,00 10,0 [CB8], [CG1], [CB10]
Clases prácticas (aula / sala de demostraciones / prácticas laboratorio) 8,00 8,00 16,0 [CG8], [CB8], [CE12], [CG1], [CB10]
Realización de seminarios u otras actividades complementarias 1,00 1,00 2,0 [CB10], [CG3]
Estudio/preparación de clases teóricas 0,00 10,00 10,0 [CB7], [CG3], [CB10]
Estudio/preparación de clases prácticas 0,00 6,00 6,0 [CB7], [CG3], [CE12], [CB10]
Realización de exámenes 1,00 0,00 1,0 [CB7], [CE12], [CG1]
Asistencia a tutorías 0,00 6,00 6,0 [CB7], [CB10]
Informes, trabajos y proyectos 0,00 24,00 24,0 [CE12], [CG1], [CB7], [CG7], [CG8], [CB8]
Total horas
Total ECTS
8. Bibliografía / Recursos

Bibliografía básica

Salvador García, Julián Luengo, Francisco Herrera - Data Preprocessing in Data Mining [BBTK]
Mark Lutz, David Ascher - Learning Python [BBTK]
Edwin de Jonge, Mark van der Loo - An introduction to data cleaning with R [Rproject]
Hadley Wickham and Garrett Grolemund - R for data science : Import, tidy, transform, visualize, and model data [BBTK]

Bibliografía complementaria

Otros recursos

9. Sistema de evaluación y calificación

Descripción

La evaluación de la asignatura se rige por el Reglamento de Evaluación y Calificación (REC) de la Universidad de La Laguna (aprobado el 21 de junio de 2022 y modificado el 13 de julio de 2022, 08 de noviembre de 2022 y 31 de mayo de 2022), además de por lo establecido en la Memoria de Verificación inicial o posteriores modificaciones. Dicha evaluación tendrá dos modalidades: por pruebas de evaluación continua o por evaluación única.

La nota obtenida por el alumnado en la evaluación continua se tendrá en cuenta tanto en la primera como en la segunda convocatoria, salvo quienes decidan optar a la modalidad de evaluación única. En caso de acudir a la segunda convocatoria, la calificación final del alumno tendrá en cuenta la evaluación del último llamamiento al que se haya presentado. Si el alumno concurre a una convocatoria extraordinaria, la modalidad será la de evaluación única.

El alumnado que se encuentre en la quinta o posteriores convocatorias y desee ser evaluado por un Tribunal, deberá presentar una solicitud a través del procedimiento habilitado en la sede electrónica, dirigida al director/a de la Escuela de Doctorado y Estudios de Posgrado. Dicha solicitud deberá realizarse con una antelación mínima de diez días hábiles al comienzo del periodo de exámenes.


Modalidad de evaluación continua:
La evaluación continua de la asignatura se llevará a cabo mediante la realización de un conjunto de actividades individuales y una prueba final. Las actividades individuales que los alumnos tendrán que llevar a cabo consistirán en la realización de cuestionarios, ejercicios y tareas entregables así como informes de prácticas. Los ejercicios serán calificados de 0-10 y
se aplicarán las siguientes ponderaciones en el cálculo de la nota por evaluación continua:
A: Prueba final (consistente en la presentación y exposición de un caso de estudio sobre un supuesto práctico el día de la convocatoria): 50% de la calificación final. Se trata de una prueba obligatoria de la evaluación continua y se considerará superada si se alcanza una nota superior a 3 sobre 10. En caso contrario, la calificación de la prueba será 0.
B: Cuestionarios de preguntas cortas: 15% de la calificación final. 
C: Informes de prácticas, tareas y ejercicios: 35% de la calificación final. 
La calificación final de la asignatura se calculará a partir de los pesos anteriores. Se deberá obtener una nota no inferior a 5 para superar la asignatura. En caso de no superación de la asignatura en la primera convocatoria, la calificación obtenida por el alumno en las actividades de los apartados B-C se conservará en la segunda convocatoria del curso académico (salvo renuncia del alumno para optar a evaluación única), permitiéndose la recuperación de la prueba final A en cualquiera de los llamamientos que el Centro ha destinado a la evaluación de la asignatura en dicha convocatoria. 
Con las excepciones previstas en el reglamento de evaluación, se considera que la convocatoria queda agotada una vez que el alumno se presente a las actividades de evaluación continua B-C, en cuyo caso se podrá calcular la calificación que se reflejará en el acta. En caso contrario, la calificación será de “No presentado”. 

Modalidad de evaluación única:
El estudiante podrá renunciar a la modalidad continua y optar a la evaluación única si no se ha presentado a las pruebas B-C de la evaluación continua. Para ello, los alumnos en dicha situación que deseen elegir esta modalidad deberán comunicarlo al profesor coordinador de la asignatura a través del procedimiento habilitado en el aula virtual de la asignatura antes de la finalización del periodo de docencia del cuatrimestre. Sólo por circunstancias sobrevenidas, y que se recogen en el reglamento de evaluación, se podrán admitir solicitudes una vez que el alumno se haya presentado a las actividades de evaluación continua especificadas anteriormente. En esta modalidad de evaluación el alumno deberá realizar las siguientes pruebas:
D: Prueba final (presentación y exposición de un caso de estudio sobre un supuesto práctico): 50% de la calificación final. Se trata de una prueba obligatoria de la evaluación única y se considerará superada si se alcanza una nota superior a 3 sobre 10. En caso contrario, la calificación de la prueba será 0.
E: Cuestionarios de preguntas cortas: 15% de la calificación final. 
F: Examen de prácticas basado en la resolución de un supuesto práctico: 35% de la calificación final. 
La realización de estas pruebas tendrá lugar en las fechas oficiales de las convocatorias del curso y la calificación se calculará a partir de estos pesos, debiendo obtener una nota no inferior a 5 para superar la asignatura. 


 

Estrategia Evaluativa

Tipo de prueba Competencias Criterios Ponderación
Pruebas de respuesta corta [CB7], [CB8], [CG1], [CB10] - Nivel de conocimientos adquiridos y nivel de comprensión alcanzado en la aplicación de los contenidos explicados.
- Adecuación a lo solicitado.
15,00 %
Trabajos y proyectos [CB10], [CG3], [CE12], [CG1], [CB8], [CG7], [CB7] - Calidad del trabajo desarrollado y concreción en la redacción
- Interés demostrado
- Adecuación a lo solicitado.
50,00 %
Informes memorias de prácticas [CB10], [CG3], [CG1], [CB7], [CG8], [CB8] - Nivel de comprensión alcanzado en la aplicación de los contenidos explicados así como la destreza técnica desarrollada durante las prácticas.
- Adecuación a lo solicitado.
35,00 %
10. Resultados de Aprendizaje
El alumnado debe ser capaz de identificar qué técnica de preparación de datos o reducción de la dimensionalidad aplicar para adaptar los datos a los algoritmos de análisis, aumentar la eficiencia y precisión de los mismos o mejorar la comprensión del modelo obtenido.
11. Cronograma / calendario de la asignatura

Descripción

Debido al carácter semipresencial del máster, está previsto que las clases presenciales se desarrollen de la forma siguiente:
El alumnado tendrá 3 horas diarias las semanas 1 a 5 del primer cuatrimestre.
Todas las asignaturas se desarrollarán en bimestres, y concretamente esta asignatura se impartirá en el bimestre 1. El siguiente cronograma recoge la distribución de actividades a modo orientativo. Se utilizará el aula virtual para informar del calendario de la asignatura y la distribución de las diferentes actividades presenciales programadas en la misma.

Primer cuatrimestre

Semana Temas Actividades de enseñanza aprendizaje Horas de trabajo presencial Horas de trabajo autónomo Total
Semana 1: Tema 1 Clases teóricas y prácticas 2.00 0.00 2.00
Semana 2: Tema 2 Clases teóricas y prácticas 3.00 7.00 10.00
Semana 3: Tema 3 Clases teóricas y prácticas 3.00 7.00 10.00
Semana 4: Tema 4 Clases teóricas y prácticas 3.00 7.00 10.00
Semana 5: Tema 5 Clases teóricas y prácticas 3.00 7.00 10.00
Semana 6: Temas 1 hasta 3 Actividades semipresenciales en el aula
virtual. Realización de cuestionarios on-line.
Videotutoriales y foro para la resolución de
dudas.
0.00 10.00 10.00
Semana 7: Tema 4 Actividades semipresenciales en el aula
virtual. Realización de cuestionarios on-line.
Videotutoriales y foro para la resolución de
dudas.
0.00 10.00 10.00
Semana 8: Tema 5 Actividades semipresenciales en el aula
virtual. Realización de cuestionarios on-line.
Videotutoriales y foro para la resolución de
dudas.
0.00 10.00 10.00
Semana 9: 0.00 0.00 0.00
Semana 10: 0.00 0.00 0.00
Semana 11: 0.00 0.00 0.00
Semana 12: 0.00 0.00 0.00
Semana 13: 0.00 0.00 0.00
Semana 14: 0.00 0.00 0.00
Semana 15 a 17: Evaluación y trabajo autónomo del alumno Evaluación y trabajo autónomo del alumno 1.00 2.00 3.00
Total 15.00 60.00 75.00
Fecha de última modificación: 17-06-2024
Fecha de aprobación: 28-06-2024