Contenidos teóricos y prácticos de la asignatura
- Contenidos Teóricos:
1. Introducción
Visión biológica. Niveles de la visión. Problemas inversos. Prerrequisitos. Taxonomía de métodos. Estado actual. Límites: Reconstrucción 3D del entorno, Imagen integral, e Inteligencia artificial.
2. Formación de imagen
Perspectiva y puntos de fuga. Cámara estenopeica. Límite de difracción. Leyes de Snell y lente delgada. Distancia focal, distancia de enfoque y profundidad de campo. Tamaño del sensor y SNR - Sensibilidad (ISO). Exposición. Velocidad de obturación y desenfoque de movimiento. Abertura. Tipos de cámaras y lentes objetivos. Distorsión radial, viñeteo y aberraciones cromáticas. Medida de la nitidez: MTF.
3.Luz y color
Ondas: frecuencia y longitud. Radiometría y reflectancia, BRDF. Espectros de fuentes. Bastones y conos. Color triestímulo y metamerismmo. Teoría tricromática. Color en cámaras: Bayer y Foveon. Espacios de color. CIE: xy, XYZ, l*a*b*. HSL, HSV, YCbCr, YUV. Submuestreo de crominancia. Rango dinámico. No linealidades: curvas de gamma. Mapeo de tono
4. Métodos básicos de procesado de imagen
Operaciones de punto y operaciones locales. Histogramas: ajuste, ecualización global y ec. adaptativa. Filtrado lineal. Efectos en los bordes. Filtro de desenfoque, de realce, mediana y bilateral. Concatenación y resta de filtros. Coste computacional de filtros. Filtros separables y filtros deslizantes. Bancos de filtros y filtros orientables. Convolución y dominio frecuencial. Tabla de áreas sumadas (SAT). Operaciones morfológicas. Medidas de distancia. Distancia geodésica.
5. Transformaciones de dominio
Concepto de transformada: espacios de partida y llegada. Álgebra vectorial: espacios generadores y base canónica. Normas. Producto interior y ángulo entre vectores. Ortogonalidad y ortonormalidad. Señales sinusoidales. Fórmula de Euler. Simetría par e impar. Transformada discreta de Fourier. Transformada rápida de Fourier en una y dos dimensiones. Transformada discreta de cosenos. Trasformada corta de Fourier y transformada Wavelet. Haar, algoritmo en cascada y Wavelet 2D. Denoising: umbralizado suave y duro. Compresión perceptual. El formato JPEG: cuantización, Huffmann y RLE. Vídeo: conceptos básicos.
6. Transformaciones geométricas
Cambios en la indexación vs cambios en los valores. Mapeos lineales. Mapeos afines. Álgebra matricial. Invariantes. Rotaciones en 2D y 3D. Escalado en N-dimensiones. Cizallado. Traslaciones y afinidad. Coordenadas homogéneas. Tratamiento matricial de vectores. Proyección perspectiva en coordenadas homogéneas. Orden de aplicación de las operaciones.
7. Muestreo y cuantización
Cuantización. Consulta de valores no muestrados. Interpolación al vecino más cercano. Interpolación lineal. Filtrado pasabaja ideal. Aproximaciones: bilineal, bicúbica, K-B, C-R. Límite de Nyquist. Aliasing. Filtro AA. Downsampling y decimación. Upsampling e interpolación. Filtros polifásicos.
8. Procesamiento a múltiples escalas
Pirámides de imágenes gausianas. Pirámides de imágenes laplacianas. Aplicación: image blending.
9. Emparejamiento de plantillas
Auto-correlación. Detección de señales usando el producto interno. Filtros emparejados. Filtrado en frecuencia, convolución lineal y circular. Importancia de la normalización y elminación de la componente continua. Suma de diferencias al cuadrado. Correlación cruzada normalizada. Correlación cruzada normalizada rápida mediante SAT.
10. Detector de líneas, bordes y esquinas
Detección de bordes. Uso de derivadas para detectar discontinuidades. Diferencia de gausianas. Filtros de Sobel, Prewitt, Scharr y Roberts. Gradientes bidimensionales. Laplaciana de gausianas. Detector de bordes de Canny. Detector de líneas: transformadas de Radon y Hough. Detector de esquinas de Harry. Supresión de no máximos locales.
11. Emparejamiento de características
Invarianza a la escala. Harris + pirámides de imagen: Harris multiescala. Descriptores de regiones. Invarianza a la rotación. Histogramas por subregiones. SIFT: scale invariant feature transform. Otros descriptores: SURG, HoG, FREAK. Emparejamiento de características: distancias y ambigüedades. Outliers y regresión robusta: el método RANSAC. Aplicación: panoramas mediante image stitching. Transformaciones homográficas y grados de libertad de las matrices. Minimización de error en sistemas de ec. sobredeterminados. Formulación en mínimos cuadrados. Seguimiento de características en vídeo.
12. Estereovisión y gerometría epipolar
Parámetros intrínsecos de cámara: recordatorio. Parámetros de distorsión radial. Parámetros extrínsecos: determinación de la pose. Calibración de cámaras. Disparidades: estereogramas. Geometría de un sistema estéreo simple: triangulación. Búsqueda de correspondencias en estereo paralelo. Estéreo convergente: geometría epipolar. Tamaño de la ventana en emparejamiento estéreo. Tratamiento de las oclusiones y relleno de huecos.
- Contenidos Prácticos:
Práctica 0, no evaluable: introducción a Matlab. Manipulación de imágenes mediante histograma.
Práctica 1: Programación y análisis de rendimiento de filtros bidimensionales
Práctica 2: Emparejamiento de características
Práctica 3: Seguimiento de un objeto en vídeo
1. Introducción
Visión biológica. Niveles de la visión. Problemas inversos. Prerrequisitos. Taxonomía de métodos. Estado actual. Límites: Reconstrucción 3D del entorno, Imagen integral, e Inteligencia artificial.
2. Formación de imagen
Perspectiva y puntos de fuga. Cámara estenopeica. Límite de difracción. Leyes de Snell y lente delgada. Distancia focal, distancia de enfoque y profundidad de campo. Tamaño del sensor y SNR - Sensibilidad (ISO). Exposición. Velocidad de obturación y desenfoque de movimiento. Abertura. Tipos de cámaras y lentes objetivos. Distorsión radial, viñeteo y aberraciones cromáticas. Medida de la nitidez: MTF.
3.Luz y color
Ondas: frecuencia y longitud. Radiometría y reflectancia, BRDF. Espectros de fuentes. Bastones y conos. Color triestímulo y metamerismmo. Teoría tricromática. Color en cámaras: Bayer y Foveon. Espacios de color. CIE: xy, XYZ, l*a*b*. HSL, HSV, YCbCr, YUV. Submuestreo de crominancia. Rango dinámico. No linealidades: curvas de gamma. Mapeo de tono
4. Métodos básicos de procesado de imagen
Operaciones de punto y operaciones locales. Histogramas: ajuste, ecualización global y ec. adaptativa. Filtrado lineal. Efectos en los bordes. Filtro de desenfoque, de realce, mediana y bilateral. Concatenación y resta de filtros. Coste computacional de filtros. Filtros separables y filtros deslizantes. Bancos de filtros y filtros orientables. Convolución y dominio frecuencial. Tabla de áreas sumadas (SAT). Operaciones morfológicas. Medidas de distancia. Distancia geodésica.
5. Transformaciones de dominio
Concepto de transformada: espacios de partida y llegada. Álgebra vectorial: espacios generadores y base canónica. Normas. Producto interior y ángulo entre vectores. Ortogonalidad y ortonormalidad. Señales sinusoidales. Fórmula de Euler. Simetría par e impar. Transformada discreta de Fourier. Transformada rápida de Fourier en una y dos dimensiones. Transformada discreta de cosenos. Trasformada corta de Fourier y transformada Wavelet. Haar, algoritmo en cascada y Wavelet 2D. Denoising: umbralizado suave y duro. Compresión perceptual. El formato JPEG: cuantización, Huffmann y RLE. Vídeo: conceptos básicos.
6. Transformaciones geométricas
Cambios en la indexación vs cambios en los valores. Mapeos lineales. Mapeos afines. Álgebra matricial. Invariantes. Rotaciones en 2D y 3D. Escalado en N-dimensiones. Cizallado. Traslaciones y afinidad. Coordenadas homogéneas. Tratamiento matricial de vectores. Proyección perspectiva en coordenadas homogéneas. Orden de aplicación de las operaciones.
7. Muestreo y cuantización
Cuantización. Consulta de valores no muestrados. Interpolación al vecino más cercano. Interpolación lineal. Filtrado pasabaja ideal. Aproximaciones: bilineal, bicúbica, K-B, C-R. Límite de Nyquist. Aliasing. Filtro AA. Downsampling y decimación. Upsampling e interpolación. Filtros polifásicos.
8. Procesamiento a múltiples escalas
Pirámides de imágenes gausianas. Pirámides de imágenes laplacianas. Aplicación: image blending.
9. Emparejamiento de plantillas
Auto-correlación. Detección de señales usando el producto interno. Filtros emparejados. Filtrado en frecuencia, convolución lineal y circular. Importancia de la normalización y elminación de la componente continua. Suma de diferencias al cuadrado. Correlación cruzada normalizada. Correlación cruzada normalizada rápida mediante SAT.
10. Detector de líneas, bordes y esquinas
Detección de bordes. Uso de derivadas para detectar discontinuidades. Diferencia de gausianas. Filtros de Sobel, Prewitt, Scharr y Roberts. Gradientes bidimensionales. Laplaciana de gausianas. Detector de bordes de Canny. Detector de líneas: transformadas de Radon y Hough. Detector de esquinas de Harry. Supresión de no máximos locales.
11. Emparejamiento de características
Invarianza a la escala. Harris + pirámides de imagen: Harris multiescala. Descriptores de regiones. Invarianza a la rotación. Histogramas por subregiones. SIFT: scale invariant feature transform. Otros descriptores: SURG, HoG, FREAK. Emparejamiento de características: distancias y ambigüedades. Outliers y regresión robusta: el método RANSAC. Aplicación: panoramas mediante image stitching. Transformaciones homográficas y grados de libertad de las matrices. Minimización de error en sistemas de ec. sobredeterminados. Formulación en mínimos cuadrados. Seguimiento de características en vídeo.
12. Estereovisión y gerometría epipolar
Parámetros intrínsecos de cámara: recordatorio. Parámetros de distorsión radial. Parámetros extrínsecos: determinación de la pose. Calibración de cámaras. Disparidades: estereogramas. Geometría de un sistema estéreo simple: triangulación. Búsqueda de correspondencias en estereo paralelo. Estéreo convergente: geometría epipolar. Tamaño de la ventana en emparejamiento estéreo. Tratamiento de las oclusiones y relleno de huecos.
- Contenidos Prácticos:
Práctica 0, no evaluable: introducción a Matlab. Manipulación de imágenes mediante histograma.
Práctica 1: Programación y análisis de rendimiento de filtros bidimensionales
Práctica 2: Emparejamiento de características
Práctica 3: Seguimiento de un objeto en vídeo
Actividades a desarrollar en otro idioma
La mayoría del material de estudio se presenta en inglés. La fase de recopilación de información para el tercer entregable exige del alumnado manejo fluido de documentación en idioma inglés.