Contenidos teóricos y prácticos de la asignatura
- Contenidos Teóricos:
1. Introducción
Visión biológica. Niveles de la visión. Problemas inversos. Prerrequisitos. Taxonomía de métodos. Estado actual. Límites: Reconstrucción 3D del entorno, Imagen integral, e Inteligencia artificial.
2. Visión Artificial: Formación de imagen
Perspectiva y puntos de fuga. Cámara estenopeica. Límite de difracción. Leyes de Snell y lente delgada. Distancia focal, distancia de enfoque y profundidad de campo. Tamaño del sensor y SNR - Sensibilidad (ISO). Exposición. Velocidad de obturación y desenfoque de movimiento. Abertura. Tipos de cámaras y lentes objetivos. Distorsión radial, viñeteo y aberraciones cromáticas. Medida de la nitidez: MTF.
3.Visión Artificial: Luz y color
Ondas: frecuencia y longitud. Radiometría y reflectancia, BRDF. Espectros de fuentes. Bastones y conos. Color triestímulo y metamerismmo. Teoría tricromática. Color en cámaras: Bayer y Foveon. Espacios de color. CIE: xy, XYZ, l*a*b*. HSL, HSV, YCbCr, YUV. Submuestreo de crominancia. Rango dinámico. No linealidades: curvas de gamma. Mapeo de tono
4. Infraestructura Operacional en Procesamiento de Imágenes
Operaciones de punto y operaciones locales. Histogramas: ajuste, ecualización global y ec. adaptativa. Filtrado lineal. Efectos en los bordes. Filtro de desenfoque, de realce, mediana y bilateral. Concatenación y resta de filtros. Coste computacional de filtros. Filtros separables y filtros deslizantes. Bancos de filtros y filtros orientables. Convolución y dominio frecuencial. Tabla de áreas sumadas (SAT). Operaciones morfológicas. Medidas de distancia. Distancia geodésica.
5. Operaciones Básicas de Procesamiento de Imágenes: Transformaciones de dominio
Concepto de transformada: espacios de partida y llegada. Álgebra vectorial: espacios generadores y base canónica. Normas. Producto interior y ángulo entre vectores. Ortogonalidad y ortonormalidad. Señales sinusoidales. Fórmula de Euler. Simetría par e impar. Transformada discreta de Fourier. Transformada rápida de Fourier en una y dos dimensiones. Transformada discreta de cosenos. Trasformada corta de Fourier y transformada Wavelet. Haar, algoritmo en cascada y Wavelet 2D. Denoising: umbralizado suave y duro. Compresión perceptual. El formato JPEG: cuantización, Huffmann y RLE. Vídeo: conceptos básicos.
6. Operaciones geométricas
Cambios en la indexación vs cambios en los valores. Mapeos lineales. Mapeos afines. Álgebra matricial. Invariantes. Rotaciones en 2D y 3D. Escalado en N-dimensiones. Cizallado. Traslaciones y afinidad. Coordenadas homogéneas. Tratamiento matricial de vectores. Proyección perspectiva en coordenadas homogéneas. Orden de aplicación de las operaciones.
7. Operaciones Básicas de Procesamiento de Imágenes: Muestreo y cuantización
Cuantización. Consulta de valores no muestrados. Interpolación al vecino más cercano. Interpolación lineal. Filtrado pasabaja ideal. Aproximaciones: bilineal, bicúbica, K-B, C-R. Límite de Nyquist. Aliasing. Filtro Anti Antialiasing. Downsampling y decimación. Upsampling e interpolación. Filtros polifásicos.
8. Operaciones Básicas de Procesamiento de Imágenes: Procesamiento a múltiples escalas
Pirámides de imágenes gausianas. Pirámides de imágenes laplacianas. Aplicación: image blending.
9. Detección de bordes: Emparejamiento de plantillas
Auto-correlación. Detección de señales usando el producto interno. Filtros emparejados. Filtrado en frecuencia, convolución lineal y circular. Importancia de la normalización y eliminación de la componente continua. Suma de diferencias al cuadrado. Correlación cruzada normalizada. Correlación cruzada normalizada rápida mediante SAT.
10. Detección de bordes: líneas y esquinas
Detección de bordes. Uso de derivadas para detectar discontinuidades. Diferencia de gausianas. Filtros de Sobel, Prewitt, Scharr y Roberts. Gradientes bidimensionales. Laplaciana de gausianas. Detector de bordes de Canny. Detector de líneas: transformadas de Radon y Hough. Detector de esquinas de Harry. Supresión de no-máximos locales.
11. Detección de bordes: Emparejamiento de características
Invarianza a la escala. Harris multiescala. Descriptores de regiones. Invarianza a la rotación. Histogramas por subregiones. SIFT: scale invariant feature transform. Otros descriptores: SURF, HoG, FREAK. Emparejamiento de características: distancias y ambigüedades. Outliers y regresión robusta: el método RANSAC. Aplicación: panoramas mediante image stitching. Transformaciones homográficas y grados de libertad de las matrices. Minimización de error en sistemas de ec. sobredeterminados. Formulación en mínimos cuadrados. Seguimiento de características en vídeo.
12. Infraestructura Operacional: Estereovisión y geometría epipolar
Parámetros intrínsecos de cámara: recordatorio. Parámetros de distorsión radial. Parámetros extrínsecos: determinación de la pose. Calibración de cámaras. Disparidades: estereogramas. Geometría de un sistema estéreo simple: triangulación. Búsqueda de correspondencias en estereo paralelo. Estéreo convergente: geometría epipolar. Tamaño de la ventana en emparejamiento estéreo. Tratamiento de las oclusiones y relleno de huecos.
- Contenidos Prácticos:
Práctica 0, no evaluable: introducción a Matlab. Manipulación de imágenes mediante histograma.
Práctica 1: Programación y análisis de rendimiento de filtros bidimensionales
Práctica 2: Emparejamiento de características
Práctica 3: Seguimiento de un objeto en vídeo
1. Introducción
Visión biológica. Niveles de la visión. Problemas inversos. Prerrequisitos. Taxonomía de métodos. Estado actual. Límites: Reconstrucción 3D del entorno, Imagen integral, e Inteligencia artificial.
2. Visión Artificial: Formación de imagen
Perspectiva y puntos de fuga. Cámara estenopeica. Límite de difracción. Leyes de Snell y lente delgada. Distancia focal, distancia de enfoque y profundidad de campo. Tamaño del sensor y SNR - Sensibilidad (ISO). Exposición. Velocidad de obturación y desenfoque de movimiento. Abertura. Tipos de cámaras y lentes objetivos. Distorsión radial, viñeteo y aberraciones cromáticas. Medida de la nitidez: MTF.
3.Visión Artificial: Luz y color
Ondas: frecuencia y longitud. Radiometría y reflectancia, BRDF. Espectros de fuentes. Bastones y conos. Color triestímulo y metamerismmo. Teoría tricromática. Color en cámaras: Bayer y Foveon. Espacios de color. CIE: xy, XYZ, l*a*b*. HSL, HSV, YCbCr, YUV. Submuestreo de crominancia. Rango dinámico. No linealidades: curvas de gamma. Mapeo de tono
4. Infraestructura Operacional en Procesamiento de Imágenes
Operaciones de punto y operaciones locales. Histogramas: ajuste, ecualización global y ec. adaptativa. Filtrado lineal. Efectos en los bordes. Filtro de desenfoque, de realce, mediana y bilateral. Concatenación y resta de filtros. Coste computacional de filtros. Filtros separables y filtros deslizantes. Bancos de filtros y filtros orientables. Convolución y dominio frecuencial. Tabla de áreas sumadas (SAT). Operaciones morfológicas. Medidas de distancia. Distancia geodésica.
5. Operaciones Básicas de Procesamiento de Imágenes: Transformaciones de dominio
Concepto de transformada: espacios de partida y llegada. Álgebra vectorial: espacios generadores y base canónica. Normas. Producto interior y ángulo entre vectores. Ortogonalidad y ortonormalidad. Señales sinusoidales. Fórmula de Euler. Simetría par e impar. Transformada discreta de Fourier. Transformada rápida de Fourier en una y dos dimensiones. Transformada discreta de cosenos. Trasformada corta de Fourier y transformada Wavelet. Haar, algoritmo en cascada y Wavelet 2D. Denoising: umbralizado suave y duro. Compresión perceptual. El formato JPEG: cuantización, Huffmann y RLE. Vídeo: conceptos básicos.
6. Operaciones geométricas
Cambios en la indexación vs cambios en los valores. Mapeos lineales. Mapeos afines. Álgebra matricial. Invariantes. Rotaciones en 2D y 3D. Escalado en N-dimensiones. Cizallado. Traslaciones y afinidad. Coordenadas homogéneas. Tratamiento matricial de vectores. Proyección perspectiva en coordenadas homogéneas. Orden de aplicación de las operaciones.
7. Operaciones Básicas de Procesamiento de Imágenes: Muestreo y cuantización
Cuantización. Consulta de valores no muestrados. Interpolación al vecino más cercano. Interpolación lineal. Filtrado pasabaja ideal. Aproximaciones: bilineal, bicúbica, K-B, C-R. Límite de Nyquist. Aliasing. Filtro Anti Antialiasing. Downsampling y decimación. Upsampling e interpolación. Filtros polifásicos.
8. Operaciones Básicas de Procesamiento de Imágenes: Procesamiento a múltiples escalas
Pirámides de imágenes gausianas. Pirámides de imágenes laplacianas. Aplicación: image blending.
9. Detección de bordes: Emparejamiento de plantillas
Auto-correlación. Detección de señales usando el producto interno. Filtros emparejados. Filtrado en frecuencia, convolución lineal y circular. Importancia de la normalización y eliminación de la componente continua. Suma de diferencias al cuadrado. Correlación cruzada normalizada. Correlación cruzada normalizada rápida mediante SAT.
10. Detección de bordes: líneas y esquinas
Detección de bordes. Uso de derivadas para detectar discontinuidades. Diferencia de gausianas. Filtros de Sobel, Prewitt, Scharr y Roberts. Gradientes bidimensionales. Laplaciana de gausianas. Detector de bordes de Canny. Detector de líneas: transformadas de Radon y Hough. Detector de esquinas de Harry. Supresión de no-máximos locales.
11. Detección de bordes: Emparejamiento de características
Invarianza a la escala. Harris multiescala. Descriptores de regiones. Invarianza a la rotación. Histogramas por subregiones. SIFT: scale invariant feature transform. Otros descriptores: SURF, HoG, FREAK. Emparejamiento de características: distancias y ambigüedades. Outliers y regresión robusta: el método RANSAC. Aplicación: panoramas mediante image stitching. Transformaciones homográficas y grados de libertad de las matrices. Minimización de error en sistemas de ec. sobredeterminados. Formulación en mínimos cuadrados. Seguimiento de características en vídeo.
12. Infraestructura Operacional: Estereovisión y geometría epipolar
Parámetros intrínsecos de cámara: recordatorio. Parámetros de distorsión radial. Parámetros extrínsecos: determinación de la pose. Calibración de cámaras. Disparidades: estereogramas. Geometría de un sistema estéreo simple: triangulación. Búsqueda de correspondencias en estereo paralelo. Estéreo convergente: geometría epipolar. Tamaño de la ventana en emparejamiento estéreo. Tratamiento de las oclusiones y relleno de huecos.
- Contenidos Prácticos:
Práctica 0, no evaluable: introducción a Matlab. Manipulación de imágenes mediante histograma.
Práctica 1: Programación y análisis de rendimiento de filtros bidimensionales
Práctica 2: Emparejamiento de características
Práctica 3: Seguimiento de un objeto en vídeo
Actividades a desarrollar en otro idioma
La mayoría del material de estudio y la principal referencia bibliográfica están en inglés. La fase de recopilación de información para el tercer entregable exige del alumnado manejo fluido de documentación en idioma inglés.