Sistema de reconocimiento facial y clustering de imágenes con CNN, Viola-Jones y HOG
Nombre del proyecto: AI Cluster & Recognition
Descripción: Sistema de reconocimiento facial y clustering de imágenes con CNN, Viola-Jones y HOG.
Tipo: Proyecto personal
Rol: Desarrollador de IA
Fecha: Abril 2024 - Abril 2026
Tecnologías Usadas: Python, Flask, TensorFlow, Keras, OpenCV, Hugging Face
Probar Herramienta Ver CódigoEl análisis manual de grandes colecciones de imágenes para identificar y agrupar personas es una tarea ineficiente y propensa a errores. El desafío principal fue construir un sistema capaz de detectar rostros con precisión y, más importante aún, "entender" las similitudes biométricas para organizar automáticamente a los individuos sin etiquetas previas.
El objetivo fue implementar un pipeline de Visión Artificial y Aprendizaje No Supervisado que no solo localizara caras en una escena, sino que fuera capaz de extraer representaciones matemáticas únicas (embeddings) para realizar un clustering eficiente.
El flujo de trabajo comienza con la ingesta de archivos multimedia y un preprocesamiento de imagen para optimizar la iluminación y el enfoque. Implementamos una etapa de Alineación Facial para normalizar la posición de los ojos y la nariz, garantizando que el modelo de extracción se centre exclusivamente en los rasgos distintivos.
Para la generación de descriptores, utilizamos redes neuronales profundas que transforman cada rostro en vectores de alta dimensionalidad. Estos embeddings capturan la esencia biométrica, permitiendo que rostros de la misma persona queden representados en puntos cercanos dentro de un espacio vectorial multidimensional.
La arquitectura final integra la detección robusta con algoritmos de agrupamiento inteligente:
Implementación de redes neuronales convolucionales para clasificar expresiones faciales en tiempo real (felicidad, tristeza, enojo, etc.), aportando una capa de datos psicológicos al análisis.
Evaluación comparativa entre distintos algoritmos como DBSCAN (detección de ruido), K-Means y Agglomerative Clustering para encontrar la mejor agrupación por identidad.
Entorno de pruebas diseñado para ajustar hiperparámetros críticos como el threshold de distancia y el número mínimo de muestras, garantizando la máxima precisión biométrica.
Uso de modelos pre-entrenados de vanguardia para transformar imágenes en vectores numéricos robustos, resistentes a cambios de iluminación y variaciones de pose.