Competiciones en Visión por Computador

7 noviembre, 2016

En esta entrada os explicaremos el trabajo de la UOC en la organización de competiciones en Visión por Computador.  Hablar de qué es la Visión por Computador podría llenar varias entradas de este Blog, pero lo vamos a resumir en una frase simple: “Hacer que las máquinas vean”.  Si nos paramos a pensar un momento qué implica en el caso humano “ver”, nos daremos cuenta que la simplicidad del enunciado esconde un problema muy complejo, que incluye desde la mecánica del ojo, captando la luz y utilizando un sistema de lentes para enfocar y regular la cantidad de luz, hasta todas las partes de nuestro celebro que intervienen en obtener la información de esta luz  (reconocer objetos, personas, colores, formas, acciones, etc.).  En la categoría de Visión por Computador de este Blog podéis encontrar una introducción a la Visión por Computador, y algunas entradas con aplicaciones. El siguiente vídeo muestra información del Máster Interuniversitario en Visión por Computador (UAB, UOC, UPC, UPF).

 
En el caso que ocupa a esta entrada, nos centramos en una línea de aplicación de la Visión por Computador llamada “Looking at People” [1], y que podemos traducir como “Mirando a las personas”. Tal como el nombre sugiere, esta línea se dedica a analizar a las personas, y comprende desde tareas simples como detectar caras en una imagen o reconocer personas, hasta otras tareas más complejas como la detección de expresiones y emociones, el análisis de la comunicación no verbal y el comportamiento humano.

Para entender en qué consiste una competición y su utilidad, primero necesitamos explicar algunos conceptos asociados a  la investigación.  En un entorno tan globalizado como el de la investigación, es normal encontrar distintos grupos trabajando en el mismo tema en distintas partes del mundo. Para compartir los avances se organizan congresos de investigación en los distintos campos, y hay revistas científicas que publican los distintos avances. Para demostrar que tu método mejora los anteriores, la práctica habitual es utilizar bases de datos públicas que definen un problema determinado. Por ejemplo, si yo estoy desarrollando un método para reconocer personas, tendré muchas imágenes de personas con sus etiquetas (quien es la persona que aparece en cada imagen). Aplicaré mi método y podré saber en cuántas de estas imágenes soy capaz de reconocer correctamente la persona, y comparar con los otros métodos, sobre un problema común. De esta forma, se puede saber qué métodos existen para un problema (en este caso reconocer personas), cuales funcionan mejor, y sobre todo, cuan bien funcionan. Esto es lo que se conoce como “estado del arte” de un problema, o SOTA por su nombre en inglés (state-of-the-art).

Las competiciones son eventos abiertos especialmente a investigadores de todo el mundo cuya finalidad es avanzar en el estado del arte de un problema determinado. La mecánica es relativamente simple, primero se publican unos datos con sus respectivas etiquetas (Datos de Aprendizaje), de modo que los participantes pueden desarrollar sus métodos y modelos.

También se publica un conjunto de datos ciegos, o sea, sin sus etiquetas (Datos de Validación). Los participantes aplican sus métodos sobre los datos de validación y envían sus predicciones, las cuales se evalúan y los resultados se muestran en un tablón público. Al final de la competición, suele haber una última fase totalmente a ciegas, en la cual los participantes no ven ni los datos ni las etiquetas, y el resultado de esta última fase es la que da acceso a los premios de la competición.

Cuando una competición acaba, lo habitual es organizar unas jornadas de trabajo dentro de algún congreso internacional, en el que el ranquin de los distintos investigadores y equipos de investigación que han participado define un nuevo estado del arte sobre el problema propuesto. Además, se invita a que los investigadores que han participado compartan con el resto de los asistentes los métodos utilizados, conclusiones extraídas y en muchos casos mejoras sobre los datos utilizados durante la competición. La UOC lleva desde 2013 organizando eventos en el campo del “Looking at people”, en colaboración con Chalearn (una asociación americana sin ánimo de lucro que se dedica a la organización de competiciones científicas), el Centro de Visión por Computador, la UB y otras entidades. Todas las competiciones se realizan en una plataforma de código abierto llamada Codalab, creada y financiada por Microsoft.

 
Una de las cosas que hemos aprendido en estos años es que cuando se fomenta la cooperación, el avance en el estado del arte del problema mejora significativamente.  Una de las formas de cooperación más habitual es organizar distintas competiciones para el mismo problema, de forma que el intercambio de información que se produce al final de cada competición hace que los resultados de la siguiente sean mucho mejores.

Nuestro reto de futuro es fomentar las llamadas Coopeticiones (Cooperación + Competición), o sea, competiciones que fomenten la cooperación entre los distintos equipos que participan. Para que tengan éxito, se está aplicando teoría de juegos, buscando recompensas que premien no solo a los ganadores, sino también la aportación que se ha hecho al resultado final de otros participantes.

La publicación de esta entrada coincide con la publicación de un nuevo portal en el que se ha juntado toda la información sobre las competiciones actuales y pasadas, los congresos organizados y publicaciones científicas especializadas. Es un buen punto de inicio si queréis participar en alguna competición, proponer algún problema relacionado o simplemente curiosear.

[1] Thomas B. Moeslund, Adrian Hilton, Volker Krger, and Leonid Sigal. 2013. Visual Analysis of Humans: Looking at People. Springer Publishing Company, Incorporated.

Xavier Baró es ingeniero informático y doctor en informática. Es profesor de los Estudios de Informática, Multimedia y Telecomunicación de la UOC, donde coordina asignaturas de programación. Su actividad investigadora se centra en el ámbito del aprendizaje computacional y la visión por computador, con especial interés en la detección de patrones y el análisis del lenguaje no-verbal.

(Visited 31 times, 1 visits today)
Autor / Autora
Comentarios
Deja un comentario