El futuro de la conducción autónoma

La actualidad de la conducción autónoma viene marcada, sin lugar a duda, por el trágico accidente mortal que tuvo un modelo Tesla con el modo de conducción autónoma activado. Dicho accidente tuvo lugar el pasado 7 de mayo en Estados Unidos (aunque no se supo hasta el pasado 30 de junio) después de más de 210 millones de quilómetros recorridos por este modelo de coche. En esta entrada del blog no queremos entrar en el debate de quien es el culpable del accidente, sinó analizar la situación actual por la que pasa el sector de la automoción y qué problemas técnicos y éticos nos continuaremos encontrando en su desarrollo. En primer lugar, dejadme hacer una introducción al modelo de coche en cuestión. Se trata del Tesla Model S, que incluye un sistema de piloto automático desde octubre de 2014. Incluye un radar frontal, 12 sensores ultrasónicos que detectan objetos hasta 488 cm alrededor del coche en todas direcciones y velocidades, una cámara frontal y un sistema de asistencia a la frenada controlado digitalmente. El sistema permite: Mantenerse dentro de un carril Cambiar de carril activando el intermitente correspondiente Gestionar la velocidad leyendo las señales verticales de limitación de velocidad Mantener la velocidad y la distancia con el vehículo de delante Control de velocidad de crucero dependiente del tráfico Evitar choques frontales, laterales y salidas de la carretera dentro de lo posible Reducir la velocidad ante una posible colisión por alcance Cabe decir que la U.S. National Highway Traffic Safety Administration (NHTSA), la administración norteamericana para la seguridad vial, define 5 niveles de autonomía para vehículos: Nivel 0: El vehículo no dispone...

Transferencia del conocimiento: SpinUOC

En un entorno global tan competitivo como el actual, la necesidad de acercar el conocimiento generado en las universidades y centros de investigación al sector empresarial se convierte en un objetivo claro para el progreso social y económico de un país. Con este sentido, son clave tanto programas como “Indústria del Coneixement” ofrecido por la Generalitat de Catalunya para afoverecer el desarrollo de nuevas empresas de base científica (spin-offs) así como eventos promovidos por las propias universidades como el SpinUOC, en la que nos centraremos en este entrada del blog. El pasado jueves 16 de junio tuvo lugar la 4ª edición del SpinUOC, el evento del conocimiento transferible de la UOC que acerca soluciones innovadoras de la comunidad UOC al tejido socioeconómico. La realidad aumentada y virtual, aplicaciones móbiles en el ámbito social, el arte, la cultura y el ocio, el consumo colaborativo o los juegos formativos son algunos de los ámbitos temáticos de los proyectos de este año. A continuación, haremos un breve repaso a los 8 proyectos finalistas de esta edición: Artinpocket es una comunidad que promociona y vende arte accesible con un solo clic, con la misión de transformar y renovar el canal de proyección tradicional del arte y de fomentar y estimular su compra. Esta plataforma reúne la promoción del arte, de los artistas y de las galerías con un canal directo de venta y compra de obras de arte. eQuàliment es un proyecto de innovación social iniciado en 2011 en el contexto de la crisis económica para dar respuesta a las necesidades crecientes de distribución de alimentos solidarios a las familias en situación de pobreza. El proyecto ofrece una...

Un paso más de la inteligencia artificial en los videojuegos: AlphaGo (II)

Retomando lo que comentamos en la anterior entrada, nos quedamos discutiendo sobre que uno de los elementos que hacían de Go un juego más complejo que el ajedrez era un mayor branching factor (250 vs 35) además de un mayor número de turnos en la partida (200 vs 40). La mayor profundidad del árbol no es el problema esencial, ya que para el caso del ajedrez ya se usan funciones heurísticas para estimar en qué estado se encuentra una partida. Y es que el segundo elemento que hace de Go un juego más complejo es precisamente dificultad en definir una función heurística para este juego. Así como en el ajedrez tenemos una idea más o menos aproximada sobre como va una partida viendo qué piezas tiene aún en posesión cada jugador, en el Go la cosa no está tan clara. Es por este motivo que el equipo de AlphaGo decidió atacar este problema con una mezcla de técnicas de deep learning y el uso de árboles, tal y como se explicará a continuación. En una primera fase, se recopilaron más de 30 millones de movimientos procedentes de jugadores profesionales para entrenar una red neuronal que permitiera predecir el próximo movimiento a realizar. A partir de partidas reales, se trata de para cada estado de cualquier partida, almacenar el estado de la partida en cuestión y el movimiento que se decidió hacer en esa jugada, dando lugar al siguiente estado de la partida. De esta forma, se tiene una red neuronal cuya entrada de datos es un estado de la partida y cuya salida son los movimientos más probables. Pero...

Un paso más de la inteligencia artificial en los videojuegos: AlphaGo (I)

Cada vez más la inteligencia artificial se está abriendo paso en el mundo de los videojuegos, convertíendose en un elemento clave en el diseño de cualquier videojuego. La evolución de los algoritmos de aprendizaje, tales como las redes neuronales convolucionales, están permitiendo que se mejoren algoritmos clásicos como el reinforcement learning, que se basan en premiar las acciones que han dado un buen resultado, de forma que el jugador controlado por el ordenador se vaya aprendiendo automáticamente qué acciones le son más beneficiosas en el momento de tomar alguna decisión. La integración de las redes neuronales convolucionales con los algoritmos de reinforcement learning ha dado lugar a las técnicas que hoy en día se conocen como deep reinforcement learning. Prueba de la revolución que están suponiendo es la existencia de un equipo de Google llamado Google DeepMind, que tiene como objetivo construir algoritmos que son capaces de aprender por ellos mismos a partir de los datos originales. Una prueba de su éxito ha sido el desarrollo de AlphaGo, el primer programa informático que consigue derrotar un jugador de Go profesional. Lo hizo en Octubre de 2015 derrotando por 5-0 al campeón europeo Fan Hui y, más recientemente, en Marzo de 2016 derrotando por 4-1 a Lee Sedol, quien es considerado el mejor jugador del mundo. Y quizás os preguntaréis: ¿Qué tiene de especial el juego Go respecto otros juegos clásicos como el ajedrez en el que ya se había conseguido que un programa informático derrotara un jugador profesional? Pues bien, hay dos elementos diferenciales que hacen de Go un juego mucho más complejo que el ajedrez. En esta entrada nos...

La segmentación semántica y sus benchmarks

Relacionado con distintos problemas de la visión por computador que se han visto en previas entradas, tales como el reconocimiento de escenas y objetos, también existe el problema conocido como segmentación semántica. El problema de segmentación semántica consiste en otorgar una etiqueta o categoría a cada píxel de una imagen. A diferencia de los sistemas de detección y reconocimiento de objetos, que dan como resultado la ventana rectangular donde se ha detectado un objeto y son evaluados por la precisión de estas ventanas, los sistemas de segmentación semántica tienen como objetivo delimitar precisamente los objeto de las distintas categorías a nivel de píxel, dando como resultado cualquier forma arbitraria. Clasificación de imágenes Localización de objetos Segmentación semántica Dentro del campo de la visión por computador, ha habido un gran auge de las técnicas desarrolladas para solucionar el problema de la segmentación semántica, siendo PASCAL Visual Object Classes (VOC) Challenge [1] uno de los benchmarks más reconocido, contando con más de 2,500 citas. Inicialmente, esta competición únicamente evaluaba sistemas de clasificación y detección de objetos. Los sistemas de clasificación consisten en la predicción sobre la presencia/ausencia de un tipo de objeto en la imagen mientras que los de detección indican donde el objeto está presente en forma de ventana rectangular. Por ejemplo, dado un tipo de objeto o categoría como avión, un sistema de clasificación predice si hay o no algún avión en la imagen, mientras que un sistema de detección indica en qué lugar de la imagen se encuentra el avión en caso que el sistema considere que hay algún avión en la imagen. Fue a partir del 2009 que...