Lecciones aprendidas sobre deep learning para la detección de fraude de tarjetas de crédito

En este post os presentamos un resumen y la presentación completa de una de las charlas del UOC Data Day, celebrado el día 14 de junio de 2017 en Barcelona sobre el uso de las redes neuronales (deep learning) para la detección de fraude de tarjetas de crédito. Esta ponencia fue a cargo de Alberto Rubio Muñoz, Senior Data Scientist en BBVA Data & Analytics y profesor colaborador docente del área de minería de datos y machine learningdel Máster universitario en Ciencia de datos (Data Science). Los datos están cambiando nuestra sociedad. Debido a los datos estamos repensando nuestras industrias para construir mejores productos: agricultura, educación, finanzas, jurídicos, etc. Con el advenimiento de los datos, un hijo pródigo del machine learning ha vuelto a la delantera para desempeñar un papel principal: las redes neuronales artificiales, también conocido como Deep learning o aprendizaje profundo. En esta charla, proporcionaremos algunas ideas sobre su aplicación para detectar transacciones de tarjetas de crédito fraudulentas realizadas en tiendas y minoristas en línea. También describiremos los datos que usamos, cómo se entrenan las redes neuronales y cómo se mide su eficiencia o precisión. Además, reflexionaremos sobre cómo la posibilidad de procesar gran cantidad de datos ha impulsado el deep learning y el machine learning en la industria. A continuación, os dejamos la grabación de la ponencia completa, así como el material de soporte utilizado para la presentación. ¡Esperamos que la disfrutéis! Nota: Este artículo ha aparecido previamente en el blog de Análisis y Ciencia de Datos de la UOC: http://dataanalysis.blogs.uoc.edu/.   Jordi Casas es profesor de los Estudios de Informática, Multimedia y Telecomunicación en la UOC y director...

Deep Learning en #XDS3

A finales de agosto se celebró en París (concretamente en Palaiseau) la Data Science Summer School 2017 (DS^3), organizada por el Laboratoire de Informatique (LIX) de la prestigiosa École Polytechnique francesa. Aunque era su primera edición, el evento fue todo un éxito, con más de 400 inscritos, incluyendo estudiantes, investigadores, profesores y profesionales de industria y empresa del sector. Sin duda, estos números confirman el auge que estamos viendo en los temas relacionados con la ciencia de datos, machine learning, análisis de datos, Big data y otros temas relacionados. Durante los cinco días que duró el acto, se dieron diversas ponencias y tutoriales de muchos temas relacionados con la ciencia de datos: por ejemplo, se habló extensamente de graphical models, randomized optimization methods o bayesian optimization. Pero sin duda, el “rey de la fiesta” fue el deep learning. Cerca del 40% de la programación del evento estaba relacionado con las redes neuronales y deep learning. Uno de los grandes atractivos de este evento fueron las clases magistrales que ofreció Yoshua Bengio sobre redes neuronales artificiales y deep learning. Las redes neuronales artificiales (ANN, artificial neural networks) están formadas por un conjunto de neuronas distribuidas en distintas capas. Cada una de estas neuronas realiza un cálculo u operación sencilla sobre el conjunto de valores de entrada de la neurona, que en esencia son entradas de datos o las salidas de las neuronas de la capa anterior, y calcula un único valor de salida que, a su vez, será un valor de entrada para las neuronas de la siguiente capa o bien formará parte de la salida final de la red. La siguiente figura presenta un esquema básico de una red neuronal con la capa de...

¿Unir PMBOK® y PRINCE2®?

(Trobareu versió en català més avall) El pasado 22 de junio, en sede UOC pero en el contexto del capítulo de Barcelona del PMI (estrenábamos convenio de colaboración entre las dos entidades), Glòria Segura, una de las profesoras de nuestro equipo docente de Gestión de Proyectos, presentó una ponencia de título provocador: “Gana uniendo PMBOK® y PRINCE2®”. Hablar de PRINCE2, el método de gestión de proyectos del gobierno británico (Axelos) y considerado competidor directo del PMBOK del PMI, en un contexto del PMI, era una oportunidad para la polémica; pero también una oportunidad para darlo a conocer -es todavía poco usado en nuestro país-, y para, sobre todo, exponer las ventajas de utilizar los dos marcos de trabajo de forma colaborativa, aprovechando las fortalezas de ambos, y obtener así un método de gestión de proyectos aún mejor. Tanto si ya hemos adoptado (o queremos adoptar) PMBOK o PRINCE2, Glòria defendió que es posible buscar esta confluencia, añadiendo los puntos del uno que puedan complementar al otro en positivo. Por parte de PRINCE2 estos puntos serían: La gran relevancia que se le da a la justificación del proyecto, desde su inicio hasta después de su cierre, definiendo también mecanismos para ser capaces de tomar la difícil decisión de parar un proyecto cuando se prevé que no dará los beneficios que lo justifican. La robusta estructura organizativa de gestión de cada proyecto que tiene en cuenta los diferentes intereses (de negocio, de usuario y de proveedor) en la toma de decisiones, con roles y responsabilidades bien definidos y detallados. La gestión por excepción, que permite delegar con control, definiendo tolerancias y...

Smart Cities y datos abiertos: El portal Open Data BCN

Las ciudades inteligentes, Smart Cities en inglés, persiguen garantizar el desarrollo sostenible, haciendo un uso eficiente de los recursos disponibles, para mejorar la calidad de vida de los ciudadanos. Para ello, resulta esencial que ciudad y ciudadanos puedan interactuar y beneficiarse mutuamente de la actividad y conocimiento que se genera en el contexto de la ciudad. Entre las diferentes opciones e infraestructuras tecnológicas que facilitan el acercamiento entre ciudadanía, gobierno, y la propia ciudad, una de las principales herramientas son los datos abiertos, u open data de su denominación en inglés. Cualquier entidad u organización puede abrir sus datos al público, mediante la publicación de estos en un portal. En la actualidad muchas de las principales administraciones y gobiernos, así como administraciones regionales y locales, disponen de un portal de datos en abierto. En el caso de la ciudad de Barcelona, la iniciativa surgió el año 2010 para implantarse al año siguiente. El portal Open Data BCN ha ido evolucionando con el paso de los años, tanto en utilización como en las normativas relacionadas con la publicación y acceso a los datos. Su principal objetivo es aprovechar los recursos disponibles, publicando la información generada o custodiada por la administración pública, permitiendo su acceso y reutilización para el beneficio de cualquier persona o entidad interesada. El portal se enmarca dentro de la estrategia ”Pla Barcelona Ciudad Digital”, liderada por la Comisionada de Tecnología e Innovación Digital, Francesca Bria. Se trata de la hoja de ruta municipal para impulsar la soberanía tecnológica y el empoderamiento de la ciudadanía. Entre otras iniciativas, se pretende crear un ecosistema de datos abiertos de ciudad,...

Women Techmakers Barcelona 2017

Una de las [muchas] cosas agradables del trabajo de un profesor es poder (deber, incluso) asistir a y participar en todo tipo de eventos de difusión del conocimiento. Uno de los últimos a los que he tenido el inmenso gusto de asistir fue el Women Tech Makers Barcelona, la primera edición barcelonesa de un conjunto de eventos organizados por todo el mundo con el objetivo principal de aumentar la visibilidad de la mujer en el mundo de la informática y de las tecnologías de la información y la comunicación, algo tristemente todavía muy necesario. Los estudios de Informática, Multimedia y Telecomunicación de la UOC, junto con la Unidad de Igualdad de la UOC (les podéis seguir en Twitter en @UOCigualtat), además, hemos podido poner nuestro granito de arena encargándonos de la filmación del evento. El día se compuso de media docena de charlas y dos workshops. La jornada la abrió la presentación de Anne Marie, CTO de la empresa irlandesa Ocado Technology, con un interesante repaso a la situación del problema de género en el mundo de las TIC:   A Anne la siguió Gemma Parreño, que nos contó su trabajo con las redes neuronales de Tensorflow a la búsqueda de los “trolls” en la red (un problema con el que, lamentablemente, todos nos hemos tenido que enfrentar alguna vez):   A continuación Silvia Romera nos contó sus experiencias con la enseñanza de la programación y la robótica:   Después de Silvia contamos con la presencia de la matemática y divulgadora Clara Grima, que en su charla repasó la cantidad de avances matemáticos que hace posible que hoy usemos el...

Todos a una para acercar las técnicas de posicionamiento en interiores a nuestro día a día

Ayudar a encontrar la mejor salida de un edificio en llamas, utilizar un dispositivo móvil para encontrar a un menor extraviado en un crucero enorme o estimar la evolución de los pacientes con depresión en función de la habitación de la casa donde pasan la mayor parte de su tiempo. Estas son algunas de las soluciones que los sistemas de posicionamiento y navegación en interiores (PIN) pueden aportar a nuestra sociedad. El uso de sistemas de posicionamiento y navegación en entornos abiertos es una realidad que ha aportado múltiples servicios y beneficios para la sociedad. Aunque también sean los causantes de que algunas actividades vayan cayendo en el olvido, como el uso de mapas en papel, prepararse un viaje en coche antes de salir o bajar la ventanilla del coche para preguntar por una dirección cuando nos hemos perdido. Pero nostalgia aparte, los sistemas de posicionamiento y navegación son una realidad que ha provocado un cambio social y cultural masivo. Pero esa mejora es nimia en comparación a lo que podría llegar a ser, ya que los sistemas de posicionamiento y navegación basados en redes de satélites (GNSS, del inglés Global Navigation Satellite Systems), como el GPS, GLONAS o el recién estrenado GALILEO, dejan de funcionar cuando nos movemos entre edificios muy altos o en espacios cerrados. Y según los expertos, es precisamente en espacios cerrados (en interiores) donde pasamos más de un 70% de nuestro tiempo. Por tanto, hay que buscar nuevas soluciones para lograr el posicionamiento y la navegación en estos entornos.  Es decir, por ejemplo: que nuestro navegador pueda guiarnos hasta llegar a un centro comercial,...