Lecciones aprendidas sobre deep learning para la detección de fraude de tarjetas de crédito

En este post os presentamos un resumen y la presentación completa de una de las charlas del UOC Data Day, celebrado el día 14 de junio de 2017 en Barcelona sobre el uso de las redes neuronales (deep learning) para la detección de fraude de tarjetas de crédito. Esta ponencia fue a cargo de Alberto Rubio Muñoz, Senior Data Scientist en BBVA Data & Analytics y profesor colaborador docente del área de minería de datos y machine learningdel Máster universitario en Ciencia de datos (Data Science). Los datos están cambiando nuestra sociedad. Debido a los datos estamos repensando nuestras industrias para construir mejores productos: agricultura, educación, finanzas, jurídicos, etc. Con el advenimiento de los datos, un hijo pródigo del machine learning ha vuelto a la delantera para desempeñar un papel principal: las redes neuronales artificiales, también conocido como Deep learning o aprendizaje profundo. En esta charla, proporcionaremos algunas ideas sobre su aplicación para detectar transacciones de tarjetas de crédito fraudulentas realizadas en tiendas y minoristas en línea. También describiremos los datos que usamos, cómo se entrenan las redes neuronales y cómo se mide su eficiencia o precisión. Además, reflexionaremos sobre cómo la posibilidad de procesar gran cantidad de datos ha impulsado el deep learning y el machine learning en la industria. A continuación, os dejamos la grabación de la ponencia completa, así como el material de soporte utilizado para la presentación. ¡Esperamos que la disfrutéis! Nota: Este artículo ha aparecido previamente en el blog de Análisis y Ciencia de Datos de la UOC: http://dataanalysis.blogs.uoc.edu/.   Jordi Casas es profesor de los Estudios de Informática, Multimedia y Telecomunicación en la UOC y director...

Deep Learning en #XDS3

A finales de agosto se celebró en París (concretamente en Palaiseau) la Data Science Summer School 2017 (DS^3), organizada por el Laboratoire de Informatique (LIX) de la prestigiosa École Polytechnique francesa. Aunque era su primera edición, el evento fue todo un éxito, con más de 400 inscritos, incluyendo estudiantes, investigadores, profesores y profesionales de industria y empresa del sector. Sin duda, estos números confirman el auge que estamos viendo en los temas relacionados con la ciencia de datos, machine learning, análisis de datos, Big data y otros temas relacionados. Durante los cinco días que duró el acto, se dieron diversas ponencias y tutoriales de muchos temas relacionados con la ciencia de datos: por ejemplo, se habló extensamente de graphical models, randomized optimization methods o bayesian optimization. Pero sin duda, el “rey de la fiesta” fue el deep learning. Cerca del 40% de la programación del evento estaba relacionado con las redes neuronales y deep learning. Uno de los grandes atractivos de este evento fueron las clases magistrales que ofreció Yoshua Bengio sobre redes neuronales artificiales y deep learning. Las redes neuronales artificiales (ANN, artificial neural networks) están formadas por un conjunto de neuronas distribuidas en distintas capas. Cada una de estas neuronas realiza un cálculo u operación sencilla sobre el conjunto de valores de entrada de la neurona, que en esencia son entradas de datos o las salidas de las neuronas de la capa anterior, y calcula un único valor de salida que, a su vez, será un valor de entrada para las neuronas de la siguiente capa o bien formará parte de la salida final de la red. La siguiente figura presenta un esquema básico de una red neuronal con la capa de...

Segmentación semántica: de imagen a vídeo

El pasado 6 de julio tuve la oportunidad de asistir a una charla que dio el investigador de Google Deepmind Joao Carreira llamada “Learning video representations from YouTube” en el marco de una summer school sobre Learning Systems impartida en el ETH Zürich. En una entrada anterior comenté los distintos benchmarks que existen para la segmentación semántica de imágenes, tales como PASCAL y Microsoft COCO. La charla en cuestión hacía hincapié en que ya es momento de dar el salto al vídeo, a aprender nuevos modelos a partir de vídeos en lugar de imágenes. Ya que los challenges de imágenes empiezan a estar saturados y las mejoras que se consiguen con tanto poco margen son muy poco significativas y porque sería intuitivo pensar que si la personas aprendemos a partir de nuestra percepción, la cual se asemeja más a información en forma de vídeo (percibimos constantemente la información visualmente), puede que estemos limitando la capacidad de nuestros modelos entrenándolos a partir de imágenes. En la conferencia más prestigiosa del ámbito de computer vision (Computer Vision and Pattern Recognition, CVPR), el año pasado (CVPR’16) ya aparecieron un par de datasets más interesantes que ya empezaban a ir en esta dirección. Se trata de los datasets Cityscapes Dataset y DAVIS (Densely Annotated VIdeo Segmentation). La primera de ellas, Cityscapes, consiste en un conjunto de secuencias de vídeo que han sido tomadas desde un coche en varias ciudades, la mayoría de ellas situadas en Alemania. Contiene 5000 secuencias que han sido anotadas con un alto nivel de detalle y 20000 secuencias que no han sido anotadas con tanto detalle. La siguiente figura muestra la...

El perfil de un data scientist

Se dice que actualmente hay siete zettabytes de información disponible, que este volumen se duplica cada dos años y que, en un solo día, se produce el doble de información de la que contenía Internet hace veinte años. Pero sólo se analiza un 0,5% de este volumen. Los datos que se recogen actualmente dentro y fuera de las organizaciones poseen unas características que no poseían anteriormente: ocupan un volumen muy grande, se producen en un flujo continuo, proceden de múltiples fuentes (redes sociales, sensores, teléfonos móviles, clics en la web, etc.), se presentan en múltiples formatos (imagen, documentos, etc.) y, sobre todo, ya no se pueden almacenar solo en filas y columnas (tienen una estructura diferente y más compleja). Este gran volumen de datos presenta una gran oportunidad para extraer conocimiento útil para la toma de decisiones en las organizaciones, pero a la vez, las características intrínsecas de estos datos dificultan los procesos de manipulación y análisis asociados. Las empresas e instituciones se enfrentan al reto de encontrar los profesionales capacitados para aumentar la competitividad de su organización a través de la información obtenida de estos datos. Para ello, buscan profesionales dinámicos y especializados que provienen de diversos orígenes, tales como negocios, ingeniería, tecnología, economía, matemáticas y ciencias, y que sean capaces de identificar, capturar, transformar, analizar e interpretar los datos para impulsar el valor y la innovación aplicada en diversas industrias, como por ejemplo las finanzas, la salud, los bienes de consumo o la tecnología. Por estos motivos, y por un cierto repunte (hype) de expectativas en el mercado, los científicos de datos son actualmente los profesionales más...

Uso inteligente de datos en Sanidad

La Sanidad se identificó ya desde el estudio pionero del Instituto McKinsey como uno de los sectores con mayor potencial para el uso inteligente de datos, incluidos los big data. En el nivel de las operaciones, permite a los clínicos compartir la información de salud del paciente a lo largo de la cadena de cuidados (la asistencia primaria, el hospital, el socio-sanitario o la atención en casa). En el nivel de la gestión, facilita la transparencia y la comparación para reducir la variabilidad de la práctica asistencial, aumentando la calidad y seguridad de la atención; y permite a los reguladores, las compañías de seguros y los compradores de servicios establecer contratos y precios. En el nivel analítico, es una oportunidad para la investigación de nuevos tratamientos, servicios y productos que completen la promesa de una medicina personalizada y predictiva. En todos los casos, facilitan al paciente el acceso a sus datos y a información que desafía el poder de agencia de la industria y los profesionales… La sanidad es un negocio de información y conocimiento. Principal destino de las inversiones en sistemas de información en sanidad. Fuente: Gartner, Encuesta de CIOs, 2017. Sin embargo, el mismo estudio y otras fuentes han señalado que la falta de inversión en informática y en talento analítico, por una parte, y, por otra, las estructuras y culturas organizativas que impiden la compartición de datos, están actuando como barrera para realizar los beneficios potenciales del uso masivo de los datos en el sector. Algunos países (Dinamarca, Nueva Zelanda, Irlanda, Singapur…) han establecido en los últimos años estrategias de salud electrónica o e-Health, con energía política...

Ciberfeminismo

(Trobareu versió en català més avall) El ciberfeminismo, usualmente asociado al activismo feminista en la red, ha caminado de la mano del desarrollo de Internet y el llamado ciberespacio, para generar nuevos espacios de participación y activismo feminista. El término surge de la fusión de “ciberespacio” y “feminismo” y su aparición, en 1991, es de la mano de Sadie Plant, teórica inglesa, y, en 1992 del grupo de artistas y activistas australianas VNS Matrix. En su principal trabajo sobre el tema, Ceros + Unos, Plant argumenta cómo las mujeres han estado históricamente unidas a la tecnología y que el cero, la nada del código binario, siempre ha sido considerado el “0-tro”, lo femenino. VNS Matrix (leído como VeNuS Matrix) denuncia de manera provocativa los discursos de dominación sexualizantes que controlaban el espacio cibernético (Internet) recién creado y en expansión. Las teorías feministas de la tecnología, que son un conglomerado de reflexiones sociales, filosóficas y políticas sobre la relación género-tecnología han estado influenciadas por las teorías feministas, y cada vez más por la reflexión sobre el sexismo y el androcentrismo, una vez desterrada la supuesta neutralidad de la ciencia, en las innovaciones tecnológicas del siglo XX y XXI. Durante la década de 1990 el ciberfeminismo se expande gracias al auge de las TIC (entonces llamadas “nuevas tecnologías”) y, sobre todo, del impulso de la conocida como tercera ola feminista, y especialmente de la filósofa Donna Haraway y su Manifiesto Cyborg, publicado en 1987, y donde esta autora propone una nueva identidad cyborg que superaría la identidad de género y que es considerada como origen del pensamiento ciberfeminista. El cyborg (cybernetic...