El Plan de Sistemas de Salud de Catalunya

En estos días se han publicado dos documentos interesantes. La revista The Economist dedica la portada y una sección extensa a la revolución de los datos en el sector sanitario (“a revolution in health care”). Los artículos repasan los beneficios a los que nos referimos aquí hace poco, poniendo énfasis en el traspaso de conocimiento y poder a los pacientes (the doctor is you) y a las máquinas, y muestran un conjunto de experiencias y soluciones, con su rigor y elegancia casi siempre habituales. Los datos en sanidad están esta quincena en la portada del Economist; el paso siguiente es que sean el personaje del año del Time. El segundo documento es el Pla Director de Sistemes d’Informació del SISCAT  (el sistema sanitario de Cataluña), que se propone como una estrategia de transformación digital en beneficio de pacientes y profesionales basada en los datos. He participado, junto con otros profesores y colaboradores de la UOC, en el Plan y por lo tanto tengo todos los sesgos y subjetividades del caso, agravados por la proximidad de la publicación. Pero creo que eso no me impide resumir sus rasgos principales y las oportunidades que potencialmente abre. El Plan es una de las pocas iniciativas recientes, ambiciosas e integrales de transformación de los sistemas de información de salud en Europa (sólo se me ocurren Irlanda y Dinamarca). Es complicado hacer planificación de sistemas diversificados en un modelo sanitario bastante desintegrado y politizado y aquí nos encontramos con un esfuerzo paciente y hercúleo. Aún más lo es establecer un proceso balanceado entre la participación y colaboración de múltiples actores (hasta 300 participantes en el proyecto), liderado internamente, y...

MOOC BI y Big Data: a la cuarta va la vencida

Comentábamos el año pasado que no hay dos sin tres. Y este año decimos que a la cuarta va la vencida. Así que ¡volvemos con la cuarta edición del MOOC “Introducción al Business Intelligence y Big Data“! Durante los últimos tres años hemos adquirido una buena experiencia en el ámbito de los MOOCS a través de la plataforma MiriadaX, que ya comentamos en su momento aquí y aquí. Teniendo en cuenta la gran aceptación de las anteriores ediciones y la gran cantidad de personas que no pudieron realizar anteriores ediciones hemos decido repetirlo una vez más. Este MOOC, como su título indica, es inteligencia de negocio y Big Data, competencias que llevamos formando desde hace más de una década y que son absolutamente cruciales en la actualidad para trabajar y gestionar escenarios VUCA y en el que es necesario convertirse en una organización orientada al dato, como hemos comentado más de una vez (1 y 2). Hemos preparado un vídeo para presentar esta edición: Tras tres ediciones el interés ha sido fenomenal: más de 42.600 personas interesadas en las tres ediciones y casi 9.800 estudiantes que terminaron con éxito su correspondiente edición. Hemos aprendido mucho en estas tres ediciones. Lo hemos comentado en detalle aquí, aquí y aquí. Para esta cuarta edición hemos mantenido la misma estructura que en la tercera edición y sólo algunos pequeñas correcciones aquí y allá. El curso tiene una introducción donde explicamos los objetivos y capacidades, la estructura del programa y la metodología y claves para un seguimiento efectivo y se desarrolla durante un mes a través de cinco módulos docentes: Introducción al BI. Es un módulo conceptual de presentación de los sistemas de Inteligencia de Negocio, sus usos...

Arquitectura como estrategia: algunos ejemplos (y II)

En la entrada anterior, comenzamos a desplegar el concepto de arquitectura de empresa, “la lógica que organiza los procesos de negocio y la infraestructura de TI de una manera que refleje los requerimentos de integración y estandarización del modelo operativo de la empresa”. Allí presentamos varios modelos diversificados, o sea aquellos que no necesitan compartir ni datos ni procesos, pero pueden compartir parte de la infraestructura técnica o de las aplicaciones por razones principalmente económicas, no estratégicas. Descargar (PDF, 182KB) Modelos de arquitectura de empresa En los sistemas coordinados, el grupo comparte datos y transacciones de sus clientes, productos o proveedores, porque existe una integración vertical de las operaciones, aunque las empresas sean jurídica y económicamente independientes y los procesos de gestión no necesiten ser los mismos. Es el caso de la relación entre los fabricantes y los distribuidores o la de algunos tipos de franquicia. El lema sería: “si quieres trabajar conmigo, tienes que compartir la información”. En estos sistemas, los participantes facilitan interfaces de aplicación, visores remotos o cargan sus datos a través de servicios web o plataformas de integración más sofisticadas. Frecuentemente, esta solución es lenta o incómoda y acaba siendo más práctico disponer de repositorios comunes a los que cualquier miembro del grupo puede acceder en cualquier momento. La organización de la informática es más compleja, con modelos federados, donde el centro define políticas y estándares, pero cada unidad de negocio decide independientemente sobre sus procesos y soluciones. En las empresas globales, con plantas o filiales en todas partes, que hacen básicamente lo mismo en cualquier lugar, para clientes que también suelen ser globales, la organización de...

Plataformas y ecosistemas en BI, BA, Big Data y Data Science

No es la primera vez que hablamos sobre ecosistemas y plataformas, de hecho el interés viene de lejos. Últimas noticias de las anteriores semanas nos hacen volver a poner la atención en este punto. De hecho un par. Por un lado, la reciente compra de Fast Forward Labs por parte de Cloudera para reforzar su línea de Data Science (fundamentada en otra adquisición – Sense Platform – en 2016). Por otro, la disponibilidad de un nuevo backend para MongoDB llamado Stitch, que buscar facilitar la integración de la base de datos en desarrollos y aplicaciones. Como ya sabemos, en los últimos años las tecnologías para capturar, almacenar, procesar, analizar y visualizar datos tiene un marcado acento open source. Existen múltiples componentes alrededor de Apache Hadoop, Apache Spark, Apache Flink o MongoDB, por nombrar algunas. Aunque existen tantas que es complicado seguir la pista a como evoluciona tantos actores. Un buen intento es el Big Data Landscape. Escoger la mejor plataforma de datos, se convierte en una tarea titánica y es natural que surjan plataformas integradas (y empresas que den soporte a dichas plataformas) como las conocidas Hortonworks, Cloudera, Data Artisans o Databricks. ¿Hacía dónde se dirigen estas plataformas? En anteriores movimientos de mercados, vimos cómo los proveedores de mercado complementaron su solución incluyendo módulos de analítica de negocio (proporcionando análisis basados en parámetros). Por lo que emergieron las plataformas combinando módulos de inteligencia y analítica de negocio. En esta etapa los últimos movimientos del mercado nos ofrecen otro panorama. Los fabricantes de plataformas empresariales de negocio están interesado en capitalizar el movimiento de Data Science, e integran componentes de Machine Learning, entornos de trabajos flexibles (basados en Jupyter, Apache Zeppelin o similares) e incluso fichando equipos para ofrecer servicios profesionales. Cloudera no han sido los primeros (por ejemplo, ya...

Ética de los Big Data: un libro necesario

Se ha publicado en la interesante colección de Tecnología de la editorial de la UOC, que dirige mi colega Toni Pérez, el “manual” Una ética para Big Data: Introducción a la ética de datos masivos, de Rosa Colmenarejo, profesora de la Universidad Loyola de Andalucía y colaboradora de la UOC, ingeniera, antropóloga y filósofa. En su origen, procede de materiales de nuestros programas de Inteligencia de Negocio y Data Science, trabajados con Montse Serra. Ahora estamos ante un librito urgente, necesario y prometedor, que no puedo dejar de recomendar. Urgente El conjunto de los problemas y dilemas éticos que afrontamos los directivos, usuarios, técnicos, analistas, estudiantes y docentes, que trabajamos con datos masivos, y los ciudadanos que cedemos, con mayor o menor consentimiento, nuestros datos a casi cualquiera, o que estamos expuestos a la vigilancia de otros que desconocemos, afectan como mínimo, ya lo sabíamos, a la identidad, la privacidad, la propiedad y la reputación. Pero eso quiere decir también y en sentido más amplio que impactan a la autonomía, la dignidad y la solidaridad –o sea, a todo lo que nos hace humanos: poca broma. Estas tecnologías diluyen la separación entre el espacio privado y el espacio público, la identidad online y la identidad offline, lo individual y lo colectivo, lo local y lo global, la propiedad y la pertenencia. Sólo levantar esta consciencia y dirigirse a ese estupor entre nuestros estudiantes y profesores y entre un público más amplio merece aplauso. Colmenarejo lo hace con tranquilidad, documentación, reflexión y rigor. La autora nos introduce en los conceptos básicos que han formado la filosofía de la sociedad y la ética,...

El perfil de un data scientist

Se dice que actualmente hay siete zettabytes de información disponible, que este volumen se duplica cada dos años y que, en un solo día, se produce el doble de información de la que contenía Internet hace veinte años. Pero sólo se analiza un 0,5% de este volumen. Los datos que se recogen actualmente dentro y fuera de las organizaciones poseen unas características que no poseían anteriormente: ocupan un volumen muy grande, se producen en un flujo continuo, proceden de múltiples fuentes (redes sociales, sensores, teléfonos móviles, clics en la web, etc.), se presentan en múltiples formatos (imagen, documentos, etc.) y, sobre todo, ya no se pueden almacenar solo en filas y columnas (tienen una estructura diferente y más compleja). Este gran volumen de datos presenta una gran oportunidad para extraer conocimiento útil para la toma de decisiones en las organizaciones, pero a la vez, las características intrínsecas de estos datos dificultan los procesos de manipulación y análisis asociados. Las empresas e instituciones se enfrentan al reto de encontrar los profesionales capacitados para aumentar la competitividad de su organización a través de la información obtenida de estos datos. Para ello, buscan profesionales dinámicos y especializados que provienen de diversos orígenes, tales como negocios, ingeniería, tecnología, economía, matemáticas y ciencias, y que sean capaces de identificar, capturar, transformar, analizar e interpretar los datos para impulsar el valor y la innovación aplicada en diversas industrias, como por ejemplo las finanzas, la salud, los bienes de consumo o la tecnología. Por estos motivos, y por un cierto repunte (hype) de expectativas en el mercado, los científicos de datos son actualmente los profesionales más...