El perfil de un data scientist

Se dice que actualmente hay siete zettabytes de información disponible, que este volumen se duplica cada dos años y que, en un solo día, se produce el doble de información de la que contenía Internet hace veinte años. Pero sólo se analiza un 0,5% de este volumen. Los datos que se recogen actualmente dentro y fuera de las organizaciones poseen unas características que no poseían anteriormente: ocupan un volumen muy grande, se producen en un flujo continuo, proceden de múltiples fuentes (redes sociales, sensores, teléfonos móviles, clics en la web, etc.), se presentan en múltiples formatos (imagen, documentos, etc.) y, sobre todo, ya no se pueden almacenar solo en filas y columnas (tienen una estructura diferente y más compleja). Este gran volumen de datos presenta una gran oportunidad para extraer conocimiento útil para la toma de decisiones en las organizaciones, pero a la vez, las características intrínsecas de estos datos dificultan los procesos de manipulación y análisis asociados. Las empresas e instituciones se enfrentan al reto de encontrar los profesionales capacitados para aumentar la competitividad de su organización a través de la información obtenida de estos datos. Para ello, buscan profesionales dinámicos y especializados que provienen de diversos orígenes, tales como negocios, ingeniería, tecnología, economía, matemáticas y ciencias, y que sean capaces de identificar, capturar, transformar, analizar e interpretar los datos para impulsar el valor y la innovación aplicada en diversas industrias, como por ejemplo las finanzas, la salud, los bienes de consumo o la tecnología. Por estos motivos, y por un cierto repunte (hype) de expectativas en el mercado, los científicos de datos son actualmente los profesionales más...

Uso inteligente de datos en Sanidad

La Sanidad se identificó ya desde el estudio pionero del Instituto McKinsey como uno de los sectores con mayor potencial para el uso inteligente de datos, incluidos los big data. En el nivel de las operaciones, permite a los clínicos compartir la información de salud del paciente a lo largo de la cadena de cuidados (la asistencia primaria, el hospital, el socio-sanitario o la atención en casa). En el nivel de la gestión, facilita la transparencia y la comparación para reducir la variabilidad de la práctica asistencial, aumentando la calidad y seguridad de la atención; y permite a los reguladores, las compañías de seguros y los compradores de servicios establecer contratos y precios. En el nivel analítico, es una oportunidad para la investigación de nuevos tratamientos, servicios y productos que completen la promesa de una medicina personalizada y predictiva. En todos los casos, facilitan al paciente el acceso a sus datos y a información que desafía el poder de agencia de la industria y los profesionales… La sanidad es un negocio de información y conocimiento. Principal destino de las inversiones en sistemas de información en sanidad. Fuente: Gartner, Encuesta de CIOs, 2017. Sin embargo, el mismo estudio y otras fuentes han señalado que la falta de inversión en informática y en talento analítico, por una parte, y, por otra, las estructuras y culturas organizativas que impiden la compartición de datos, están actuando como barrera para realizar los beneficios potenciales del uso masivo de los datos en el sector. Algunos países (Dinamarca, Nueva Zelanda, Irlanda, Singapur…) han establecido en los últimos años estrategias de salud electrónica o e-Health, con energía política...

¿Cuál es la madurez analítica de nuestro ecosistema empresarial?

Data science, big data y analytics son algunas de las palabras que están sonando más estos últimos años. Estas palabras se relacionan con la filosofía de analizar los datos y usar el conocimiento extraído de dicho análisis para realizar una toma de decisiones basada en evidencias. Pero ¿Qué impacto tiene esta filosofía en nuestro contexto? ¿Hasta qué punto las organizaciones de nuestro entorno usan los datos en su toma de decisiones? ¿Cuál es la madurez analítica del ecosistema empresarial que nos rodea? Estas son preguntas muy interesantes, que nos podrían ayudar a entender mejor nuestro entorno pero cuya respuesta es difícil de obtener. Hay algunos estudios que han realizado análisis enfocados a intentar responder a estas preguntas, como el que realizó Accenture en Holanda el 2013 o el de Vonya del 2016, pero normalmente son muy sectoriales y se basan en un número de respuestas reducido. Aprovechando la amplia audiencia de la tercera edición del MOOC de Inteligencia de negocio y Big Data (cerca de 10.000 estudiantes) hemos propuesto una encuesta que hace un par de semanas compartimos con los estudiantes del MOOC y que ahora estamos difundiendo en las redes sociales. El objetivo es responder, con datos,  (y con margen de error también, somos conscientes), a la pregunta de ¿Cuál es la madurez analítica del ecosistema empresarial que nos rodea? y compartir las respuestas que obtengamos abiertamente con el resto de la comunidad. Hasta ahora ya hemos recogido cerca de 500 respuestas y querríamos pediros vuestra participación en esta experiencia para conocer cuál es el nivel de madurez analítica de vuestras organizaciones. La encuesta que hemos elaborado nos...

MOOC BI y Big Data: no hay dos sin tres

Los dos últimos años hemos tenido dos interesantes experiencias en el ámbito de los MOOC a través de la plataforma MiriadaX, que ya comentamos en su momento aquí y aquí. Este MOOC ha estado centrado en la inteligencia de negocio y Big Data, competencias que llevamos formando desde hace más de una década y que son absolutamente cruciales en la actualidad para trabajar y gestionar escenarios VUCA y en el que es necesario convertirse en una organización orientada al dato, como hemos comentado más de una vez (1 y 2). Desde nuestra perspectiva, el interés por estas dos iniciativas fue muy relevante (más de 35.000 personas interesadas en las dos ediciones) y casi 8.000 estudiantes que terminaron con éxito su correspondiente edición. Hemos aprendido mucho en estas dos ediciones. Lo hemos comentado en detalle aquí y aquí. Pero no somos el único que tiene esta perspectiva. Tal y como comentan desde MiriadaX, estamos en el TOP 10 de los cursos que más generaron interés en 2016, por ello hemos hecho propio el dicho: “no hay dos sin tres”. Para esta tercera edición hemos mantenido todo lo aprendido de las anteriores ediciones. Ello significa que: (1) los contenidos del MOOC se fundamentan en materiales y contenidos de nuestro programa de Business Intelligence y Big Data, (2) a lo largo del MOOC se tiene la posibilidad de interactuar con algunos de los profesores responsables y colaboradores en la UOC, (3) mantenemos los cambios introducidos en la segunda edición (por ejemplo, el capítulo entero dedicado a los sistemas de Big Data y a las bases de datos NoSQL, que es una de...

Competencias para el desarrollo de proyectos de datos

Dentro de lo que se conoce como Transformación Digital, los proyectos de datos van a ser una pieza fundamental. De hecho formarán parte de esa otra cara de la moneda que nos explica José Ramón. Y ya hemos comentado más de una vez, que ser data driven es parte de esta transformación. En el momento de desarrollar un proyecto de datos (ya sea de Business Intelligence, Big Data o Data Science) uno de los puntos importantes son las competencias necesarias para su desarrollo. Hace unos años se hizo famoso el diagrama de Venn vinculado a Data Science donde se buscaba dejar patente que la generación de valor a partir del dato necesita conocimientos de diferentes disciplinas como matemáticas, informática y conocimiento de negocio. Aunque el diagrama hace referencia a la ciencia de los datos, la idea de fondo está alineada con nuestra hipótesis: el consultor de BI y Big Data es un perfil todo terreno que necesita combinar diferentes competencias. A medida que pasa el tiempo, va quedando patente que es necesario revisar de forma continua las competencias necesarias. De hecho, tal y como Stephan Kolassa comenta y recoge Matthew Mayo, hay más matices a tener en cuenta y el diagrama necesita de otra dimensión: la comunicación para ayudar a entender los resultados conseguidos en el proyecto. Se puede estar más o menos de acuerdo con las categorías y las clasificaciones, pero sirve para ilustrar el problema. No son los únicos que están en la discusión, en la academia se empiezan a proponer programas basados en competencias como postula Ashraf Shirani de la Universidad de San José o incluso...

El futuro del management en la era digital

Si los últimos años ya han sido de los best-sellers sobre la relación entre los humanos y las máquinas (en los libros de historia, de informática y de negocios, y en las canciones populares), sabíamos que no tardaría en llegar algún pensamiento sobre cómo ésto afecta o afectará a la función directiva y la organización de las empresas. Si casi todas las tareas sencillas y muchas de las complejas pueden automatizarse; si nuestro colega y una parte de nuestra fuerza de trabajo es una tecnología cognitiva que “sabe” más cosas que nosotros; si el trabajo es una utilidad que se adquiere en un mercado abierto de contratistas autónomos en cualquier lugar del mundo… ¿cómo podemos dirigir? ¿cómo debemos establecer las relaciones en el grupo? ¿cómo afecta a las jerarquías y los procesos de toma de decisiones? ¿cómo podemos ganar lealtades? Aún más: ¿es también prescindible, automatizable  o externalizable el trabajo directivo? ¿representa la “cuarta revolución industrial” el final del management tal como lo hemos conocido? GRAFICA: Portada del último número de la MIT Sloan Management Review. Con estas preguntas en la cabeza, la revista MIT Sloan Management Review, que suele estar para estas cosas, lanzó hace unos meses en la web y ahora en papel un suplemento llamado Frontiers en el que asalta a diferentes clases de gurús con la siguiente cuestión: “¿Cómo transformará la tecnología en los próximos cinco años la práctica de la dirección de empresas de una manera que no hemos visto antes?” El formato de las respuestas es el de un blog de menos palabras que el nuestro y por allí han pasado, de momento,...