El increíble profesional mate del dato

4 mayo, 2021
El increible profesional mate del dato Foto: ThisIsEngineering de Pexels.

(Més avall trobareu la versió en català d’aquest contingut.)

Lo que conocemos como ciencia de datos es un universo brillante con centenares de nombres sugerentes. Matt Turck anualmente dibuja con método y gracia un mapa de este universo (aviso: si entráis necesitaréis una pantalla grande para poder verlo todo al completo). La luz de los planetas y asteroides de todo tipo que contiene, y la de las aventuras que se adivinan en su exploración, es tan brillante que atraer día tras día nuevos equipos técnicos, nuevas compañías buscando oro y, también, nuevo estudiantado.

Pero también precisamente esta complejidad resulta inabarcable para muchas de las organizaciones normales (pequeñas o medianas o grandes) que pueden beneficiarse de este universo. Y por eso, como siempre ha pasado con otras novedades TI, hacen falta profesionales normales que ayuden a organizaciones y personas normales a sacar el jugo de todo ello. Aquí queremos hablar de esas personas que hacen de científico de datos o, mejor, de profesionales del dato (usando la etiqueta de nuestro Josep Curto) que se dedican, no tanto a brillar en grandes proyectos con grandes recursos tecnológicos en grandes compañías de gran impacto, como dar pequeñas grandes respuestas a los pequeños grandes problemas de las organizaciones normales que conforman el grueso de nuestra economía y sociedad. Queremos provocar, ciertamente, llamándole mate, en contraposición a brillante. Pero es solo una pequeña treta de narrador aficionado porque, realmente, la foto (y la pintura) mate es la necesaria, la abundante en nuestras casas. Queremos defender, de hecho, cuán increíble es.

Antes que nada hace falta no perder de vista que ya hay necesidad de ciencia de datos en todas partes, por lo que cada vez será más necesario formarse en esta disciplina. Por eso estamos hablando de profesionales que saben y a los que no les importa entrar en todas partes. Están, pues, (y recordamos ahora una obviedad que a veces se olvida) orientadas y orientados al servicio. Quieren responder las preguntas de sus compañías clientes, las que ayudarán a tomar decisiones para el negocio fundamentadas en los datos (y no satisfacer sus propias curiosidades que como profesionales podrían extraer de los datasets que tienen al alcance).

A su clientela, esta o este profesional les deberá explicar los límites y posibilidades de la tecnología, hacer de maestro dándoles ejemplos de uso, y adaptándolos a su nivel. Y esto a menudo no será fácil porque muchas de estas organizaciones clientes en la clasificación de madurez de Davenport caerán más cerca de la categoría de los analytically impaired (aquellas que, centradas en su día a día, todavía no han podido poner orden en los datos que disponen y conectarlos entre ellos) que de avanzadas compañías analíticas (aquellas que ya usan el dato, exprimiéndolo y relacionándolo a todos los niveles, para generar ventajas competitivas).

Los profesionales del dato quieren responder las preguntas de sus compañías clientes, las que ayudarán a tomar decisiones para el negocio fundamentadas en los datos.

Poner límites quiere decir lidiar con clientela ansiosa de información rápida y soluciones permanentes, a quienes la publicidad y algún reportaje excesivo, ha hecho creer que esto de la ciencia de datos es poco más que la solución a todos sus problemas. Le toca a la y al profesional del dato, hacer entender que a veces las respuestas obtenidas son temporales porque las preguntas también lo tienen que ser: ¿cómo se le dice a la persona que nos financia que hay que invertir dinero y quizás los resultados servirán solo un tiempo…? ¿Cómo se hace entender que la pregunta “¿Cómo se comporta ahora nuestra masa de clientes?” tiene el acento en el ahora, precisamente? ¿Que la respuesta, en un entorno cambiante como el actual, puede ser totalmente diferente mañana? Esta o este profesional, en estas circunstancias debe hacer otra cosa de mérito: ganar la confianza y patrocinio de la organización cliente.

Por otro lado esta dificultad se ve incrementada con la otra realidad de los proyectos de ciencia de datos que es que, habitualmente, deben trabajarse desde una perspectiva ágil porque a pesar que el objetivo acostumbra a estar claro, la solución (cómo analizar los datos, cómo presentar la información…) no siempre lo está y hay que ir llegando por aproximaciones sucesivas. Aquí, esta clientela ansiosa puede ver reforzadas sus tentaciones de pedir constantemente cambios –no tanto acercándose a la solución, como es aceptable en un proyecto ágil, sino alejándose del objetivo marcado inicialmente. La y el profesional mate del dato, una vez más, tendrá que ayudar a limitar las expectativas y a manejar algunas posibles insatisfacciones.

Esta o este profesional, en este contexto, tiene que cuidar el dato, es decir, velar por su calidad de origen, entender que no todos los datos sirven para lo mismo, y que el dato real y único, a menudo no es nada trivial de encontrar. Las prisas y las presiones no le ayudarán a esta vigilancia. Pero, sea como fuere, debe ser capaz de mantener espacios para cultivar el escepticismo hacia el conocimiento establecido, hacia los resultados obvios y esperables de los algoritmos dominantes, y alimentar la curiosidad por la observación de todo. Y esto también quiere decir tener una actitud de disfrutar de las posibilidades de la libertad y la independencia en su trabajo diario. No todo el mundo sabe o quiere trabajar en este contexto de libertad, porque a menudo implica cierto trabajo en solitario.

Este cierto aislamiento, además, a veces es físicamente real: hay tanta demanda de profesionales que no siempre se encuentran los que hacen falta realmente para un proyecto concreto, o, peor, hay personas que quieren actuar como tales profesionales –por voluntarismo las mejores, o por intrusismo las más aprovechadas- sin serlo. Y aquí trabajar con estas personas también requiere un ejercicio de detección y adaptación y, de nuevo, de actuar como maestro para ayudar a ampliar las competencias del equipo. Y, con ellas, asegurar un comportamiento ético/moral que garantice tener no solo buenas y buenos profesionales sino profesionales buenas y buenos, con capacidad de asegurar que los resultados de su trabajo se obtienen respetando individualmente a las personas y evitando al máximo los efectos negativos en ellas y, todavía más, evitando dejar abiertas puertas a futuros usos indebidos si entrara la persona inadecuada.

El profesional del dato tiene que velar por la calidad de origen del dato, entender que no todos los datos sirven para lo mismo y que el dato real y único a menudo no es nada trivial de encontrar.

En definitiva, ¿no es increíble el perfil de este profesional mate que hemos dibujado? Orientado al servicio, que interpreta el universo de posibilidades del mapa de Turck, que hace de maestro y sabe responder las preguntas y poner límites a sus organizaciones clientes, trabajando con una perspectiva ágil e iterativa mientras controla la insatisfacción, cuida los datos cultivando el escepticismo para que sean los buenos, y a menudo en cierto aislamiento, mientras asegura mantenerse en los límites éticos… Y todo esto sin mencionar las habituales competencias técnicas (las hard skills) que se exigen que combine: una persona de matemáticas y estadística, de informática, con orientación al negocio y de hábil comunicación.

La literatura y el cine están llenos de protagonistas mate que saben disimilar cuán increíbles y necesarias o necesarios son. Antiheroínas o antihéroes que son justo lo contrario. De hecho muchas de sus características son propias de los más brillantes escenarios y protagonistas (según recogía aquí nuestro José Ramón Rodríguez no hace tanto). También nosotros las y los reivindicamos en nuestra docencia: en las asignaturas introductorias de nuestro grado, máster y formación de posgrado en ciencia de datos es uno de nuestros objetivos. Está claro que no renunciamos a contribuir a la formación de los más brillantes científicos de datos, pero también está claro que contribuyendo a crear un universo de increíbles profesionales mate del dato, aseguramos también que enfocamos nuestra profesión en la buena dirección. 

L’increïble professional mat de la dada

El que coneixem com a ciència de dades és un univers brillant amb centenars de noms suggeridors. Matt Turck anualment dibuixa amb mètode i gràcia un mapa d’aquest univers (avís: si hi entreu necessitareu una pantalla gran per poder veure’l tot de cop). La llum dels planetes i asteroides de tota mena que hi apareixen, i la de les aventures que s’endevinen en la seva exploració, és prou brillant com per atraure dia rere dia nous equips tècnics, noves companyies buscant or i, també, nou estudiantat.

Però també precisament aquesta complexitat resulta inabastable per a moltes de les organitzacions normals (petites o mitjanes o grans) que se’n poden beneficiar. I per això, com sempre ha passat amb altres novetats TI, calen professionals normals que ajudin a organitzacions i persones normals a treure’n el suc de tot plegat. Aquí volem parlar d’aquestes persones que fan de científic de dades o, millor, de professionals de la dada (usant l’etiqueta del nostre Josep Curto) que es dediquen, no tant a brillar en grans projectes amb grans recursos tecnològics de grans companyies amb gran impacte, com a donar petites grans respostes als petits grans problemes de les organitzacions normals que són el gruix de la nostra economia i societat. Volem provocar, certament, dient-li mat, com a contraposició de brillant. Però és només una petita trampa de narrador aficionat perquè, realment, la foto (i la pintura) mat és la necessària, l’abundant a les nostres cases. Volem defensar, de fet, com d’increïble és.

Primer de tot cal no perdre de vista que ja hi ha necessitat de ciència de dades a tot arreu, per la qual cosa cada vegada serà més necessari formar-se en aquesta disciplina. Per això estem parlant de professionals que saben i no els importa entrar a tot arreu. Estan, doncs, (i recordem ara una obvietat que de vegades s’oblida) orientades i orientats al servei. Volen respondre les preguntes de les seves companyies clients, les que ajudaran a prendre decisions pel negoci fonamentades en les dades (no pas satisfer les seves pròpies curiositats que com a professionals podrien extreure dels datasets que tenen a l’abast).

A la seva clientela, aquesta o aquest professional els ha d’explicar els límits i possibilitats de la tecnologia, fer de mestre donant-los exemples d’ús, i adaptant-los al seu nivell. I això sovint no serà fàcil perquè moltes d’aquestes organitzacions clients en la classificació de maduresa de Davenport cauran més a prop de la categoria dels analytically impaired (aquelles que, centrades en el seu dia a dia, encara no han pogut posar ordre a les dades que disposen i connectar-les entre elles) que d’avançades companyies analítiques (aquelles que ja fan servir la dada, exprimint-la i relacionant-la a tots els nivells, per generar avantatges competitius).

Els professionals de la dada volen respondre les preguntes de les seves companyies clients, les que ajudaran a prendre decisions pel negoci fonamentades en les dades.

Posar límits vol dir manegar clientela ansiosa d’informació ràpida i solucions permanents, a qui la publicitat i algun reportatge excessiu, ha fet creure que això de la ciència de dades és poc més que la solució a tots els seus problemes. Li toca a la i al professional de la dada, fer entendre que de vegades les respostes obtingudes són temporals perquè les preguntes també ho han de ser: com se li diu a la persona que ens finança que cal invertir diners i potser els resultats serviran només un temps…? Com es fa entendre que la pregunta “Com es comporta ara la nostra massa client?” té l’accent a l’ara, precisament? Que la resposta, en un entorn canviant com l’actual, pot ser del tot diferent demà? Aquesta o aquest professional, en aquestes circumstàncies ha de fer una altra cosa de mèrit: guanyar la confiança i patrocini de l’organització client.

Per un altre costat aquesta dificultat es veu incrementada amb l’altra realitat dels projectes de ciència de dades que és que, habitualment, han de treballar-se des d’una perspectiva àgil perquè malgrat l’objectiu acostuma a estar clar, la solució (com analitzar les dades, com presentar la informació…) no sempre ho està i cal anar arribant-hi per aproximacions successives. Aquí, aquesta clientela ansiosa pot veure reforçades les seves temptacions de demanar constantment canvis –no tant apropant-se a la solució, com és acceptable en un projecte àgil, sinó allunyant-se de l’objectiu marcat inicialment. La i el professional mat de la dada, un cop més, haurà d’ajudar a limitar les expectatives i a manegar algunes possibles insatisfaccions.

Aquesta o aquest professional, en aquest context, ha de cuidar la dada, és a dir, vetllar per la seva qualitat d’origen, entendre que no totes les dades serveixen pel mateix, i que la dada real i única, sovint no és gens trivial de trobar. Les presses i les pressions no l’ajudaran a aquesta cura. Però, sigui com sigui, li cal ser capaç de mantenir espais per cultivar l’escepticisme cap al coneixement establert, cap als resultats obvis i esperables dels algorismes dominants, i alimentar la curiositat per l’observació de tot plegat. I això també vol dir tenir una actitud de gaudir de les possibilitats de la llibertat i la independència en el seu treball diari. No tothom sap o vol treballar en aquest context de llibertat, perquè sovint implica cert treball en solitari.

Aquest cert aïllament, a més, de vegades és físicament real: hi ha tanta demanda de professionals que no sempre n’hi ha en els nivells que calen realment per a un projecte, o, pitjor, hi ha persones que volen actuar com a tals professionals –per voluntarisme les millors, o per intrusisme les més aprofitades- sense ser-ho. I aquí treballar amb aquestes persones també requereix un exercici de detecció i adaptació i, de nou, de fer de mestre per ajudar a ampliar les competències de l’equip. I, amb elles, assegurar un comportament ètic/moral que garanteixi tenir no només bones i bons professionals sinó professionals bones i bons, amb capacitat d’assegurar que els resultats del seu treball s’obtenen respectant individualment les persones i evitant al màxim els efectes negatius en elles i, encara més, evitant deixar obertes portes a futurs usos indeguts si hi entrés la persona no adequada.

El professional de la dada ha de vetllar per la qualitat d’origen de la dada, entendre que no totes les dades serveixen pel mateix i que la dada real i única sovint no és gens trivial de trobar.

En definitiva: no és increïble el perfil d’aquest professional mat que hem dibuixat? Orientat al servei, que interpreta l’univers de possibilitats del mapa de Turck, que fa de mestre i sap respondre les preguntes i posar límits a les seves organitzacions clients, treballant amb una perspectiva àgil i iterativa mentre controla la insatisfacció, cuida les dades cultivant l’escepticisme perquè siguin les bones, i sovint en cert aïllament,  mentre assegura mantenir-se en els límits ètics…! I tot això sense entrar a esmentar les habituals competències tècniques (les hard skills) que s’exigeixen que combini: una persona de matemàtica i estadística, d’informàtica, amb orientació al negoci i d’hàbil comunicació.

La literatura i el cinema estan plens de  protagonistes mat que saben dissimular com d’increïbles i necessàries i necessaris són. Antiheronies o antiherois que són just el contrari. De fet moltes de les seves característiques són pròpies dels més brillants escenaris i protagonistes (segons recollia aquí el nostre José Ramón Rodríguez no fa tant). També nosaltres les i els reivindiquem en la nostra docència: en les assignatures introductòries dels nostres grau, màster i formació de postgrau en ciència de dades és un dels nostres objectius. És clar que no renunciem a contribuir a la formació dels més brillants científics de dades, però també és clar que contribuint a crear un univers d’increïbles professionals mat de la dada, assegurem també que enfoquem la nostra professió en la bona direcció. 

(Visited 35 times, 1 visits today)
Autor / Autora
Josep Maria Marco-Simó
Profesor de los Estudios de Informática, Multimedia y Telecomunicación de la UOC en el ámbito de proyectos de TI y director de programa del Máster Universitario en Ingeniería Informática.
Comentarios
Patricia18 enero, 2023 a las 4:19 pm

Ciertamente es necesario que las empresas de todos los tamaños se den cuenta de que sin datos fiables no hay futuro. Está en manos de todos los profesionales del dato, desmitificar la ciencia del dato como algo exclusivo de las grandes empresas.

Responder
Manajemen25 septiembre, 2023 a las 5:30 am

How can organizations and educational institutions contribute to the development of such professionals in the field of data science?

Responder
Deja un comentario