Big Data: dónde estamos

A medida que pasa el tiempo, el término Big Data es cada vez más habitual y los casos de uso se empiezan a normalizar (aunque no para todos). De hecho, ciertas empresas de prospección de mercado ya están empezando a hablar de otros términos. No en vano deben vivir de la novedad y lo que alcanza un cierto grado de madurez representa mercados que no crecen. Por ejemplo, Gartner ya parece que quiere matar el término (echadle un vistazo a uno de sus últimos informes: Hype Cycle Advance Analytics and Data Science July 2015). Si esto es cierto o no, da mucho para hablar y para discutir. Y en cierta manera, me alegro. El término siempre ha traído una confusión demasiado grande (porque la definición no es formal) y al final esto va sobre la complejidad de los datos a analizar.

Moscú, Russia. Fuente: Josep Curto

Moscú, Russia. Fuente: Josep Curto

Por lo que levantemos nuestras copas y digamos: “Big Data ha muerto, larga vida al Big Data”. Así que continuamos hablando el tema, ¡como si nos importara si vamos a llamarle A o B en el futuro! Porque, al final, la complejidad del conjunto de datos relevante para nuestra organización va a ser un campo de batalla recurrente durante las próximas décadas y continuaremos creando mecanismos para reducir y controlar dicha complejidad.

En esa línea esto me recuerda que hace unos días he tenido la oportunidad de hablar en el evento IT Leader Forum 2015 en Moscú. El tema principal de este evento es el rol de la tecnología en la innovación de las compañías. Y está claro que el dato y su explotación es uno de los puntos a tener en cuenta si una compañía quiere innovar (aunque no es la única, claro).

El tema de mi ponencia era Big Data and Information Modelling. Como os podéis imaginar por tan sugerente tema, la hipótesis central del tema es que la modelización sigue siendo relevante (aunque ya no siempre al modelizar nos acerquemos a los modelos relacionales o multidimensionales). A modo de ejemplo, comenté tres escenarios dónde nos encontramos Big Data y cómo se combina la modelización relacional y no relacional. Y de esto quiero hablar hoy. La madurez viene acompañada de casos de uso y de grandes categorías. Actualmente se observan tres (eso no significa que en el futuro podamos identificar más):

  • Toma de decisiones (tradicional): las organizaciones ha fundamentado su toma de decisiones en sistemas de inteligencia de negocio y el enterprise data warehouse. A medida que más fuentes de datos no estructuradas son necesarias para tomar las decisiones, es necesario extender el data warehouse para que pueda acceder a esta información. Hay varias aproximaciones al tema, desde las que promulgan el uso de Business Intelligence sobre tecnologías de almacenamiento de Big Data hasta otras que simplemente usan éstas como staging areas.
  • Inteligencia operacional: las organizaciones necesitan cada vez más controlar sus procesos de negocio (que se han digitalizado y que continúan haciendo, claro). En el pasado se han apoyado en tecnologías como BAM (Business Activity Monitoring) o CEP (Complex Event Processing). Ahora ya estamos en la fase que estas tecnologías deben extenderse mediante las tecnologías de almacenamiento y procesamiento de Big Data para poder tomar decisiones operacionales (o incluso sustituirse por ellas).
  • Data Discovery (o descubrimiento): por último, hay veces que aunque la organización ha sido capaz de conocer lo que pasa (primer caso) o incluso monitorizarlo y aplicar ciertos algoritmos en “tiempo real” (segundo caso), no conoce porqué han sucedido ciertos eventos y debe verificar algunas hipótesis que podrían describir el fenómeno. No se trata de investigar el complejo conjunto de datos sin ton ni son (cosa que es posible que en la organización sea utópico de plantear), sino de un análisis sistemático del mismo a partir de una necesidad y contexto de negocio. Es necesario habilitar un entorno dedicado a estos menesteres que puede ser diferente en el tiempo y que puede alimentar a los anteriores.

Por lo que, a medida que una empresa es más y más madura, va identificado casos de uso que caen en uno de estos tres entornos. Entornos que tienen necesidades y usuarios diferentes y que frecuentemente serán infraestructuras diferentes. Lo que va a complicar en definitiva que estas iniciativas lleguen a buen puerto. Así que es bien probable que aun usemos el término de Big Data en los próximos años para referirnos a la complejidad del dato, aunque como ya he comentado no tengamos una definición formal que satisfaga a casi nadie.

Josep Curto es colaborador docente del Máster en Inteligencia de Negocio y Big Data (MiB) de la UOC. Es además Director de Delfos Research, empresa especializada en investigación de los mercados de Business Intelligence, Business Analytics y Big Data.

CC BY-NC-SA 4.0 Big Data: dónde estamos por Colaborador UOC está licenciado bajo una Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.

1 Comment

  1. Como dice Josep, aunque acabe pasando cualquier cosa con los palabros y su gancho mediático, a medida que la adopción del tratamiento de datos masivos aumenta entre las empresas y madura la propuesta de valor de fabricantes y proveedores de servicios, comenzamos a saber dónde estamos y a clarificar diferentes familias de utilidades para diferentes tipos de usos.
    Animo a Josep y otros colegas del ramo a que nos hagan, entre avión y avión, un poco de pedagogía.
    Buen post, Josep, gracias por tus contribuciones.

    Reply

Trackbacks/Pingbacks

  1. Big Data & Learning Analytics – Josep Curto - […] lo poco que se permea a nivel organizativo. También comentamos los casos de uso (que he apuntado aquí) y…

Comentar

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Leer entrada anterior
Gear VR y realidad virtual

Sin necesariamente darnos cuenta, hemos dado un paso más hacia la realidad virtual: desde el 10 de noviembre se puede...

Cerrar