Celebramos el Día mundial de la Estadística

20 octubre, 2020
dia-mundial-estadistica

(Més avall trobareu la versió en català d’aquest contingut.)

El 3 de junio de 2010, la Asamblea General de las Naciones Unidas acordó declarar el 20 de octubre de ese mismo año como el Día Mundial de la Estadística reconociendo, entre otras cuestiones, 

la larga historia de las estadísticas oficiales y la función facilitadora que han desempeñado las Naciones Unidas desde la creación, en 1947, de la Comisión de Estadística, a la que se encomendó el mandato de fomentar el desarrollo de estadísticas nacionales y mejorar su comparabilidad […]

En definitiva, la ONU estaba reconociendo la importancia que tiene la estadística oficial en la organización de las naciones y proponía celebrarla de manera oficial cada 5 años, siendo este 20 de octubre de 2020 el momento de volver a hacerlo. 

Y lo cierto es que, cuando la ONU habla de larga historia de las estadísticas oficiales no se equivoca ya que la estadística ha jugado un papel fundamental de apoyo a la sociedad a lo largo de los siglos. De hecho, el origen de la palabra “estadística” lo encontramos en la palabra alemana Statistik que proviene, a su vez, del latín status (estado) + el sufijo icus (relativo a) y viene a significar “la ciencia del estado”, y aunque el término fue popularizado por el economista alemán Gottfried Achenwall (1719-1772) en el siglo XVIII lo cierto es que el uso de la estadística en la gestión de las ciudades y los estados, ya venía de largo. 

De hecho, si pensamos en el inicio de las estadísticas oficiales, podemos remontarnos al siglo XVII, cuando John Graunt (1620-1674), padre de la demografía y la bioestadística, calculó la que se conoce como la primera tabla de (esperanza de) vida en la que estimaban las probabilidades de supervivencia para cada edad, basándose en los registros de mortalidad de la ciudad de Londres. Años más tarde, Edmund Halley (1656-1742), más conocido por el cálculo de la órbita del cometa que lleva su nombre, mejoró las predicciones de Graunt con métodos muy similares a los que se usan hoy en día para el cálculo de las primas de los seguros de vida. Se trataba de estudiar los datos disponibles de forma sistemática para facilitar la organización de los estados. 

Sin embargo, los orígenes de la estadística como forma de aproximarnos al mundo que nos rodea son mucho más antiguos siendo la guerra y la salud algunas de sus primeras aplicaciones. Por ejemplo, Tucídides (460 a.C.-¿396 a.C.?) cuenta en su Historia de la Guerra del Peloponeso que en el 428 a.C. para determinar la altura de un muro durante el asedio a la antigua ciudad de Platea, se pedía a los soldados que contaran el número de ladrillos que tenía el muro, después se seleccionaba el valor que más se repetía (la moda) y se multiplicaba por la altura de un ladrillo para obtener un valor que permitiese tejer cuerdas o construir escaleras óptimas para escalarlo. 

La validez del uso de grandes cantidades de datos se formaliza cuando Jacob Bernoulli (1654-1705) demuestra la ley de los grandes números, fundamental para la estimación de cualquier cantidad de interés y se populariza a la vez que el uso del término Estadística, en el siglo XVIII. Un siglo que trae de la mano a las figuras de Thomas Bayes (1702-1761) y su famoso teorema, o a Pierre-Simon Laplace (1749-1827), que trabajó con los datos y la probabilidad obsesionado con demostrar la ley de la gravitación de Newton.

A partir de ese momento, la metodología estadística se expande cada vez más en un intento de hacer frente a los nuevos retos del conocimiento y durante el siglo XIX se desarrollan técnicas como la regresión lineal, gracias a la conjunción de los mínimos cuadrados de Adrien-Marie Legendre (1752-1833) y la distribución normal de Karl Friedrich Gauss (1777-1855). En este mismo siglo John Snow (1813-1858) desarrolla los primeros mapas de enfermedades para entender y frenar el cólera, sentando las bases de la estadística espacial y, apenas unos años más tarde, Florence Nightingale (1820-1910), destinada como enfermera a la guerra de Crimea (1853-1856), demuestra, gracias a la estadística, que las prácticas de enfermería basadas en la higiene y el orden eran capaces de salvar las vidas de los soldados. Florence sienta, además, las bases de la visualización de datos con un gráfico precursor del diagrama de tarta conocido como la Rosa de Nightingale. 

Gráfico, Diagrama  Descripción generada automáticamente

Diagrama de Rosa de Florence Nightingale mostrando las causas de mortalidad durante la guerra de Crimea

Sin embargo, el mayor despegue de la estadística llegó de la mano de los avances tanto en computación, con los diseños de Charles Babbage (1791-1871) y el desarrollo del que se considera el primer programa de ordenador, realizado por Ada Lovelace (1815-1852), como en la metodología, con la aparición de la matemática financiera y los mecanismos de optimización y control de los procesos industriales. Es el momento en que Sir Ronald A. Fisher (1890-1962) establece la importancia del diseño experimental y lo aplica de manera sistemática en agricultura, desarrollando, al mismo tiempo y en paralelo a Jerzy Neyman (1894-1981) y Eagon S. Pearson (1895-1980), la metodología del contraste de hipótesis.

La llegada del siglo XX y las Grandes Guerras no hace más que enfatizar la importancia de una ciencia que permitió, entre otras cosas,  que  durante la II Guerra Mundial (1939-1945) Alan Turing (1912-1954)  descifrase los mensajes que el ejército alemán había encriptado mediante el uso de la máquina  Enigma o que se estimase el número de tanques que tenía el ejército enemigo, a partir de los números de serie de aquellos que se encontraban en el campo de batalla.  

Estatua de Alan Turing en el Bletchley Park Museum. 

Pero es en el siglo XXI donde la estadística se ha venido a enfrentar a su mayor reto. Con la aparición a finales de los noventa del término Big Data, queda patente la creciente capacidad de acumular información. De hecho, en el 2002, ya se consideraba que la cantidad de información almacenada de manera digital sobrepasaba la no digital haciendo evidente la necesidad de pensar en nuevas formas de análisis y manejo de datos que nos llevan a lo que hoy en día se conoce como la Ciencia de Datos y que fue formalizada por primera vez en el artículo Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics, de William S. Cleveland (1943–). 

Tal y como Cleveland la describe, la Ciencia de Datos es una disciplina multidisciplinar formada de diversas ciencias donde la unión de la capacidad de computación y los avances en matemáticas y estadística nos permitirán afrontar los retos del futuro. Retos que, por muy complejos que nos parezcan, no distan tanto de aquellos con los que nació la Comisión de Estadística de la ONU que en la resolución en la que se declaraba el 20 de octubre de 2015 como segundo Día Mundial de la Estadística hablaba claramente de: 

la función decisiva que desempeña la información estadística oficial de alta calidad para el análisis y la adopción de decisiones en materia de políticas bien fundadas en apoyo del desarrollo sostenible.

Por toda su historia, y por todo lo que le queda por aportar, celebremos hoy el día de la Estadística.  

Celebrem el Dia mundial de la Estadistica

dia-mundial-estadistica

El 3 de juny de 2010, l’Assemblea General de les Nacions Unides va acordar declarar el 20 d’octubre d’aquell mateix any com el Dia Mundial de l’Estadística reconeixent, entre altres qüestions, 

la llarga història de les estadístiques oficials i la funció facilitadora que han exercit les Nacions Unides des de la creació, el 1947, de la Comissió d’Estadística, a la qual es va encomanar el mandat de fomentar el desenvolupament d’estadístiques nacionals i millorar la seva comparabilitat [… ].

En definitiva, l’ONU estava reconeixent la importància que té l’estadística oficial a l’organització de les nacions i proposava celebrar-la de manera oficial cada 5 anys, sent aquest 20 d’octubre de 2020 el moment de tornar a fer-ho.

I la veritat és que quan l’ONU parla de llarga història de les estadístiques oficials no s’equivoca ja que l’estadística ha jugat un paper fonamental de suport a la societat al llarg dels segles. De fet, l’origen de la paraula «estadística» el trobem en la paraula alemanya Statistik que prové del llatí status (estat) + el sufix icus (relatiu a) i ve a significar «la ciència de l’estat», i encara que el terme va ser popularitzat per l’economista alemany Gottfried Achenwall (1719-1772) al segle XVIII la veritat és que l’ús de l’estadística en la gestió de les ciutats i dels estats es va iniciar molt abans.

De fet, si pensem en l’inici de les estadístiques oficials, podem remuntar-nos a al segle XVII, quan John Graunt (1620-1674), pare de la demografia i la bioestadística, va calcular el que es coneix com la primera taula de (esperança de) vida en què estimaven les probabilitats de supervivència per a cada edat, basant-se en els registres de mortalitat de la ciutat de Londres. Anys més tard, Edmund Halley (1656-1742), més conegut pel càlcul de l’òrbita de l’estel que porta el seu nom, va millorar les prediccions de Graunt amb mètodes molt similars als que es fan servir avui dia per al càlcul de les primes de les assegurances de vida. Es tractava d’estudiar les dades disponibles de forma sistemàtica per facilitar l’organització dels estats.

No obstant això, els orígens de l’estadística com a forma d’aproximar-nos al món que ens envolta són molt més antics sent la guerra i la salut algunes de les seves primeres aplicacions. Per exemple, Tucídides (460 a.C.-¿396 a.C.?) explica en la seva Història de la Guerra del Peloponès que en el 428 a.C. per determinar l’altura d’un mur durant el setge a l’antiga ciutat de Platea, es demanava als soldats que comptessin el nombre de maons que tenia el mur, després es seleccionava el valor que més es repetia (la moda) i es multiplicava per l’altura d’un maó per a obtenir un valor que permetés teixir cordes o construir escales òptimes per escalar-lo.

La validesa de l’ús de grans quantitats de dades es formalitza quan Jacob Bernoulli (1654-1705) demostra la llei dels grans nombres, fonamental per a l’estimació de qualsevol quantitat d’interès i es popularitza alhora que l’ús del terme Estadística, en al segle XVIII. Un segle que porta de la mà a les figures de Thomas Bayes (1702-1761) i el seu famós teorema, o PierreSimon Laplace (1749-1827), que va treballar amb les dades i la probabilitat obsessionat amb demostrar la llei de la gravitació de Newton.

A partir d’aquest moment, la metodologia estadística s’expandeix cada vegada més en un intent de fer front als nous reptes del coneixement i durant el segle XIX es desenvolupen tècniques com la regressió lineal, gràcies a la conjunció dels mínims quadrats de Adrien-Marie Legendre (1752-1833) i la distribució normal de Karl Friedrich Gauss (1777-1855). En aquest mateix segle John Snow (1813-1858) desenvolupa els primers mapes de malalties per entendre i frenar el còlera, establint les bases de l’estadística espacial i, tot just uns anys més tard, Florence Nightingale (1820-1910), destinada com a infermera a la guerra de Crimea (1853-1856), demostra, gràcies a l’estadística, que les pràctiques d’infermeria basades en la higiene i l’ordre eren capaços de salvar les vides dels soldats. Florence assenta, a més, les bases de la visualització de dades amb un gràfic precursor del diagrama de pastís conegut com la Rosa de Nightingale.

Gráfico, Diagrama  Descripción generada automáticamente
Diagrama de Rosa de Florence Nightingale mostrant les causes de mortalitat durant la guerra de Crimea

No obstant això, el major enlairament de l’estadística va arribar de la mà dels avenços tant en computació, amb els dissenys de Charles Babbage (1791-1871) i el desenvolupament del que es considera el primer programa d’ordinador, realitzat per Ada Lovelace (1815 -1852), com en la metodologia, amb l’aparició de la matemàtica financera i els mecanismes d’optimització i control dels processos industrials. És el moment en què Sir Ronald A. Fisher (1890-1962) estableix la importància del disseny experimental i l’aplica de manera sistemàtica en agricultura, desenvolupant, al mateix temps i en paral·lel a Jerzy Neyman (1894-1981) i Eagon S. Pearson (1895-1980), la metodologia del contrast d’hipòtesis.

L’arribada del segle XX i les Grans Guerres no fa més que emfatitzar la importància d’una ciència que va permetre, entre altres coses, que durant la II Guerra Mundial (1939-1945) Alan Turing (1912-1954) desxifrés els missatges que l’exèrcit alemany havia encriptat mitjançant l’ús de la màquina Enigma o que s’estimés el nombre de tancs que tenia l’exèrcit enemic, a partir dels números de sèrie d’aquells que es trobaven en el camp de batalla.

Estàtua d’Alan Turing en el Bletchley Park Museum.

Però és en el segle XXI on l’estadística s’enfronta al seu major repte. Amb l’aparició a finals dels noranta del terme Big Data, queda patent la creixent capacitat d’acumular informació. De fet, al 2002, ja es considerava que la quantitat d’informació emmagatzemada de manera digital sobrepassava la no digital fent evident la necessitat de pensar en noves formes d’anàlisi i maneig de dades que ens porten al que avui dia es coneix com la Ciència de Dades i que va ser formalitzada per primera vegada en l’article Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics, de William S. Cleveland (1943–).

Tal com Cleveland la descriu, la Ciència de Dades és una disciplina multidisciplinar formada de diverses ciències on la unió de la capacitat de computació i els avanços en matemàtiques i estadística ens permetran afrontar els reptes de futur. Reptes que, per molt complexos que ens semblin, no disten tant d’aquells amb els quals va néixer la Comissió d’Estadística de l’ONU que, en la resolució en la qual es declarava el 20 d’octubre de 2015 com a segon Dia Mundial de l’Estadística, parlava clarament de:

la funció decisiva que exerceix la informació estadística oficial d’alta qualitat per a l’anàlisi i l’adopció de decisions en matèria de polítiques ben fundades en suport del desenvolupament sostenible.

Per tota la seva història, i per tot el que li queda per aportar, celebrem avui el dia de l’Estadística

(Visited 41 times, 1 visits today)
Autor / Autora
Profesora agregada en el departamento de Estadística e Investigación Operativa de la Universidad de Valencia. Sus principales líneas de investigación son: cuantificación Bayesiana de la incertidumbre en selección de modelos y modelos Jerárquicos Bayesianos para datos correlados. También es divulgadora científica y ha participado en proyectos como StatWars: El Imperio de los datos y Girls4STEM. Es autora de materiales y profesora colaboradora de la asignatura de Modelización e Inferencia Bayesiana en el grado de Ciencia de Datos Aplicada de la UOC.
Comentarios
Deja un comentario