Cerrar panel

Cerrar panel

Cerrar panel

Cerrar panel

Fronteras del conocimiento Act. 05 mar 2018

Premio Fronteras para los estadísticos que revolucionaron el análisis de datos

El trabajo de David Cox y Bradley Efron es fundamental para la medicina, la astrofísica, la genómica y cualquier otra ciencia que dependa del análisis de datos. El hallazgo del bosón de Higgs o la investigación del cáncer y el sida tienen mucho que agradecer a los dos matemáticos premiados por la Fundación BBVA.

Imagen de David Cox y Bradley Efron, Premio Fundación BBVA Fronteras del Conocimiento en Ciencias Básicas 2016

David Cox y Bradley Efron han sido galardonados con el Premio Fundación BBVA Fronteras del Conocimiento en la categoría de Ciencias Básicas por desarrollar métodos estadísticos “pioneros y enormemente influyentes”.

“Los métodos de Cox y Efron se usan diariamente en la práctica de la ciencia estadística, y han tenido un gran impacto en todas las ciencias que dependen del análisis de datos”, señala el acta del jurado. Para el matemático Trevor Hastie, catedrático de la Universidad de Stanford y miembro de este jurado, “son los dos estadísticos vivos más influyentes hoy en día y han revolucionado este campo”.

En concreto, la contribución de Cox, llamada precisamente “regresión de Cox” en homenaje a su creador, es una herramienta muy poderosa para explicar la duración de un intervalo temporal entre dos eventos que dependen de factores identificables y no del mero azar. Por ejemplo, la mortalidad de un grupo de personas por una determinada enfermedad, o como consecuencia de un factor de riesgo como la contaminación ambiental.

Como muestra de un resultado médico obtenido gracias a esta técnica estadística, el acta del jurado cita el hallazgo de que, al cabo de un año de haber dejado de fumar, ya se detecta un descenso de la mortalidad.

David Cox, profesor de la Universidad de Oxford, se muestra “enormemente sorprendido y satisfecho” por la variedad de los problemas científicos para los que su contribución ha sido útil, y destaca su aplicación en medicina: “Sirve para estudios de pacientes con cáncer… hay muchos factores que influyen en la supervivencia del sujeto, como su entorno social, su sexo, su edad… ¿cuál es importante?”.

Ese es el tipo de pregunta que permite resolver su técnica, publicada en 1972, en el que es hoy día el segundo trabajo en estadística más citado en la moderna literatura científica

El mejor actor secundario de la estadística

Bradley Efron, profesor de Estadística de la Universidad de Stanford, ha inventado un método, llamado bootstrap (literalmente, lengüeta de bota), para determinar el margen de error de una medida. Este dato es esencial en ciencia, porque sin él el resultado carece de valor.

El nombre bootstrap surge de los cuentos del Barón de Münchhausen, del siglo XVIII, a los que Efron es aficionado, y hace referencia al funcionamiento de la técnica en sí. En uno de los cuentos el barón se salva a sí mismo de ahogarse en un lago “tirando de la lengüeta de sus propias botas”, explica Efron; la técnica bootstrap se basa en que los datos de la muestra que debe ser analizada se muestrean de nuevo aleatoriamente una y otra vez, de forma que son esos mismos datos, y no otros adicionales, los que acaban proporcionando el margen de error.

En cualquier investigación, el papel protagonista lo tiene el algoritmo que pretende responder a la pregunta que se hace el investigador, y el papel secundario es averiguar el grado de precisión de la respuesta que se obtiene, explica Efron “Así que el bootstrap casi nunca es la estrella, pero se ha convertido en el mejor actor secundario de la estadística”.

Efron reconoce que el papel de la estadística en la ciencia es “menos divertido” que la investigación que genera los datos, pero al mismo tiempo reivindica su necesidad: “Los científicos recogen los datos, nosotros los analizamos. Por ejemplo, en la búsqueda del bosón de Higgs lo que haces es recolectar un montón de datos que, en última instancia, te generan un pico en una gráfica. Pero, ¿cómo estás seguro de que ese pico es real y no un artefacto estadístico (factor que perturba la correcta interpretación del resultado)? El bootstrap te lo dice”.