Sobre el futuro de la estadística. Una segunda visión

Este artículo publicado en 1968 tiene actualidad pues recoge aspectos importantes sobre el futuro de la estadística que trascienden los años. Kendall escribe su segunda visión del problema luego de la primera 25 años atrás. La revista Estadística Española publica una discusión sobre esta segunda visión de Kendall posteriormente.

Por M. G. KENDALL
C-E-I-R Ltd.

Artículo publicado en la revista Journal of the Royal Statistical Society, Series A (general), volumen 131, parte 2, 1968, con el título «On the Future of Statistics a Second Look», habiendo sido autorizada su publicación en ESTADÍSTICA ESPAÑOLA, por el autor y la citada revista. Read before the Royal Statistical Society, on Wednesday, January 17 th, 1968, the President, Dr. F. Yates, C. B. E., F. R. S., in the Chair.

1. Hace veinticinco años presenté un informe a esta sociedad «Sobre el futuro de la estadística. Lo escribí con cierto espíritu de optimismo, durante la segunda guerra mundial, cuando sentíamos que, después de todo, no íbamos a perder la guerra; así que teníamos a la vista un futuro al cual mirar. En nuestros días tiene interés sólo en tres aspectos: creo que es el único informe leído a la sociedad que no contiene información numérica de ninguna clase; predecía correctamente la mayor parte de lo que iba a ocurrir en el mundo estadístico, exceptuando que mi escala temporal fue errónea -lo que pensé que tardaría veinte años en suceder, sólo tardó diez-, y contenía un notable error en un aspecto, pues yo pensaba que las diferentes escuelas de inferencia estadística habrían pactado una tregua y estarían dispuestas a reconciliar sus diferencias en una especie de «concilio ecuménico», y en la actualidad están todavía trabajando asiduamente al margen de los demás con un fervor que no ha disminuido.

2. No hay nada como una mirada al futuro para ayudar a comprender lo que se espera del presente; debido a esto, parece adecuado dirigir otra mirada al futuro de la estadística para especular sobre lo que puede esperarse de los próximos veinte años.

Quizás hoy podemos hacer algo que era imposible hace veinticinco años, y considerar la potencia con que las sociedades estadísticas mundiales organizadas pueden actualmente influir en el desarrollo futuro.

3. No trataré de describir con todo detalle la historia de la estadística en los últimos veinticinco años. Todos sabemos lo que ha ocurrido, al menos superficialmente. Pero hay una cosa importante que decir al contemplar el pasado antes de mirar al futuro. En el curso de su historia la estadística teórica ha conocido tres importantes movimientos creativos: la invención de la aritmética política, en los siglos XVII y XVIII, cuando el hombre empezó a razonar con material demográfico; la formulación de las leyes de distribución de frecuencias y de la interdependencia estadística, en el siglo XIX, y los desarrollos matemáticos de la primera mitad del siglo XX. Yo creo que el ímpetu de los tres está extinguido. No quiero decir con esto que no queda nada por hacer en el campo ya existente dentro de los límites de la materia según se la considera actualmente. Al contrario, más tarde indicaré algunos baches importantes que es preciso rellenar. Lo que quiero decir es que ni el movimiento Pearsoniano ni el Fisheriano están extendiendo aún las fronteras de nuestra materia. Estamos en el final de una era. Si nos encontramos al comienzo de otra, en el sentido de que los desarrollos en las próximas dos a tres décadas puedan ser agrupados en una simple línea de pensamiento es algo que más bien dudo. No estamos destacando en ninguna dirección especial y, consecuentemente, es mucho más difícil predecir las líneas futuras de desarrollo que hace veinticinco años.

4. Antes de considerar a dónde se dirige nuestra materia será mejor examinar qué clase de materia es en la actualidad. Pues, incluso considerando las dos o tres décadas pasadas, ha cambiado algo su naturaleza y tiene ahora cierto peligro de perder su identidad. Al extenderse la cuantificación de las ciencias físicas a las sociales, y de allí a los sistemas de gobierno y control comercial, se ha producido una escala completa de temas, todos ellos motivados por el mismo estímulo, el deseo de encontrar métodos científicos en que basar la organización y estructura de todo tipo de actividad. Así tenemos: Matemáticas aplicadas, Estadística, Investigación operativa, Ciencia actuarial, Cibernética, Ergonomía, Estudios de organización y métodos, Ciencia empresarial. Y numerosos temas obtenidos al añadir «metría» a ramas de las humanidades: Econometría, Psicometría, Biometría, Sociometría, Eceterametria

5. Ahora es posible sustentar y soy uno de los que proponen esta tesis--- que la estadística, en su sentido más amplio, es la matriz de toda ciencia experimental y, por consiguiente, una rama del método científico, si no el Método Científico por excelencia, y que supera la aplicación del método científico en diversos campos de especialización. El hombre de ciencia debería conocer la estadística como conoce el lenguaje lógico y formal, para comunicar sus ideas. Esto está muy bien como un ideal, y no nos cabe duda de que nos confiere un sentimiento placentero de nuestra propia importancia. Sin embargo, subsiste el simple hecho de que todas las materias que he mencionado tienen sus sociedades propias, sus propias revistas y sus conferencias propias, y no digamos las sociedades de ingeniería y cómputo. Dudo si algunas de ellas estarían dispuestas a considerarse a sí mismas como subsecciones de una disciplina científica dominante: la estadística.

6. Me parece que ocurrirá una de estas dos cosas: el contenido metodológico de la inferencia estadística se fundirá con la lógica, las matemáticas aplicadas y las lingüísticas científicas para formar una materia nueva, el Método Científico en sentido amplio, mientras que la estadística formal, es decir, la teoría de las distribuciones se convertirá en una disciplina de más bajo orden, como las matemáticas formales; o nuestra materia continuará expandiéndose por un camino accidental a lo largo de las otras que he mencionado, teniendo que definir una vez más, como en el pasado, la estadística, no por referencia al marco lógico de la organización de la ciencia, sino simplemente por lo que hacen los estadísticos. Preferiría que ocurriera lo primero, pero creo que ocurrirá esto último. La ciencia no se desarrolla de forma científica. El desarrollo en todas estas materias creo que estará más influenciado por el carácter de las personalidades y aptitudes de la gente que trabaje en ellas que por cualquier plan lógico de la ciencia en su conjunto.

7. Durante los últimos cincuenta años hemos visto un inmenso y fructífero cultivo de los métodos matemáticos en estadística teórica; tanto que en la actualidad la estadística teórica se identifica generalmente con la estadística matemática. Los estadísticos han constituido un don divino para los matemáticos, que estaban empezando a pasar uno de esos períodos de esterilidad por los que la matemática pura atraviesa de vez en cuando. Casi todas las ramas de la matemática estudiadas exhaustivamente en el siglo XIX se han sacado del rincón empolvado en que yacían y puesto a trabajar en la solución de problemas estadísticos.

Pero esto ha ido bastante lejos, y, en mi opinión, demasiado lejos. El deseo natural y perfectamente legítimo del matemático puro de generalizar y abstraer trae consigo el peligro de convertir nuestra materia en matemática estadística y oscurecer el hecho de que, como estadísticos, nos hemos interesado en la estadística matemática. Puede que algo de esto construya, tal vez, una faceta inevitable del desarrollo de nuestro tema, pero temo que la mayor parte se deba a debilidad humana: el impulso hacia la mística, la presunción de que algunas personas están inclinadas y otras son conducidas en la lucha por el reconocimiento científico, y el deseo natural de disfrazar un residuo estadístico de avance teórico y una indiferencia general a ser comprendidos excepto por una pequeña élite.

8. Siempre ha existido una tendencia de la llamada «matemática aplicada», al menos como se enseña en las universidades, de degenerar --¿puedo decir degenerar?-- en matemática pura conducida en un lenguaje especializado; por ejemplo, teoría del potencial, del calor, luz y sonido o de electricidad y magnetismo. Puedo recordar que al dejar Cambridge era capaz de expresar las ecuaciones de Maxwell en tensores cartesianos cuatridimensionales, pero era incapaz de explicar cómo trabajaba un aparato de radio. Sería una lástima que la estadística teórica siguiera el mismo camino. La situación presente es mala. Lo peor es el abismo que se está desarrollando entre la estadística teórica y lo que usualmente se llamaba estadística descriptiva. Tenemos aún en la memoria hombres como Bowley; Yule, Greenwood, entendidos por igual en ambas disciplinas, pero esa raza se está extinguiendo, Podría haberse extinguido ya de no haber sido por el hecho de que la segunda guerra mundial forzó a numerosos estadísticos teóricos a trabajar para el Gobierno y obligó a algunos de ellos a tomar gran interés por las datos económicos y sociales.

9. La cuestión es si deberíamos intentar que este resquebrajamiento se agudizase o si nos contentamos con ver a la estadística teórica tomar un camino, como una rama de la metodología científica, y la estadística descriptiva otro, como una rama de recogida de datos y sumarización. Siempre que los seguidores de ambas disciplinas estén dispuestos a asociarse y discutir campos de intereses superpuestos, no hay ningún mal en semejante desarrollo. Esta sociedad ha mantenido juntos, no sin dificultad, los dos extremos gracias a un libre pero efectivo sistema de secciones, y creo que lo mismo ocurre en la Asociación Estadística Americana. Pero actualmente las reuniones tienden a ser más bien especializadas y no surgen muchas ocasiones para discutir problemas comunes. Al organizar las sesiones del Instituto Estadístico Internacional he luchado continuamente contra esta dicotomía de intereses y la tendencia a tener reuniones en que se desarrollasen por parejas, por un lado el trabajo teórico y por otro el práctico. He recordado que Lord Macaulay advertía un efecto similar deplorable en la marina de Carlos II: Contenía --dijo- a la vez marinos y gentlemen; pero el, gentlemen no era marino, y el marino no era gentlemen. Existe algún tipo de moraleja en esto, pues por aquella época perdimos muchas guerras navales.

10. Afortunadamente, la situación muestra signos de progreso. La recogida de datos por métodos de muestreo ha transformado lo que era un tema casi sin ningún interés en uno de vivo interés teórico. Además, hay un fuerte movimiento creativo de trabajo en el estudio de series temporales. En Estados Unidos (no puedo decir lo mismo del Reino Unido) hay un número de expertos estadísticos teóricos trabajando en departamentos estatales, Hansen y Hurwitz, por ejemplo, en teoría de encuestas, y Shiskin en análisis de series temporales, realizando importantes contribuciones tecnológicas a la recogida de datos y su tratamiento. Más recientemente, Eckler en Wáshington y Dalenius en Suecia han comenzado a estudiar el mercado de material estadístico para descubrir quien utiliza toda esta información tan escrupulosamente producida par los departamentos estatales. Más aún, los problemas de almacenamiento de datos y su recuperación, surgidos por las posibilidades de los computadores electrónicos, están conduciendo a la creación de un nuevo dominio de desarrollo teórico. Mantengo, por tanto, la esperanza de que la estadística descriptiva ofrezca a los teóricos un campo que se amplía cada día, y lo que parecía una fragmentación inminente hace unos años no se realice. Pero pienso que la situación necesita vigilancia y que las sociedades estadísticas de todo el mundo deberán hacer propia esta necesidad para asegurar que los diferentes intereses se mantengan unidos.

11. Actualmente en todas partes encontramos estadísticos que, como otros científicos, se lamentan de las dificultades de mantenerse al día en su materia. Se publican mil artículos cada año sobre estadística, y posiblemente otros mil que son relevantes o, de alguna manera, tangencialmente relacionados con el trabajo estadístico. Parte de esta abundancia es culpa nuestra. Hemos llegado a una situación en la que la reputación de un hombre depende en gran parte del volumen de sus publicaciones, y de aquí que haya fuertes incentivos, especialmente entre los miembros más jóvenes, para conseguir publicar lo más pronto posible. Habiendo publicado yo mismo una buena cantidad no puedo considerar esta motivación enteramente innoble, pero lo apruebe uno o no, la lluvia de artículos continuará sin freno. Hay otros incentivos actuando en la misma dirección. Para tener los gastos pagados al asistir a una conferencia, con frecuencia es necesario preparar un informe cuya presentación sea aceptada, y normalmente no es muy importante el tipo de informe. Algunas personas parecen capaces de escribir el mismo informe una y otra vez, y las publicaciones impresas no son las únicas. La fatal facilidad con que los documentos pueden ser duplicados crea un flujo de notas de segunda clase que supone, aproximadamente, el mismo volumen que el material impreso.

12. Puede que los estadísticos aprendan una cierta cantidad de restricciones, pero lo dudo. En atrás ocasiones, por ejemplo, he lamentado que los estadísticos bayesianos no se atengan suficientemente al diseño establecido por el propio Bayes: si ellos actuaran solo como él, y publicaran a título póstumo, nos habríamos ahorrado muchas perturbaciones. Pero no hay que ser chistoso, debemos aceptar una situación en la que no podemos controlar el volumen de publicaciones ni con calidad ni en cantidad. Únicamente podemos intentar, sistemáticamente, clasificarlo e informar acerca de ello. Afortunadamente, se ha dado un gran paso en los últimos años. El admirable International Journal of Abstracts in Statistical T'heory and Method, publicado por el Instituto Internacional de Estadística, cubre, aproximadamente, 500 fuentes de publicación y publica unos 1.000 resúmenes al año. Sin duda, algo se escapa entre las redes, pero la perfección en este campo es inasequible. Hasta 1958 tenemos la bibliografía obtenida en la «London School of Economics », bajo la dirección de Miss Alison Daig y mía propia. Esta labor ha sido criticada, no sin razón, sobre la base de que no está clasificada por materias, pero si hubiéramos intentado semejante cosa con las fuentes a nuestra disposición nunca hubiéramos producido nada. De hecho, la preparación de una bibliografía amplia y clasificada es un tema sobre el que la mayoría de los estadísticos están dispuestos a pontificar largamente, pero muy pocos parecen capaces de llevarla a cabo. El problema bibliográfico, incluso para una rama comparativamente pequeña de nuestra materia, supera la capacidad de un hombre y ha asumido la magnitud de un proyecto de equipo. Me gustaría observar un ataque sistemático de este problema realizado bajo los auspicios del ISI o de alguna de las grandes sociedades nacionales, siguiendo la línea de la admirable Bibliografía de Series Temporales, de Wold. Pero no subestimemos la dificultad de la tarea ni la cantidad de dedicación exigida a los hombres que la emprendan. En la mayoría de las actividades más vulgares del mundo estadístico el problema no es la ignorancia de qué hacer, sino de encontrar quien lo haga.

13. Estamos en cierto peligro de ser sumergidos tanto por la palabra hablada como por la escrita. Pronunciar una conferencia se está convirtiendo en actividad importante, y en algunos países occidentales es un material que contribuye a impulsar la exportación. Salas especiales para mantener conversaciones están surgiendo por toda Europa. Todo esto, supongo, es ciertamente para bien, facilitando a la gente de diferentes países un contacto personal, pero creo entre la mayoría de nosotros, que no deseamos gastar nuestra vida saltando de conferencia en conferencia, una continua ansiedad por miedo a perdernos algo importante, y un sentimiento de que a veces el Standard de presentación cae por debajo de la altura que requiere la materia. No estoy seguro si hay algo que podemos o deberíamos hacer para remediar la situación, especialmente si el viaje por avión llegara a ser mucho más barato. Esto puede empeorar en lugar de mejorar. Pero si fuera deseable algún tipo de acción, pienso que debería tomar la forma de consulta a través de varias sociedades para asegurar que no hubiera superposición de intereses, ninguna dificultad con las fechas y existiera alguna pasibilidad de planificación conjunta.

14. Todo esto en cuanto al alcance del tema y a nuestras dificultades en mantenernos al día. Podemos ahora proceder a considerar desarrollos futuros. Considero que el primer punto a señalar es el enorme crecimiento en posibilidades técnicas puestas a nuestro alcance por los computadores electrónicos, un aparato diseñado hace sólo veinticinco años y que no está todavía libremente disponible para el uso general de todos los estadísticos. Aceptemos todas las cosas que se han dicho habitualmente sobre computadores, la mayoría de ellas no favorables. Habiendo gastado una buena parte de mi juventud obteniendo resultados manejando una máquina calculadora --todavía tengo y utilizo el modelo de Brunsviga que Yule compró en 1909 para realizar los cálculos de la «Introducción a la Teoría de la Estadística», con tuercas de mariposa y todo--, recibí el computador con los brazos abiertos. Lo único que lamento de este advenimiento es que removió el reposado sistema de poder pensar sobre los resultados alcanzados por uno mientras opera la máquina calculadora; tanto Karl Pearson como Fisher sentían un cierto efecto terapéutico profesional, que yo comparto, pero se puede obtener por otros métodos. Lo que me sorprende es que los estadísticos no hayan usado más los computadores electrónicos para resolver algunos de los problemas principales de la teoría distribucional. Muchas funciones matemáticas para usos estadísticos han sido tabuladas; otras que requieren tablas de entrada múltiple han sido programadas. Pero está claro que el trabajo distribucional apenas ha empezado. Por ejemplo, no tenemos todavía un sistema de superficies multivariantes, ni aún bivariantes, para facilitar la exposición de una teoría general de análisis multivariante --prácticamente, todo la que sabemos está basado en la teoría normal y, probablemente, no es muy consistente; por otra parte, sabemos también muy poco acerca de la teoría de muestreo de correlación serial excepto en muestras de una serie aleatoria, que es la que tiene el menor interés; tenemos muchos resultados asintóticos, pero a menudo no conocemos la amplitud que ha de tener una muestra para poder utilizarlos adecuadamente; diseñamos encuestas con exquisita habilidad y refinamiento, pero no podemos calcular los errores de muestreo de nuestros resultados porque las fórmulas son demasiado complicadas.

15. No parece haber ninguna razón para que todos estos problemas no se sometan a los computadores, si bien se requeriría una gran máquina, del tipo que se va conociendo en el mundo de la máquina por «trituranúmeros». La única dificultad es hacer que la máquina obtenga muestras aleatorias. Recientemente se han realizado bastantes trabajos sobre generadores de números pseudoaleatorios, pero no los comprendemos del todo, y, de vez en cuando, los métodos existentes producen resultados inaceptables. Pero no creo que esto evidencie una barrera permanente al progreso. La cantidad de tiempo de máquina requerido es reconocidamente substancial. Un experimento aleatorio de tamaño algo grande puede necesitar 19 dígitos aleatorios. Y en problemas de combinatoria los factoriales que se producen son tan grandes como para superar la capacidad de cualquier máquina previsible. Sin embargo, hay métodos capaces de soslayar estas dificultades, y una vez que se disponga de eficientes generadores de números aleatorios debemos ser capaces de aclarar la mayoría de nuestros problemas de distribución de una vez. O, quizá, puede que incluso no fuera necesario utilizar muestreo aleatorio. Si puedo representar una distribución continua aproximadamente por medio de un conjunto finito de ordenadas, puedo también generar todas las posibles muestras en el computador y, por tanto, estudiar con detalle las propiedades del muestreo, si bien aproximadamente.

16. Para los estadísticos descriptivos el computador ha supuesto más problemas que los que ha resuelto. Está pasando la época en que podían excusarse de proporcionar información sobre la base de que no era obtenible, o que requeriría mucho tiempo el obtenerla, o que los documentos se los habían comido las ratas. Almacenar la información es un problema por sí mismo. Recuperarla cuando se necesita es un problema aún mayor. Editarla es el problema más difícil de todos. Uno está continuamente atónito ante la notable capacidad del cerebro humano, no solamente para almacenar la experiencia de una vida, sino para recuperar determinadas partes de ella, instantáneamente, según le parece, y expulsar las impresiones innecesarias que inciden sobre ella cada momento del día. Hacer que el computador realice esto supone un reto fascinante y espero que se consiga en poco tiempo. Nuestro verdadero problema será entonces establecer estructuras lógicas de clasificación para sistemas complejos y, sobre todo, probablemente, el ensamblar los datos primarios, una tarea formidable aun en aquellos campos en los que la posibilidad de un sistema de recuperación de los datos almacenados está más próxima a la realización, tales coma decisiones legales, precios de seguridad o registros médicos.

17. A veces ocurre, y ocurrirá más frecuentemente en el futuro, que alguien trabajando en una materia diferente realiza un avance importante en otra. Por ejemplo, algunas de las más fructíferas ideas en econometría se deben a ingenieros especializados en electricidad; la teoría de grupo sobre diseño experimental fue creada por agrónomos, y algunas de las mayores contribuciones a la genética las hizo un matemático. Cabe esperar que ocurra algo semejante en la inferencia estadística; quizá abran un camino los neurólogos descubriendo algo importante sobre la forma en que nosotros sustentamos actitudes de duda; tal vez los diseñadores de máquinas electrónicas descubran exactamente lo que el cerebro puede hacer que una máquina no puede. Por el momento, no veo posibilidad de avanzar mucho en inferencia estadística, siguiendo las líneas tradicionales, excepto, quizá, la consideración de la existencia de muchas actitudes posibles, todas igualmente aceptables y basadas en el campo emocional más bien que en el racional. Es una cosa muy natural, en cualquier hombre que piense intensamente en el universo, el querer organizar su propio proceso mental bajo un sistema lógico completo. Pero duda si la humanidad está preparada para semejante hazaña, y tal vez no lo esté nunca. Entretanto, necesitamos más tolerancia y menos dogmatismo en materia de inferencia estadística.

18. Aun siendo grande la contribución del computador en este terreno, debemos rechazar la pretensión, que se ha insinuado en algunos medios, de que la estadística se convertiría en una rama de la ciencia de computadores. Es notable la frecuencia con que se pretende defender que la estadística es algo más, una rama de la teoría de la probabilidad, o equivalente a la teoría de funciones de decisión, o una parte de la misma lógica. Pero ella permanece y debe, subsistir «sui géneris». Hay modas incluso caprichos en la estadística teórica que llevan a la exageración y distorsión. A veces la rueda incluso gira un círculo completo, como en las modas de otro tipo. Por ejemplo, cuando Yule escribió la Introduction empezó con cinco capítulos sobre la clasificación de atributos. Cuando yo lo revisé, hace treinta años, estaba sometido a una fuerte presión de relegar esos capítulos y partir de variables continuas. No sin recelo, mantuve el diseño original, difiriendo sólo en el hecho de condensar los cinco capítulos en tres. Y ahora encuentro que el libro es recomendado por tener una buena introducción al álgebra de Boole, que se ha convertido en una actividad altamente justificada. Me atrevo a decir que el historiador del futuro será capaz de discernir otros cambios en nuestros campos de interés.

19. Es una tarea arriesgada el intentar predecir las líneas futuras de desarrollo de la estadística teórica, pero me parece que existen dos importantes puntos de crecimiento, y me gustaría considerarlos con algún detalle. El primero consiste en paliar el bache existente entre la teoría y las exigencias prácticas en el análisis multivariante. Los problemas que se han encontrado en todas las encuestas estadísticas a las que concierne este tema están muy lejos de estar resueltos. Citaré unos pocos ejemplos de lo que podría ser una lista muy larga:

1º Tabla de contingencias múltiple. Las problemas de clasificación múltiple en p dimensiones son de tres clases: el problema mismo de disposición, de tal forma que se puedan ver los resultados en conjunto; el problema de celdas vacías o frecuencias pequeñas, que suelen surgir en los márgenes de una tabla aún en muestras, grandes, y, quizá lo más difícil de todo, un método de análisis que obtenga las diversas interacciones entre las variables clasificatorias.

2º Variables redundantes. Como el número de parámetros crece alarmantemente con p, hay razones, tanto teóricas como prácticas, para descartar algunas variables que no son relevantes en la encuesta. Se ha efectuado un considerable progreso en el análisis de la regresión y de las componentes (Beale et al., 1967). Esperan solución problemas análogos de análisis discriminante, de clasificación y de correlación canónica.

3º Distribuciones multivariantes. Necesitamos un conjunto de superficies, similares a las curvas de Pearson o Johnson o al desarrollo de Edgeworth (o tal vez algún método enteramente nuevo que conduzca al mismo fin) para ser capaces de estudiar las propiedades teóricas de las distribuciones multivariantes. Prácticamente todo lo que sabernos acerca de los tests de significación depende críticamente del supuesto de normalidad multivariante, y la aplicación a causas reales de resultados teóricos conocidos que no cumplan las condiciones paramétricas, fuerza la confianza de uno mismo hasta un punto límite.

4º Problemas de escala. Las variables que se distribuyen discontinuamente a lo largo de una escala, generalmente se adaptan al modelo de técnicas existentes utilizando variables ficticias o dándole la vuelta al problema buscando los valores de la escala que maximicen las relaciones entre las variables. Me parece que es hora de prestar más ayuda a los psicólogos, sociólogos y economistas, disminuyendo el abismo entre estadísticas de orden y variables medibles.

20. Esto es suficiente para demostrar que aún queda bastante por hacer, incluso dentro del marco de las ideas estadísticas que nos son familiares. Se podrían señalar otros ejemplos de la teoría de series cronológicas, que añaden una nueva dificultad a la situación multivariante al introducir un nuevo conjunto de parámetros que expresan las relaciones de valores sucesivos a través de la dimensión tiempo. De hecho, la mayor parte de los problemas con que ahora nos enfrentamos en el campo clásico se reducen, por uno u otro camino, a esto: ¿De qué modo especificaremos el sistema lo bastante explícitamente como para estudiarlo, sin multiplicar el número de parámetros hasta el punto de que no podamos estimarlos dentro de unos límites razonables?

21. No pienso que haya respuestas fáciles a este tipo de pregunta, y solo se progresará a través de muchos ensayos y errores, de numerosos cómputos y, probablemente, de una gran cantidad de simulación de sistemas en el computador. Quizá ustedes se sorprendieran algo en una etapa anterior cuando yo dije que el ímpetu matemático fisheriano se había extinguido por sí mismo. Debería estar ahora un poco más claro lo que quise decir. Hemos vivido una situación en la que la teoría de la normal podía aplicarse con cierta confianza a situaciones univariantes, a causa del efecto central del límite o porque la variación biológica no diverge mucho de la normalidad. Todavía se necesitan las matemáticas, y a veces con gran intensidad. Pero al crecer la complejidad de nuestros problemas y embarcarnos en el análisis de variación tri o multidimensional nos vemos dirigidos cada vez más hacia el problema de la especificación de los supuestos sobre los que trabajamos, permaneciendo, al mismo tiempo, realistas. Por esta razón, veo como uno de los principales puntos de desarrollo de nuestra materia la fastidiosa lentitud con que se obtienen los resultados parciales de una masa de datos y experimentos, en lugar de cualquier sorprendente avance intelectual que haga innecesario todo este pesado trabajo.

22. Esto me conduce a un segundo punto principal de desarrollo, la confección de modelos. Esta expresión ha llegado a ser muy popular en los últimos años. Hace veinte años cualquiera que escribiera un informe teórico se sentía obligado a mencionar en el primer párrafo el análisis de la varianza. En nuestros días lo es la teoría de conjuntos para el teórico o la construcción de modelos para el práctico. En el sentido más amplio, casi cualquier representación de una situación en estudio puede describirse como un modelo, incluso una simple ecuación de regresión de una variable sobre otra, por ejemplo. Pero la facilidad con que podemos construir modelos simples tiende a obscurecer las dificultades esenciales a toda esta materia que incluso parece no ha sido suficientemente aclarada, no digamos resuelta. No obstante, la elaboración de modelos no es, evidentemente, una moda temporal. Según mi opinión, constituye el campo más importante para explorar y desarrollar que le queda al estadístico, y no me disculpo por considerarlo con algún detalle.

23. Durante algún tiempo los estadísticos han estado descubriendo y manejando relaciones entre variables observadas sin entender realmente por qué aquellas relaciones existían. No era necesario entender detalladamente en qué forma los fertilizantes afectan al metabolismo de una planta para diseñar un experimento agrícola que mostrara cómo una cosecha de trigo reaccionaba al abonarlo con diversas tipos de fertilizantes. El hecho era suficiente, al menos como una primera etapa en la consecución de rendimientos crecientes en las cosechas. Los efectos de la penicilina o el DDT se conocían antes de que se comprendiera la acción de las drogas. En lenguaje popular, el sistema era un “cajón de sastre”, y en la medida en que pudiéramos medir la relación entre estímulo y respuestas, y supusiéramos que tal relación era estable, no era necesario investigar en su interior lo que allí se desarrollaba. Verdaderamente, algunas relaciones descubiertas en estadística eran un conjunto de disparates en que la relación causal era tan indirecta como para dar origen a resultados aparentemente absurdos. La teoría de la regresión rechazaba explícitamente cualquier intento de análisis causal. Todavía hoy, la mayoría de nuestros métodos de previsión a corto plazo están basados en el supuesto de que el sistema, cualquiera que sea, es estable, y que, consecuentemente, podemos proyectar su comportamiento futuro sin conocer por qué se conduce como lo hace. Este concepto de puro “behaviourismo” llegó en algunos autores hasta los fundamentos filosóficos del tema, de modo que la causalidad se descartaba como una idea innecesaria, y sólo las relaciones estadísticas eran científicamente aceptables.

24. Para sistemas muy simples han servido métodos basados en las relaciones estimulo-respuesta; e incluso en sistemas muy complicados a menudo no ha habido nada mejor que usar. Pero, en nuestros intentos por controlar nuestro medio ambiente hemos tenido que extender ahora nuestros esfuerzos en dos sentidos: primero, al control de largos períodos de tiempo futuro, y segundo, a la integración de amplias áreas de espacio. Los métodos a corto plazo pueden tener éxito simplemente porque el sistema que estudiamos haya tenido poco tiempo para cambiar durante el período en que estamos interesados. Para más amplios o extensos campos de aplicación hemos de prever cambios en la estructura del sistema, y realmente, como ocurre en economía, nosotros mismos podemos generar semejantes cambios. Para decirlo brevemente, tenernos que mirar dentro del cajón de sastre.

25. No es esta ocasión de proseguir el tema en detalle, especialmente al haber sido aireado en relación con la economía y los negocios en una reciente conferencia (Kendall, 1968). Me gustaría, sin embargo, establecer un punto general. «Mirar en el interior del cajón de sastre» significa realmente mirar y tratar de encontrar cuáles son las relaciones, no describir prometedoras relaciones llenas de elementos estocásticos o de funciones desconocidas. Ehrenberg ha dado a este punto una fuerza especial mediante la introducción del verbo «to sonk». Esto es un acrónimo que significa «Scientification of Non-Knowledge» (cientificación de la falta de conocimiento), y fue sugerido por él como propuesta frente a la formación demasiado ligera, en forma pseudo-exacta, de relaciones que sólo expresan nuestra ignorancia. Ya no iré tan lejos como él, pero indudablemente él tiene su parte de razón, como reconocerá cualquiera que haya echado una ojeada a la literatura general. Especialmente debemos guardarnos de evitar los estudios experimentales en favor de una matemática pretenciosa, que nos lleve a unos deseos exagerados de reconocimiento científico; según frase de Ehrenberg, un tipo de aserto neo-cartesiano: «I sonk, therefore I am» (cientifico la falta de conocimiento, luego existo).

26. Ahora dejo estas particularidades y vuelvo a un número de preguntas que podemos legítimamente hacer respecto al futuro, cualesquiera que sean las líneas del trabajo teórico abiertas ante nosotros: adiestramiento, enseñanza y organización de grupos estadísticos.

27. Aunque la situación ha mejorado en los últimos años, las escuelas y universidades de Inglaterra todavía no han aceptado el hecho de que la estadística, en el más amplio sentido, está convirtiéndose en parte necesaria de una educación liberal. Hablamos bastante locuazmente de hacer la población tan apta para el cálculo como para la literatura y ciertamente la ignorancia de los números es un fallo tan grande como la incultura. Pero es todavía posible obtener una licenciatura de Economía sin estadística teórica, graduarse en Biología sin haber oído hablar jamás de una distribución de frecuencias, llegar a ser un matemático cualificado sin conocimiento alguno de la teoría de la probabilidad, graduarse en ciencias empresariales o estudios de dirección sin conocer la diferencia entre las previsiones a corto y a largo plazo, o especializarse en Física o Química sin, prácticamente, ningún conocimiento del diseño experimental o de la medida del error experimental. No deseo que se interprete esto como una creencia mía que todo el mundo debe aprender Estadística, o que, como estadísticos, debiéramos adoptar una actitud muy digna y alegar que todo graduado en Ciencias debería tener algún adiestramiento general en estadística. Esto puede muy bien ser verdad, pero sería un error táctico presionar el enfoque de los trabajadores de otras disciplinas. Es necesario poner énfasis, crea yo, en la importancia de introducir algunas ideas generales a nivel de escuela y la necesidad a nivel de Universidad de que la Estadística no forme parte de algún otro departamento tal como Matemáticas o Economía.

28. El problema de adiestrar a los estadísticos, distinto del problema de dar a los científicos un conocimiento de la estadística, es muy diferente. Robert Graves señala en alguna parte que si bien los músicos son frecuentemente precoces, los poetas no lo son nunca. Se puede establecer el mismo tipo de distinción entre los matemáticos, que generalmente son precoces, y los estadísticos que, como tales estadísticos, no lo son. Es necesario realizar previamente un cierto aprendizaje en el manejo de las situaciones de la vida real antes de que un individuo esté suficientemente maduro como para emprender problemas estadísticos importantes. Tenemos que tener cuidado, no obstante, de no caer en una trampa. Podemos enseñar estadística, bien a nivel de escuela o bien a nivel de estudiantes de universidad no graduados, y podemos inculcarles las técnicas necesarias; pero no podemos enseñar a la gente a ser buenos estadísticos. Dicho de otra forma, la producción del contingente necesario de estadísticos requiere adiestramiento tanto como enseñanza, e implica la carrera de postgrado.

29. La verdadera cuestión, me parece, es ¿Quién prepara? El problema no es nuevo. Lo teníamos hace veinticinco años, y la única razón de que continúe es que lleva más de una generación el alterar cualquier cosa en una universidad inglesa. El punto más relevante a observar es la medida en que están asumiendo la enseñanza de la universidad instituciones especiales e incluso los mismos complejos industriales importantes. En tanto que las universidades consideren la estadística, la investigación operativa y temas similares como materias tecnológicas y no educacionales; en tanto que consideren estas materias como una parte secundaria de una carrera de tres años en cualquier otra disciplina diferente; en tanto que sean incapaces o reacias a procurar cursos cortos para hombres que ya se ganan su vida en la industria, podemos esperar que una parte importante de la Enseñanza estadística se dé por la industria misma, o bien por centros de enseñanza especializados. Esto puede no ser en si mismo indeseable, pero tiene algunas desventajas obvias, como una tendencia a no progresar por parte de la industria y la sangría de profesores universitarios. Sea deseable o no, parece, sin embargo, inevitable y yo creo que aumentará. Quizá la consecuencia más seria para la universidad es que puede ocurrir algo similar en la investigación.

30. Incidentalmente, antes de que abandonemos el tema de la enseñanza, hay un aspecto de las universidades británicas que todavía me confunde. Cada vez que visito los Estados Unidos, durante las primeros días tengo el ritmo de vida adelantado cinco horas y, por consiguiente, estoy despierto y alerta para las lecciones a primera hora de la mañana que se dan por televisión. Debo decir que algunas de las mejores y más claras lecciones de estadística que he visto nunca fueron las de Mosteller y sus colegas hace pocos años.¿Por qué no enseñamos más por medio de televisiones de circuito cerrado? Se desconoce prácticamente en gran Bretaña, al menos en estadística. ¿Por qué no usamos películas para la enseñanza general y dejamos a nuestros profesores más tiempo para comentarios, ejercicios y resolución de dudas? No lo sé. Los profesores en las escuelas primarias están siempre dispuestos a probar cualquier método nuevo, enseñando a los niños la aritmética con lápices de colores en lugar de hacerles aprenderse la tabla de multiplicar de memoria. Pero en centros de enseñanza superior siempre se encuentran dificultades en cualquier solución. No obstante, ha de llegar, seguramente, el momento en que tengamos que hacer uso de la ventaja que suponen las facilidades modernas para reproducir visual y auditivamente la enseñanza, tal y como se hace para reproducir libros de texto y notas.

31. Los estadísticos todavía no han logrado alcanzar demasiada respetabilidad. En el siglo XIX se puso de moda poner a un abogado en el consejo de dirección de una compañía. En la primera parte del siglo los especialistas en contabilidad usurparon esta función. He estado esperando que llegara el momento en que se considerara deseable, si no esencial, tener también un estadístico en la dirección, pero estoy empezando a preguntarme si no será pasado por alto a favor de un experto en computadores. Cuando designamos una Comisión Real en Gran Bretaña tratamos de reunir un grupo importante de personas inteligentes y expertas también; pero la provisión, suministro de material positivo, o su interpretación, se relega a un escalón más bajo, de Servicios complementarios, como trabajos de secretariado. Es muy digno de atención que desde la guerra el Gobierno británico haya importado muchos economistas de las universidades para ayudarle en su trabajo, pero no haya importado ningún estadístico de eminencia similar, hasta muy recientemente, cuando el profesor Moser se hizo cargo de la Oficina Central de Estadística. Quizá sea esto culpa nuestra. Quizá no somos tan buenos como creemos. Pero, si esto es verdad, ¿No deberíamos examinar las razones del por qué?

32. Si uno intentara predecir la demanda de trabajo estadístico en los próximos veinte años, más o menos, y compararla con la oferta de expertos, teniendo en cuenta los desarrollos que tengo ya bosquejados y las necesidades de los países que surjan, parece bastante seguro predecir una escasez de oferta. Hemos tenido una durante veinte años y yo esperaría otra, de expertos de cualquier nivel, para los próximos veinte. Pero hay una nueva faceta en la situación. Los investigadores de hace veinte años podían hacer su trabajo en relativo aislamiento sobre una máquina calculadora. En nuestros días tienen que estar ligados a cualquier unidad como miembro de un equipo, con el fin de obtener la asistencia de cómputo que necesitan. Además, las técnicas modernas están mucho más elaboradas y nadie puede dominar todas las ramas de la materia. Así, cada unidad que desee cubrir un campo razonablemente extenso debe formar un equipo o estar en estrecho contacto con un grupo algo grande. La investigación se está haciendo más costosa en la recogida de datos y en el análisis por medio de un computador. Viendo que nuestros recursos son limitados, surge la cuestión de cómo hacer el mejor uso de ellos bajo las restricciones impuestas por el desarrollo moderno. Si bien gastamos mucho de nuestro tiempo maximizando o minimizando algo, u orientando a la industria sobre cómo maximizar su eficiencia, hay, sorprendentemente, poco en la literatura estadística sobre cómo obtener lo mejor de nosotros mismos; por ejemplo, qué demanda es probable que se tenga, cómo ha de tratarse, qué extensión ha de tener una unidad de investigación para ser viable o cuál ha de ser la razón entre la enseñanza y la investigación existente en las universidades.

33. Concretando, pues, pese a que se ha hecho mucho, queda mucho más por hacer en todas las ramas de nuestra materia, desde la recogida de datos a las técnicas de análisis e interpretación. Dudo que algo de eso vaya a ser particularmente fácil, pero la mayor parte compensará intelectual y financieramente. El gran volumen de trabajo y la magnitud de los proyectos que se nos presentan nos conducen a problemas fundamentales de ordenación, cómo organizarnos nosotros mismos, cómo adiestrar a nuestros sucesores, cómo mantenernos al día en nuestra materia, y me parece que las sociedades estadísticas más importantes del mundo tendrán que trabajar bastante arduamente en ellos. Aun si estuviera equivocado, espero haberles dado algo en qué pensar al respecto. Uno no tiene, a menudo, la oportunidad de revisar sus predicciones de veinticinco años antes y hacer un segundo intento para un período de extensión similar. Que yo tenga una tercera es dudoso, pero si la tengo espero que todos ustedes vivan para ver si estaba equivocado o en lo cierto. Una versión anterior de ese informe se leyó en la Universidad de Indiana en abril de 1967. Supe, más avanzado el año, que se había organizado un simposium sobre el futuro de la Estadística en la Universidad de Wisconsin en junio de 1967. Las sesiones de esta conferencia creo que están en curso de publicación.

Nota de la redacción.-La discusión del artículo del Dr. Kendall se publicará en el próximo número de ESTADÍSTICA ESPAÑOLA.

REFERENCIAS

Beale, E. M. L.; Kendall, M. G, and Mann, D, W. (1967): «The discarding of variables in multivariate analysis». Biometrika, 54, 357-366

Kendall, M. G. (Ed.) (1968): “Model-building” in Economics and Industry”. C-E-1-R, Conference,
July, 1967. London: Charles Griffin & Co. Ltd

Estadistica Amigable

Buscar este blog

Sobre el futuro de la estadística. Una segunda visión

Etiquetas

Comentarios

Entradas populares de este blog

Historia de la Estadística en Venezuela

CONTRIBUCIONES DE SIR RONALD FISHER A LA ESTADISTICA GENÉTICA

Notas sobre la acuracidad, precisión y fiabilidad de los datos estadísticos