Ir al contenido principal

Sobre la Definición de Estadística

Publicación Autorizada por el Dr. Sánchez Crespo

Por:
GONZALO SÁNCHEZ-CRESPO BENITEZ
Delegado del Instituto Nacional de Estadística en Cantabria
gsc@ine.es
VICENTE MANZANO ARRONDO
Profesor titular de la Universidad de Sevilla
vmanzano@us.es

Resumen

En este ensayo se propone una definición de Estadística que hace hincapié en la representatividad resaltando la diferencia entre Estadística y Matemática. La definición de Estadística es una de los cuestiones claves en la formación de los propios Estadísticos y de los investigadores en general, paradójicamente en los estudios sobre didáctica de esta materia se hacen pocas referencias a esta definición. En los manuales y en los diccionarios el concepto de Estadística suele resolverse con alguna cita normalmente descriptiva sobre el objeto y los métodos que la ocupan, realizándose una clasificación en distintas categorías en función de los instrumentos utilizados. Pero no suele hacerse referencia a una definición previa, propiamente dicha, que establezca los límites de la materia de una forma clara y que pueda ser utilizada para mejorar la comprensión sobre la misma.
De esta forma se define la Estadística como:
"Ciencia que se ocupa del estudio de fenómenos de tipo genérico, normalmente complejos y enmarcados en un universo variable, mediante el empleo de modelos de reducción de la información y de análisis de validación de los resultados en términos de representatividad."

SANCHEZ-CRESPO, G; MANZANO, V.: "Sobre la definición de Estadística." Boletín de la International Association of Statistical Education para América Latina, Oct. (2002), (5 pp) (dpp).

INTRODUCCIÓN

Recogiendo una cita de C. Batanero y otros "el factor más importante que influye en el aprendizaje es lo que el alumno ya sabe. Averígüese esto y enséñese consecuentemente", Ausubel y cols. Es claro que todo el mundo tiene un concepto de Estadística. M. Cordero presenta una encuesta sobre el concepto de Estadística en alumnos de bachillerato con los resultados fácilmente previsibles. La estadística, en el mejor de los casos, se relaciona más con números y porcentajes que con un instrumento de investigación científico con características propias.
Como establece M.G. Kendall, definir en que consiste o qué es la Estadística ha sido una materia que ha dividido a lo largo de la historia a los propios estadísticos. Desde Quetelet que la consideraba la reina de las ciencias hasta autores que la definen como una técnica más, al servicio de otras ramas del conocimiento. La característica común ha sido la multiplicidad de definiciones que se han escrito sobre estadística. W.F. Willcox, en 1935, reúne 115 definiciones y aporta una más para sustituirlas, sin lograrlo. El número de definiciones de estadística ha seguido aumentando.

DEFINICIONES HUMORÍSTICAS

A pesar de los esfuerzos realizados a través de la historia por encontrar una definición aceptable de Estadística, y seguramente como consecuencia precisamente de su dificultad, ha sido un hecho remarcado el éxito, en cuanto a divulgación, de las definiciones humorísticas. Si pocas son las personas que tienen una definición apropiada de Estadística, son muchas las que conocen o intuyen alguna de estas definiciones que A. Piatier definió como humorísticas.
Casi todas las definiciones, más que humorísticas, sarcásticas, tienen por núcleo central establecer una relación entre estadística y mentira, pretenden desvirtuar el conocimiento obtenido por la estadística. Un análisis detallado de estas definiciones puede tener un efecto positivo para aproximarnos al concepto de Estadística. El riesgo es ayudar a difundir opiniones de personas que no tienen "ningún conocimiento del método ni de sus aplicaciones y éxitos", A. Piatier.
Se dice, por ejemplo, que si una persona gana un millón y otra nada "la estadística" establece que las dos han ganado medio millón. Este argumento parece suficiente para desvirtuar una disciplina, puesto que: si no sabe hacer algo tan sencillo ¿ cómo es posible que sea capaz de resolver problemas más complejos?. Ejemplos parecidos han proliferado: La estadística dice que si una persona pone la cabeza en el congelador y los pies en el horno su temperatura media será correcta. La estadística pronostica un acierto para el caso de un soldado que dispara sobre un blanco una vez medio metro a la derecha y otra medio metro a la izquierda. Si desgranamos estos, en apariencia, sencillos ejemplos encontraremos algunas de las características que diferencia a la Matemática de la Estadística y que permiten definir a esta última.

ESTADÍSTICA Y MATEMÁTICA

Podemos comprobar que el cálculo de la media es una operación estrictamente matemática y que en un sentido estricto lo que falla en el ejemplo es la interpretación de un resultado aritmético. Una de las características de la Estadística es precisamente analizar la validez de los resultados. Para que este ejemplo pueda abandonar el ámbito de las matemáticas y pasar al terreno de la Estadística es necesario que se establezca alguna medida de la representatividad, de la validez, del resultado que se presenta. Es evidente que la media aritmética en este ejemplo esta afectada por una escasa representatividad, y un análisis realmente estadístico no tendría dificultad en aportar varias medidas de su representatividad.
En este punto conviene observar la diferencia con la que se utiliza en el lenguaje cotidiano la expresión dato y la expresión estadística. En ocasiones cuando el interlocutor quiere expresar su confianza o su desconfianza en un dato suele decir "tengo una estadística" o "eso es sólo una estadística". Sin embargo el concepto de dato suele estar imbuido de una cierta infalibilidad. Tener un dato que apunta algo suele considerarse con seriedad, una estadística por el contrario, es algo en principio sujeto a discusión. Es paradójico que si la estadística es un dato refrendado por un análisis de su validez, tenga menos valor, en el inconsciente colectivo, que un dato aislado.

Fenómenos complejos

Ahora bien este tipo de definiciones y ejemplos humorísticos, en contra de lo que parece, de simple objeción al uso indiscriminado de las matemáticas para la resolución de problemas estadísticos, presenta aspectos que permiten ahondar en el concepto de Estadística. La Estadística puede definirse como un instrumento del método científico y por tanto orientado al estudio. Estudiar fenómenos sencillos, como los de los ejemplos, no precisa la utilización de un método estadístico, a pesar de que si puede aplicarse, no es necesario. Donde aparece la necesidad de determinar estadísticamente leyes que rigen y permiten explicar fenómenos y aumentar el conocimiento del ser humano es cuando se presentan situaciones complejas afectadas por la incertidumbre. Es en este terreno, en el de la incertidumbre medible, donde la Estadística encuentra su principal campo de acción.
Como ejemplo de este tipo de situaciones podemos poner cualquier experimento biológico donde se desea conocer el efecto aislado de distintos tratamientos y sus interacciones. Situaciones donde la confluencia de un gran número de circunstancias tienen efectos que enmascaran y hacen difícil determinar la verdad, verdad que existe y que rehusa mostrarse.

Método general

Otro punto de la definición de Estadística es, siguiendo a M.G. Kendall , establecer que la Estadística es un método general, un lenguaje común, referido a conjuntos y sus relaciones, sirve para obtener conclusiones probables de poblaciones imperfectamente conocidas. Su carácter genérico, traspasa las fronteras entre las diferentes ciencias. Estudios particulares en determinados campos del conocimiento han dado lugar a métodos que incorporados al cuerpo de la Estadística han sido, posteriormente, traspuestos, en ocasiones con décadas de distancia, a distintas ramas de la ciencia. Un problema originalmente relacionado con dispersión de las nubes de mosquitos en una región infectada por la malaria ha dado lugar a métodos para determinar la estructura molecular del caucho. El estudio de las manchas solares y su relación con las cosechas permitió obtener modelos aplicables a cuestiones tan diferentes como analizar movimientos bursátiles o la preparación de superficies metálicas pulimentadas. Otro ejemplo que permite comprender que se trata de un método general viene dado al observar que el modelo obtenido al estudiar la longitud al azar de un bastón roto se aplicó a solucionar problemas de redes de comunicación o al estudio de los ciclos económicos.
Este sentido genérico unido a la preocupación por formalizar la validez de los resultados es el que sitúa a la Estadística en la intersección del resto de las ciencias y le da el carácter de instrumento del método científico.

Estadística e incertidumbre

Un punto central de la discusión es, como hace M.G. Kendall , distinguir la Matemática de la Estadística como ciencia de la certeza y de la incertidumbre. Caracterizando a la Estadística como una ciencia que busca establecer los límites de la incertidumbre, y no como una rama de las matemáticas. Este último enfoque, vigente todavía, tiene penosas consecuencias en los planes de estudio del bachillerato al relegar el estudio de la estadística a un apartado, muchas veces eliminado o aligerado para descargar el temario, situado entre el cálculo integral y el estudio de las cónicas. Estas materias se explican con una orientación exclusivamente dirigida a superar los problemas tipo de revalida o de selectividad. Con mención inapropiada del concepto de cálculo de probabilidades, nociones de combinatoria y problemas del teorema de Bayes que, siguiendo a C.F. Harrington, son difíciles para aprender estadística. Mención inapropiada desde el punto de vista didáctico puesto que crea más animadversión que verdadera motivación para el estudio.
Un ejemplo divulgativo sobre este carácter diferenciado con las matemáticas lo podemos poner en la siguiente situación: las matemáticas dejan claramente, y sin género de duda, establecido que sumar dos y dos proporciona cómo resultado cuatro. La estadística parte de una situación más compleja, plantea el problema de sumar dos cantidades y analizar la validez del resultado. El resultado de esta suma estará afectado por un error debido a la incertidumbre. La estadística enfoca su atención a procedimientos de validación y a fenómenos sujetos a factores externos múltiples e incontrolables. Estos son los límites que quiere establecer la estadística. Su objetivo es saber entre que valores se encuentra el verdadero valor.
Este tipo de problema, bajo condiciones de incertidumbre, se presenta en multitud de ocasiones. Podemos pensar en la dificultad de proporcionar una estimación de la renta de un país como agregación de la renta obtenida por cada uno de sus habitantes. Aún en el caso de que pudiésemos preguntar a cada individuo, tendríamos efectos aleatorios e incluso sesgos por errores cometidos en cualquiera de las fases de la investigación, por efecto de los instrumentos de recogida de datos, por efecto de la memoria de los informantes, por la propia variabilidad de los datos o por cualquier otro tipo.

Universo y fenómenos variables

Autores como S. Cabria resaltan que la Estadística estudia el comportamiento de los fenómenos referentes a colectivos. Los colectivos, el universo, es donde se desenvuelven o están los fenómenos, los hechos. En Estadística la referencia al colectivo es importante, por dos cuestiones, porque enmarca el fenómeno, como en el resto de las ciencias, y, además, porque condiciona los métodos y los resultados. En este punto se puede resaltar la afirmación de D.S. Moore de poner los datos en contexto.
La estadística tiene su objeto en la incertidumbre. Y eso es consecuencia de abordar una cuestión central y es que tanto el marco, el contexto o con más amplitud el universo, como los fenómenos, están en movimiento, sujetos a variabilidad. El universo y los fenómenos son variables y la observación que puede hacerse de ellos es limitada, por eso es necesaria la Estadística.
La Estadística con el fin de estudiar un fenómeno presente en un universo excesivamente amplio y variable, lo que pretende es obtener un modelo que lo explique, mediante una reducción en los datos originales, y establecer la medida de hasta que punto esta nueva información, o modelo reducido, es válido y representa bien al original

Validez, representatividad y fiabilidad

Uno de los conceptos más utilizados en Estadística es el de fiabilidad. Por fiabilidad se entiende obtener una información válida, sin errores, y representativa. Para conseguir este fin se utiliza, por una parte el análisis de la validez de los resultados y, por otra, establecer estos resultados en términos de representatividad. El análisis de la validez, en un sentido amplio, se refiere al estudio de todos los posibles errores que pueden aparecer en cualquiera de las fases del proceso estadístico, desde la recogida de datos hasta la interpretación de los resultados, pasando por los supuestos en los que se basa el razonamiento. En esto es necesario prestar especial atención a las desviaciones de los supuestos para los que se ha ideado el método que se esta aplicando. Este análisis de validez es el motivo por el que en los estudios estadísticos se suele hacer referencia a una tipología muy amplia de errores. Se trata de cuantificar el error total cometido por la investigación distinguiendo, según los casos, errores debidos al muestreo, errores ajenos al mismo, como pueden ser errores de cobertura, de codificación… etcétera. Por tanto por validez se entiende sin errores o al menos con errores medibles.
La relación entre validez y representatividad podemos establecerla de la siguiente forma: la validez se ocupa de aplicar modelos estadísticos en orden a determinar los errores de una investigación. Esta fase comprende los cálculos necesarios para determinar el orden de magnitud del error cometido al sustituir el universo por una parte. Por ejemplo se puede obtener que un estimador tiene un error total, que comprende los errores medidos en cada fase del proceso, igual a 2.5 %. Esto permite calcular las estimaciones por intervalo y expresar en términos medibles la incertidumbre. El concepto de representatividad, en Estadística, se puede entender como la interpretación que hace el investigador de la validez. Tiene un componente subjetivo. En el ejemplo anterior, de estimación por intervalos, interpretar en términos de representatividad el error obtenido del 2.5 % puede llevar al investigador a aceptar o rechazar determinadas hipótesis en función de la región crítica que establezca. Y la región crítica es una decisión personal basada en una valoración de las consecuencias que tendrá su establecimiento.
Unir el análisis de validez con su interpretación en términos de representatividad es lo que va a configurar la fiabilidad final de los resultados de una investigación estadística.

Definición de estadística

Haciendo un esfuerzo de reducción y en formato de diccionario, podemos concluir resumiendo las consideraciones anteriores con una definición de Estadística que consideramos pone el acento en la representatividad. Esto no es una novedad puesto que es fácil encontrar definiciones de Estadística que recogen el interés de esta ciencia por la validez de sus resultados. La ventaja que supone acentuar ese carácter es que permite deslindar con precisión la diferencia entre un dato y un dato estadístico a la vez que separa, creemos también con claridad, la estadística de la matemática.

Estadística

1. "Ciencia que se ocupa del estudio de fenómenos de tipo genérico, normalmente complejos y enmarcados en un universo variable, mediante el empleo de modelos de reducción de la información y de análisis de validación de los resultados en términos de representatividad". La información puede ser numérica, alfabética o simbólica. Consta de las fases de recogida de información, de análisis y de presentación e interpretación de los resultados y elaboración de métodos.
2. El término se emplea para referirse a cualquiera de estas fases.
3. Estadístico: Expresión matemática de una función de los valores de una muestra.
4. Estadístico: Persona que desarrolla o aplica esta ciencia.
Definida así la Estadística se evita hacer mención a sí es o no una rama de las matemáticas, visión que consideramos innecesariamente limitada, al tiempo que se establece su carácter genérico y su campo de acción en el estudio de fenómenos complejos ubicados en un universo amplio y variable. Con esta afirmación, de complejidad, se introduce el factor de incertidumbre que acompaña a los fenómenos aleatorios pero sin limitar el campo de la Estadística de forma que puede aplicarse también a fenómenos determinísticos. Con la referencia al universo se expresa la relación descrita por D.S. Moore acerca de que los datos estadísticos lo son en un contexto. La definición continúa estableciendo los procedimientos que utiliza, que tienen en común reducir la información. Modelos de este tipo comprenden desde el cálculo de la media aritmética hasta la determinación de complicados modelos de correlación canónica. El último aspecto que consideramos importante es el de la referencia a los análisis de validez de los resultados en términos de representatividad. Con esta especificación podemos diferenciar lo que es una simple operación aritmética de lo que es una cifra o un estudio estadístico. Como regla general podríamos establecer que un estudio será estadístico cuando a los modelos de reducción empleados le acompañe, o sea posible realizar, un análisis de validez de los resultados obtenidos en términos de representatividad. En cuanto al tipo de información los datos pueden ser cuantitativos, cualitativos o incluso existe una rama de la Estadística que se ocupa de lo que se denomina datos simbólicos (por ejemplo en los accidentes de coche determinar el entorno mediante valoraciones: visibilidad, existencia de arboles en el entorno, curvas, lluvia, velocidad... etcétera). El resto de la definición aborda cuestiones relacionadas con el uso de la palabra estadística en el lenguaje.

CONCLUSIÓN

Dado el uso generalizado que tiene la palabra estadística es esencial que este definida adecuadamente. Si la palabra estadística se asocia de forma clara con el instrumento destinado a averiguar la verdad, que en realidad es, entonces es probable que la animadversión que produce en la gente en general y muy especialmente en los alumnos de bachillerato e incluso de Universidad decaerá. Al mismo tiempo manejar un concepto de Estadística ambiguo o incluso equivocado puede tener efectos negativos en el desarrollo científico de los estudiantes de cualquier disciplina. Pensamos que la definición propuesta puede ayudar a los estudiantes e interesados en general a introducirse en esta ciencia con una visión más ajustada de lo que van a encontrarse en ella.

REFERENCIAS

Batanero, C. otros. (1994). Errors and difficulties in understanding elementary statistical concepts. Journal of mathematics education in science and technology, 25(4), 527-547
Cabria, S. (1994). Filosofía de la estadística. Servicio de Publicaciones de la Universidad de Valencia
Cordero, M.; Garcia, R. (1990). Comentarios sobre la enseñanza de la estadística en el bachillerato. Estadística Española 143. p.2-32.
Moore, D. S. (1992). Teaching statistics as a respectable subject. In F. Gordon & S. Gordon (Eds.), Statistics for the twenty-first century (pp. 14-25). Washington, DC: Mathematical Association of America.
Harrington, C.F. Schibik, T.J. (2002). Facilitating student engagement in the introductory business statistics course. Proceedings of the Midwest Business Economics Association. Chicago, Illinois.
Kendal, M.G. (1950). The Statiscal Aproach. Economica.
Piatier, A. (1962). Statistique, I, París.
Ros Jimeno, J. (1945). El concepto de Estadística. Madrid : Sucesores de Rivadeneyra, 18 p.
Willcox, W.F. (1935). Definitions of Statistics. J.Soc.Stat., París.

Comentarios

Entradas populares de este blog

CONTRIBUCIONES DE SIR RONALD FISHER A LA ESTADISTICA GENÉTICA

Cultura Científica No 2 (2004) CONTRIBUCIONES DE SIR RONALD FISHER A LA ESTADISTICA GENÉTICA Cuadros D. Jaime.* (*) Maestría en Educación, UPN. Esp en Estadística, Universidad Nacional de Colombia. Lic. en Matemática y Estadística, UPTC. Profesor catedrático FUJC. E-mail: cuadros@telecorp.net. RESUMEN Sir Ronald Fisher (1890-1962) fue profesor de genética y muchas de sus innovaciones estadísticas encontraron expresión en el desarrollo de metodología en estadística genética. Sin embargo, mientras sus contribuciones en estadística matemática son fácilmente identificadas, en genética de poblaciones compartió su supremacía con Sewal Wright (1889-1988) y J.S.S. Haldane (1892-1965). Este documento muestra algunas de las mejores contribuciones de Fisher a las bases de la estadística genética, y sus interacciones con Wrigth y Haldane, los cuales contribuyeron al desarrollo del tema. Con la tecnología moderna, tanto la metodología estadística como la información gen

Historia de la Estadística en Venezuela

UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES ESCUELA DE ESTADÍSTICA Y CIENCIAS ACTUARIALES DEPARTAMENTO DE ESTADÍSTICA Y PROBABILIDAD profesores Guillermo Ramírez y Maura Vázquez. Historia de la Estadística. La etimología de la palabra estadística sugiere su origen. Este término se deriva del italiano statista , que a su vez proviene del latín status , vocablo que significa estado en el sentido político de la palabra. Se empleó entonces el término "estadística" para designar a la colección y descripción de datos relativos a la población y riqueza de los pueblos. Se pueden distinguir las siguientes etapas en el desarrollo histórico de la estadística: 1) Edad Antigua (- Siglo V). Como se ha dicho, en sus inicios la estadística constituía el conjunto de datos que describían los recursos más importantes con los que contaban los pueblos: población, tierras y riquezas, y que se uti

Nuevas tendencias de la Estadística en el siglo XXI

Rev. Real Academia de Ciencias. Zaragoza. 61: 87-97, (2006). (Conferencia leída en el Aula Magna de la Facultad de Ciencias de la Universidad de Zaragoza, el 15 de noviembre de 2006, con motivo de la festividad de San Alberto Magno.). José A. Cristóbal. Departamento de Métodos Estadísticos. Facultad de Ciencias, Universidad de Zaragoza, 50009 Zaragoza. La llegada del nuevo milenio ha impulsado un nuevo espíritu en la investigación tanto para científicos como para humanistas. En particular, todo apunta hacia el desarrollo de una nueva cultura intelectual donde el trabajo más profundo de los científicos se hace más accesible al público en general. En palabras de John Brockman, filósofo norteamericano y autor de numerosos libros sobre ciencia de vanguardia: "La aparición de esta nueva cultura es una evidencia de un gran anhelo universal, un deseo para la nueva e importante idea que dirige nuestros tiempos: un desarrollo revolucionario en biología molecular, ingeniería