Aplicación e interpretación del test de Chi Cuadrada (X2) en una investigación sobre condiciones sociolaborales del trabajo docente y sus repercusiones en la salud

Winston Joseph Zamora Díaz
Doctor en educación e intervención Social
drwinzamora@uml.edu.ni

Universidad Martín Lutero – Aula Juigalpa

Resumen

Este estudio al igual que otros tantos, demandó de acuerdo con su alcance, la necesidad de establecer la relación de dependencia y/o independencia entre variables cualitativas(categóricas). Para ello se acudió al uso del reconocido test o prueba de Chi Cuadrada con apoyo de la aplicación estadística SPSS for Windows.

El objetivo de este estudio de tesis doctoral que incitó al uso de esta prueba fue determinar la relación entre el escenario laboral docente y situaciones de su condición de vida que podrían estar afectando su salud. Por tanto, queda más que remarcado el alcance descriptivo-correlacional de la investigación. Aunque el diseño de investigación fue no experimental, con enfoque mixto (cuanti-cuali); para efecto de fundamentar la aplicación del test de Chi Cuadrada, solo se hace hincapié en la metodología cuantitativa. Desde esta perspectiva el estudio se llevó a cabo mediante la administración de un cuestionario de 62 ítems aplicado a 157 profesores de educación media o secundaria. El La aplicación de la prueba Chi Cuadrada se realizó con el fin de determinar que en las tablas cruzadas las opiniones proporcionadas por colectivo de profesores sobre aspectos relacionados a la profesión, su condición socioeconómica y condiciones de trabajo y salud eran independientes del sexo de los encuestados. Después de ejecutada la prueba estadística no paramétrica se llegó a la conclusión de que el sexo de los docentes no influyó en las percepciones emitidas en este estudio con relación a los aspectos sometidos a estudio.

Palabras clave: Chi Cuadrada, Prueba no paramétrica, relación de dependencia.

Application and interpretation of the chi square test (X2) in a research on socio-occupational conditions of teaching work and its effects on health

Abstract

This study, like many others, demanded, according to its scope, the need to establish the relationship of dependence and/or independence between qualitative (categorical) variables. For this, the use of the recognized test or Chi Square test was used with the support of the statistical application SPSS for Windows.

The objective of this doctoral thesis study that prompted the use of this test was to determine the relationship between the teaching work scenario and situations of their living conditions that could be affecting their health. Therefore, the descriptive-correlational scope of the research is more than highlighted. Although the research design was non-experimental, with a mixed approach (quanti-quali); For the purpose of substantiating the application of the Chi Square test, only the quantitative methodology is emphasized. From this perspective, the study was carried out by administering a 62-item questionnaire applied to 157 middle or high school teachers. The application of the Chi Square test was carried out in order to determine that in the cross tables the opinions provided by a group of teachers on aspects related to the profession, their socioeconomic status and working and health conditions were independent of the sex of the respondents. After executing the non-parametric statistical test, it was concluded that the sex of the teachers did not influence the perceptions expressed in this study in relation to the aspects under study.

Key Words: Chi Square, Nonparametric test, dependency relationship.

1. Introducción

Un sin número de estudios de investigación aprovechan la gama de técnicas o pruebas estadísticas existentes al momento de analizar e interpretar los datos que se recaban. Sin embargo, en ocasiones, muchas de estas técnicas se aplican de forma injustificada y hasta con abusos. Muchas tesis de grado o diversas investigaciones utilizan como recurso demostrativo las llamadas tablas cruzadas o de contingencia. Estas tablas constan de dos dimensiones, las cuales a su vez contiene una variable y cada variable se subdivide en dos o más categorías. Las tablas de contingencia hacen posible que se pueda ejecutar la prueba de hipótesis de asociación o relación entre dos variables categóricas. A esta prueba popularmente se le conoce como Chi Cuadrada de independencia o de homogeneidad (Amaro 2012).

La X2 es una prueba de libre distribución (no paramétrica) que mide la discrepancia entre una distribución de frecuencias observadas y esperadas. Entre sus características generales, la prueba X2 toma valores entre cero e infinito y no tiene valores negativos porque es la suma de valores elevados al cuadrado. Se conocen tres usos relevantes de la prueba X2: prueba de bondad de ajuste (una variable), prueba de independencia (dos variables) y prueba de homogeneidad (dos variables) (McHugh, 2013).

Empero la aplicación de este test o prueba de independencia, como todo método o aplicación, está sujeta a condiciones que requieren de su estricto cumplimiento para justificar la significancia estadística y evitar usos inadecuados. Es por eso que en este artículo se pretende demostrar la aplicación de esta prueba y exponer algunas de las particularidades de la misma.

El motivo que encauzó al uso de esta prueba fue el de demostrar el grado de relación o asociación (de independencia) entre variables de interés planteadas en el estudio y el sexo de los encuestados.

Aunque la naturaleza del estudio se desarrolló bajo la metodología de un diseño mixto, para efectos de compartir lo que concierne a la aplicación del test de Chi cuadrada solo se considera el aspecto cuantitativo del mismo, aduciendo pues que se aplicó un cuestionario ad hoc a 157 profesores de educación media o secundaria. Cabe destacar también que, para el análisis de los datos, las tablas de contingencia o cruzadas fueron uno de los aspectos a considerar para la demostración de la asociación entre las variables categóricas de interés. Otros elementos a considerar en la buena aplicación de este test están fundamentados a lo largo del artículo.

2. Metodología investigativa

En correspondencia con el propósito de mostrar la aplicación de la prueba de independencia asumiendo las particularidades a la que debe someterse la misma. En este apartado enfatizamos en que La población del estudio estuvo conformada por todo el profesorado de Educación Secundaria del Departamento de Chontales (Nicaragua) que desempeñó esta labor durante el curso escolar 2013-2014, 380 personas según datos del Ministerio de Educación. Para determinar el tamaño de la muestra se empleó el paquete estadístico Stats versión 1.1, con un error máximo aceptable del 6%, un porcentaje estimado de muestra del 50% y un nivel de confianza del 95%. Con la ayuda de dicha aplicación, la muestra representativa de la población en estudio, quedó finalmente conformada por 157 profesores. 

Para seleccionar las unidades o elementos muestrales se empleó la técnica del muestreo aleatorio estratificado. Para conseguir la estratificación óptima esperada se procedió mediante el parámetro de afijación proporcional para definir el número de profesores por municipio a los que se aplicaría el cuestionario. Luego, para seleccionar los profesores a encuestar por cada municipio se aplicó el proceso de selección aleatoria, empleando para ello la tabla de números aleatorios o random. A continuación, se detalla el número de docentes de secundaria por municipio y la asignación correspondiente. Este se obtuvo mediante la fórmula matemática Fórmula matemática donde n es el tamaño de muestra, Ni número de docentes por municipios y N es la población total de profesores de secundaria.

Número de docentes
Extraído del artículo científico Realidades del empleo docente en Nicaragua publicado por Zamora, López y Cobos (2016). Fuente: elaboración propia

El instrumento de recogida de datos para este estudio consistió en un cuestionario elaborado con la técnica de la escala Likert, por la que se presenta cada afirmación y se pide al sujeto que externe su reacción eligiendo uno de los puntos de la escala (cinco, en este caso).

Para asegurarnos de la validez del instrumento se desarrolló un pilotaje en el que participaron 30 profesores del Departamento de Chontales. Posteriormente se procedió a una validación por juicio de expertos en el que participaron seis doctores pertenecientes a la Universidad Nacional Autónoma de Nicaragua (Managua), Universidad Centroamericana, Ministerio de Educación de Guatemala y Universidad Pablo de Olavide. Una vez realizadas las mejoras recomendadas por los expertos, se procedió a evaluar la consistencia interna mediante la aplicación del alfa de Cronbach a todos los apartados del mismo.

Consideraciones para el uso de la Prueba de independencia que se tomaron en cuenta en este estudio.

  • De acuerdo con Mendivelso y Rodríguez (2018) los datos a considerarse deben provenir de una muestra aleatoria extraída de la población de interés. Y así también se debe tomar en cuenta que el muestreo haya sido bajo el esquema transversal.
  • También se tomaron en cuenta los requisitos sugeridos por Triola (2010), que expresan:
    1. La hipótesis nula Ho es afirmación de que las variables de renglón y de columna son independientes; la hipótesis alternativa H1 es la afirmación de que las variables de renglón y de columna son dependientes.
    2. Los datos se presentan como conteo de frecuencias en una tabla de 2 factores cuyas variables son categóricas. Para cada celda de las tablas de contingencias, la frecuencia esperada E es la menos de 5. (no existe requisito de que la frecuencia observada deba ser al menos de 5). Además, no existe requisito de que la población deba tener una distribución normal o cualquier otra distribución específica (p.607).

Habiendo tomado en consideración cada uno de los aspectos sugeridos por los expertos para la aplicación del test de Chi Cuadrado de independencia, en la fase de tratamiento cuantitativo de este estudio solo se consideraron aquellas tablas de contingencia bidimensionales (Variable sexo y las variables y subvariables relacionadas con aspectos de la profesión, situación socioeconómica y salud docente) cuyos valores de las frecuencias esperadas en las celdas fueron de al menos 5.

Las hipótesis formuladas para la aplicación de la prueba fueron:

Tabla # 1. Hipótesis sometidas a prueba de independencia

Ho: Las opiniones o respuestas proporcionadas por el colectivo encuestado que conformó la muestra es independiente del sexo del profesorado.

H1: Las opiniones o respuestas proporcionadas por el colectivo encuestado sí mostraron diferencias significativas en función del sexo del profesorado.

Fuente: Tomado de la tesis doctoral trabajo docente y sus repercusiones en la salud. Zamora (2016, p. 192).

Importante mencionar que para el cálculo de los valores que demanda la distribución (los valores esperados) y el valor del estadístico de contraste se llevaron a cabo con el paquete estadístico SPSS para Windows v.23.

3. Resultados y discusión

Se debe tener presente que la expresión con la que se desarrolla la prueba estadística está dada por:

donde

Cuando H0 es verdadera, se sigue una distribución X2 con (r-1)(c-1) grados de libertad (donde r: números de filas y c: número de columnas en la tabla de contingencia) (Mendivelso y Rodríguez, 2018).

Por tratarse de realizar la prueba sobre la hipótesis de que las opiniones proporcionadas por los encuestados profesores son independientes del sexo de los mismos. Cabe destacar que, de los 157 profesores encuestados, 49 fueron del sexo masculino y 108 del sexo femenino.

La estrategia a utilizar para establecer la dependencia o independencia del sexo con respecto a un sin número de aspectos que comportaban a cada macro variable o categoría mayor fue la determinar el valor de cada significancia asintótica arrojada en las tablas de cálculo del programa estadístico, luego juntarlos en una tabla que los contenía a todos.  Una vez juntados todos los valores se dispuso considerar únicamente aquellos que cumplieron con la condición de que la significancia asintótica era mayor que 0.05, valor con el que se negaba la dependencia o asociación entre las variables; es decir se aceptaba la hipótesis nula que confirma la independencia.

A continuación, se ilustra por ejemplo la aplicación de la estrategia entre la variable sexo / aspectos de la profesión y situación socioeconómica.

Tabla #2: Datos de significancia asintótica de la prueba de independencia

Tabla #2: Datos de significancia asintótica de la prueba de independencia

En la siguiente tabla se exponen los resultados obtenidos en el cálculo de Chi-Cuadrado, en el que se indica los valores de la significancia asintótica de cada tabla de contingencia bidimensional resultante entre la variable sexo y cada uno de los indicadores (subvariables) de la variable profesión y situación socioeconómica. Para ello sólo se tomaron en cuenta aquellos resultados de las tablas donde las frecuencias esperadas por categoría fueron al menos 5.

Como se había argumentado antes, si la significancia del estadístico es mayor que 0.05 podemos afirmar que no existe relación entre las variables. Atendiendo a esta condición, en todos los casos, excepto en el ítem 12, la tabla muestra que se han obtenido valores más elevados que 0.05, lo que nos lleva a determinar (con el 93% de los ítems) que el sexo de los docentes no influye en las respuestas emitidas en este estudio con relación a los aspectos concernientes a su profesión y a su situación socioeconómica, dando como resultado la aceptación de la Ho.

Esta estrategia se repitió para las siguientes pruebas de asociación entre la variable sexo y otros aspectos concernientes al estudio, destacándose resultados muy similares.

4. Conclusiones

Después de todo lo descrito a lo largo del artículo, se externan las siguientes conclusiones:

  • Finalmente, después de analizadas las tablas de contingencias y revisado el cumplimiento de los criterios sugeridos para la aplicación de la Chi cuadrada de independencia, se demostró que la opinión del profesorado fue independiente del sexo de los encuestados (no había relación entre ellas) y que por tanto se aceptó la hipótesis nula planteada.
  • Este test o prueba estadística de relación bilateral solo determina la asociación o independencia de dos variables categórica, sin informar la magnitud, ni el causal de dicha asociación.
  • Numerosos paquetes estadísticos son capaces de estimar el test de X2, sin embargo, se debe tener el gran cuidado de que su aplicación esté debidamente justificada, además de esta bien familiarizado con su significado estadístico.
  • Se deja claro para el estimado lector de este artículo que la estrategia empleada en este ejercicio investigativo, es una iniciativa tomada de otra tesis publicada en la Universidad de Sevilla, España y se justifica en el hecho de que las variables sometidas a la prueba de asociación son categóricas ordinales, y además provenían de un cuestionario ad hoc elaborado a base de escala Likert. Para entender de forma más ampliada la aplicación del test con apoyo del SPSS puede leer la tesis doctoral completa en:

https://acortar.link/y60ymz

5. Referencias bibliográficas

  1. Amaro, I. (2012). Uso inadecuado de la prueba de ji cuadrado y la omisión del control del sesgo de confusión. MEDISAN, 16(4), pp.623-632.
  1. Mc Hugg, ML. (2013). The Chi-Square test of independence. Biochemia medica, 23(2), pp. 143-149.
  1. Triola, M. (2009). Estadística. (10ma. Edición). México: PEARSON.
  1. Mendivelso, F. & Rodríguez, M. (2018). Prueba Chi-Cuadrado de Independencia Aplicada a tablas 2xN. Revista Médica Sanitas, 21(2), pp.92-95.
  2. Zamora, W., López, F. y Cobos, D. (2016). Realidades del empleo docente en Nicaragua. Revista Electrónica de Investigación Educativa, 18(2), pp. 191-205.