Análisis Estadístico de Variables Socioeconómicas en la Provincia del Guayas, Ecuador

1. Tipos de Variables

1.1. Variables Cualitativas

  • Cantón
  • Obligado_a llevar_contabilidad
  • Clase_contribuyente

1.2. Variables Cuantitativas

  • Plazas_ult_rango_edad_4
  • Empleo_iess_trim_3
  • Empleo_iess_trim_4

2. Pruebas de Hipótesis Paramétricas

2.1. Media Poblacional con Sigma Conocida

Problema:

El Instituto Nacional de Estadística y Censos (INEC) en la provincia del Guayas, llevó a cabo un análisis para determinar el salario promedio de los empleados del cantón Durán. Se utilizó una muestra aleatoria de 525 trabajadores con una desviación estándar de 35 y un nivel de significancia de 0.05. Cabe destacar que el censo ha establecido que el salario debe ser mayor a 455. (BASE DE DATOS GUAYAS.xlsx).

Resultados:

Z crítico Izquierdo: -1,96

Z crítico derecho: 1,96

Z observado: -42.12

Análisis:

El análisis de los salarios en el cantón Durán sugiere que el salario promedio es probablemente menor a 455 unidades, el estándar del censo. Esta conclusión, basada en un valor Z observado significativamente menor que el crítico y un p-valor de 0, lleva a rechazar la hipótesis nula. Este resultado es crucial, ya que indica una discrepancia importante entre los salarios reales y el estándar establecido, lo cual podría tener implicaciones significativas en la formulación de políticas salariales y en el bienestar económico en la región.

2.2. Media Poblacional con Sigma Desconocida

Problema:

El Instituto Nacional de Estadística y Censos (INEC) de la provincia del Guayas, realizó un estudio para determinar cuántas empresas usan RIMPE en el cantón de Palestina. Se tomó una muestra aleatoria de 255 empresas y se registró su clase contribuyente. Con un nivel de significancia del 0.05 (BASE DE DATOS GUAYAS.xlsx).

Resultados:

t crítico izquierdo: -4.30

t crítico derecho: 4.30

t observado: -0.74

Análisis:

El análisis estadístico sobre el uso de RIMPE en empresas del cantón de Palestina revela que el valor t observado no es suficientemente extremo para superar los valores críticos, y el p-valor de 0.32 excede el umbral de significancia del 5%. Esto implica que no hay evidencia suficiente para rechazar la hipótesis nula, la cual sugiere que la media poblacional de uso de RIMPE en esta región podría ser de 225. En resumen, los datos de la muestra no muestran una diferencia significativa respecto a la expectativa inicial de uso de RIMPE en Palestina.

2.3. Proporción Poblacional

Problema:

El Instituto Nacional de Estadística y Censos (INEC) de la provincia del Guayas, llevó a cabo una investigación con el objetivo de determinar la proporción de personas que residen en el sector turístico de Colimes. Se extrajo una muestra aleatoria de 625 individuos, de los cuales 234 afirmaron que residen en Colimes. El nivel de significancia utilizada en este análisis fue = 0.05, los datos asociados a esta investigación se encuentran detallados en la (BASE DE DATOS GUAYAS.xlsx).

Resultados:

Z crítico izquierda: -1.96

Z crítico derecha: 1.96

Z observado: 22,87

Análisis:

Un análisis de la población del sector turístico de Colimes indica que la proporción de residentes es probablemente mayor al 10%. Este resultado se basa en un valor Z observado significativamente más alto que el valor crítico y un p-valor de cero, muy por debajo del nivel de significancia del 5%. Al rechazar la hipótesis nula, se revela una concentración de residentes en este sector mucho mayor de lo esperado. Este hallazgo es crucial para comprender mejor la composición demográfica de Colimes y podría influir significativamente en las estrategias de desarrollo turístico y urbano de la región.

3. Prueba de Hipótesis No Paramétricas: Independencia

Problema:

El Instituto Nacional de Estadísticas y Censos (INEC) está investigando si existe una relación entre la ubicación geográfica de las empresas (especificada por el cantón) y su clasificación fiscal (como Contribuyente Especial, Otro Contribuyente o Rimpe) en la provincia del Guayas. El objetivo es determinar si la clase de contribuyente de una empresa está asociada con su ubicación en un cantón específico, lo que podría sugerir diferencias regionales en la estructura económica o en las políticas fiscales. Para esto, se ha extraído una muestra aleatoria de empresas y se ha registrado su cantón y clase de contribuyente. Con estos datos, se quiere aplicar una prueba de hipótesis no paramétricas (prueba Chi-cuadrado) para evaluar la independencia entre estas dos variables categóricas.

wvzdYZssVaBcf3ONT2lKP4ffSKXm1qj1WcAAAAASUVORK5CYII=

Análisis:

Luego de analizar los datos, se determinó que el valor observado de Chi-cuadrado supera el valor crítico, lo que indica una conexión importante entre el cantón y la clase contribuyente en la base de datos estudiada. Este resultado sugiere que la clasificación fiscal de las empresas no es aleatoria, sino que está influenciada por su ubicación geográfica. Este hallazgo es de gran relevancia para comprender las dinámicas fiscales regionales y sería fundamental para la planificación de políticas económicas y fiscales adaptadas a las características específicas de cada cantón.

4. Regresión Lineal: Taller 1

4.1. Relación entre Experiencia Laboral y Sueldo

Se tiene la siguiente información proporcionada por la empresa de Recursos Humanos “MX” en el área de la construcción, que relaciona la experiencia laboral con el sueldo percibido en Ecuador, en el área de análisis de información.

0zT+8OG3rYIAAAAASUVORK5CYII=

21pEiRQgICAsTX11eOHTtmXEFkXiIbF60REcUaW5pERCawpUmWgIXnYWFhcuLECeOMSKZMmaR27dpSqFAh4wxRwmPQpAQXEhIiy5Yt078nTpxYj3v37ukBVatWlfr16+vfiRKWyP8A5t+I1IICP88AAAAASUVORK5CYII=

4.1.1. Análisis del Diagrama de Dispersión:

¿Qué indica el diagrama acerca de la relación entre las dos variables?

En el diagrama se observa que hay una relación positiva entre la experiencia laboral y el sueldo, lo que se relaciona con la pendiente positiva de la gráfica.

4.1.2. Ecuación de Regresión Lineal:

Utilice el software R, y obtenga una ecuación de regresión lineal estimada a efecto de estimar el sueldo anual, en base a los años de experiencia.

y = 3.254x + 74.217

4.1.3. Bondad del Ajuste:

Haga un comentario sobre la bondad del ajuste, es decir analice el coeficiente de determinación.

El coeficiente de determinación (R cuadrado) indica que el 60.52% de la variabilidad en los sueldos es explicada por la variable independiente, la experiencia laboral.

4.1.4. Coeficiente de Correlación:

Calcule el coeficiente de correlación.

El coeficiente de correlación en R resultó ser 0.777959.

4.1.5. Análisis del Coeficiente de Correlación y el Coeficiente de Determinación:

Analice el resultado del ítem 1.2 con el del ítem 1.5.

El análisis del coeficiente de determinación (1.2) y el coeficiente de correlación (1.5) muestra una buena correlación lineal positiva entre las variables, pero no es perfecta. Esto indica que si bien la experiencia laboral es un factor importante en la determinación del sueldo, existen otros factores que también influyen.

4.1.6. Hipótesis Nula y Alternativa:

Plantee las hipótesis nula y alternativa para la regresión lineal simple.

H0: β1 = 0 (la pendiente de la recta de regresión es igual a cero, no hay relación lineal entre las variables)

Ha: β1 ≠ 0 (la pendiente de la recta de regresión es diferente de cero, existe una relación lineal entre las variables)

4.1.7. Método del p-valor:

Utilizando el método del p-valor (ANOVA), escriba el p-valor y con un nivel de significancia Alpha = 0.05, analice si la hipótesis nula es rechazada.

Si el p-valor es menor que el nivel de significancia (Alpha = 0.05), se rechaza la hipótesis nula. En este caso, si se rechaza la hipótesis nula, se concluye que existe un modelo de regresión lineal significativo entre las variables.

4.1.8. Confiabilidad de la Ecuación de Regresión:

¿Confiaría en usar la ecuación de regresión estimada desarrollada en el ítem 1.3?

Si el p-valor es menor que 0.05 y el coeficiente de determinación es aceptablemente alto, se puede confiar en la ecuación de regresión estimada para predecir el sueldo de una persona con base en su experiencia laboral.

4.1.9. Estimación del Sueldo:

Estime el sueldo de una persona que tiene 5 años de experiencia.

Si se confía en el modelo de regresión, se puede reemplazar el valor de x (experiencia laboral) en la ecuación para obtener una estimación del sueldo:

y = 3.254 * 5 + 74.217 = 90.487

Por lo tanto, se estima que una persona con 5 años de experiencia tendría un sueldo de aproximadamente 90.487 unidades.

5. Regresión Lineal: Caso de Estudio

5.1. Estudio de Caso: Empresas en el Ecuador

5.1.1. Tema:

Relación entre el Nivel de Empleo y la Cantidad de Plazas de Trabajo en Empresas de Guayas, Ecuador.

5.1.2. Problema:

Se recopilaron datos trimestrales de 30 empresas en Guayas, Ecuador, durante el tercer trimestre del año. Se registró el nivel de empleo (número de empleados) y la cantidad de plazas de trabajo disponibles en cada empresa. A continuación, se presentan algunos de los datos recopilados por el INEC: (BASE DE DATOS GUAYAS.xlsx). Se desea investigar si existe una relación lineal entre el nivel de empleo y la cantidad de plazas de trabajo, y construir un modelo de regresión lineal simple para predecir las plazas de trabajo en función del nivel de empleo.

5.1.3. Variables:

Indique cuál es la variable independiente y cuál es la variable dependiente.

Variable independiente (x): Empleo_iess_trim_3 (nivel de empleo)

Variable dependiente (y): Plazas_ult_rango_edad_4 (cantidad de plazas de trabajo)

5.1.4. Diagrama de Dispersión:

+lSlqWyFAkQAAAABJRU5ErkJggg==

5.1.5. Análisis del Diagrama de Dispersión:

¿Qué indica el diagrama acerca de la relación entre las dos variables?

El diagrama de dispersión muestra una relación positiva entre el nivel de empleo y la cantidad de plazas de trabajo. Esto significa que, en general, a medida que aumenta el nivel de empleo en una empresa, también tiende a aumentar la cantidad de plazas de trabajo disponibles.

5.1.6. Ecuación de Regresión Lineal:

Utilice el software R, calcule y escriba la ecuación de regresión lineal.

y = 0.2295x + 0.2843

5.1.7. Bondad del Ajuste:

Haga un comentario sobre la bondad del ajuste, es decir, analice el coeficiente de determinación.

El coeficiente de determinación (R cuadrado) de 0.8453 indica que el 84.53% de la variabilidad en la cantidad de plazas de trabajo es explicada por el nivel de empleo. Esto sugiere un buen ajuste del modelo de regresión lineal a los datos.

5.1.8. Coeficiente de Correlación:

Calcule el coeficiente de correlación.

El coeficiente de correlación es 0.9193919.

5.1.9. Análisis del Coeficiente de Correlación y el Coeficiente de Determinación:

Analice el resultado del ítem 1.5 con el del ítem 1.8.

Tanto el coeficiente de determinación como el coeficiente de correlación indican una fuerte relación lineal positiva entre el nivel de empleo y la cantidad de plazas de trabajo. Esto confirma la observación inicial del diagrama de dispersión.

5.1.10. Hipótesis Nula y Alternativa:

Plantee las hipótesis nula y alternativa para la regresión lineal simple.

H0: β1 = 0 (la pendiente de la recta de regresión es igual a cero, no hay relación lineal entre las variables)

Ha: β1 ≠ 0 (la pendiente de la recta de regresión es diferente de cero, existe una relación lineal entre las variables)

5.1.11. Método del p-valor:

Utilizando el método del p-valor (ANOVA), escriba el p-valor y con un nivel de significancia Alpha = 0.05, analice si la hipótesis nula es rechazada.

Si el p-valor obtenido del análisis ANOVA es menor que el nivel de significancia (Alpha = 0.05), se rechaza la hipótesis nula. Esto indicaría que existe suficiente evidencia estadística para concluir que hay una relación lineal significativa entre el nivel de empleo y la cantidad de plazas de trabajo en las empresas de Guayas, Ecuador.