El servicio interno de contribuciones de EEUU
AVIREXInforme17 de Agosto de 2017
1.707 Palabras (7 Páginas)1.466 Visitas
EJEMPLO 3
El servicio interno de contribuciones de EEUU, está tratando de estimar la cantidad mensual de impuestos no pagados descubiertos por el departamento de auditorías, en el pasado se estimaba esta cantidad con base en el número de horas de trabajo de auditorías en campo; sin embargo esa variable parece no ser suficiente para detectar los impuestos faltantes, por lo tanto se han integrado otras dos variables tales como: el número de horas que usan sus computadoras para detectar los impuestos no pagados y las recompensas a los informantes. Se desea establecer una ecuación que estime los impuestos no pagados en cada mes. Además se desea establecer si estas variables sin realmente significativas para el resultado final. Los datos que se tienen son:
Mes | Horas de auditoria de campo (cientos) | Horas en computadora (cientos) | Recompensa a informantes (miles) | Impuestos no pagados descubierto (millones) |
Enero | 45 | 16 | 71 | 29 |
Febrero | 42 | 14 | 70 | 24 |
Marzo | 44 | 15 | 72 | 27 |
Abril | 45 | 13 | 71 | 25 |
Mayo | 43 | 13 | 75 | 26 |
Junio | 46 | 14 | 74 | 28 |
Julio | 44 | 16 | 76 | 30 |
Agosto | 45 | 16 | 69 | 28 |
Septiembre | 44 | 15 | 74 | 28 |
Octubre | 43 | 15 | 73 | 27 |
Resolver lo siguiente:
- Verificar si existe dependencia de los pagos de impuestos no pagados. Con respecto a las variables independientes y determinar Las variables significativas, con un nivel de significancia del 5%.
- Estimar los intervalos de confianza tanto al 95% para la intersección como para cada una de las variables independientes.
- Establezca si existe normalidad,
- Establezca si existe homcedasticidad y colinialidad.
- Realizar un análisis de residuales
Método 1. Usando función de análisis de datos de EXCEL.
Resumen | ||||||
Estadísticas de la regresión | ||||||
Coeficiente de correlación múltiple | 0.992 | |||||
Coeficiente de determinación R^2 | 0.983 | |||||
R^2 ajustado | 0.975 | |||||
Error típico | 0.286 | |||||
Observaciones | 10 | |||||
| Coeficientes | Error típico | Estadístico t | Probabilidad | Inferior 95% | Superior 95% |
Intercepción | -45.796 | 4.88 | -9.39 | 0.0001 | -57.73 | -33.86 |
Horas. Auditoria | 0.597 | 0.08 | 7.36 | 0.0003 | 0.40 | 0.80 |
Horas computadora | 1.177 | 0.08 | 14.00 | 0.0000 | 0.97 | 1.38 |
Recompensa informantes | 0.405 | 0.04 | 9.59 | 0.0001 | 0.30 | 0.51 |
ANÁLISIS DE VARIANZA | |||||
| Grados de libertad | Suma de cuadrados | Promedio de los cuadrados | F | Valor crítico de F |
Regresión | 3 | 29.109 | 9.703 | 118.517 | 0.000 |
Residuos | 6 | 0.491 | 0.082 | ||
Total | 9 | 29.6 |
|
|
|
Método2. Usando software MINITAB
La ecuación de regresión es
Impuestos = - 45.8+0.597 Auditoria+1.18 Computadora+0.405 Recompensa
Predictor Coef Coef. de EE T P VIF
Constante -45.796 4.878 -9.39 0.000
Auditoria 0.59697 0.08112 7.36 0.000 1.037
Computadora 1.17684 0.08407 14.00 0.000 1.045
Recompensa 0.40511 0.04223 9.59 0.000 1.013
S = 0.286128 R-cuad. = 98.3% R-cuad.(ajustado) = 97.5%
Análisis de varianza
Fuente GL SC MC F P
Regresión 3 29.1088 9.7029 118.52 0.000
Error residual 6 0.4912 0.0819
Total 9 29.6000
Resolviendo cada uno de los incisos.
- La primera inferencia a resolver si una o más variable independientes, en su conjunto explican significativamente a la variable independiente, en este casos si las horas de auditoria, las horas en computadora y el pago de recompensas tienen una relación significativa con los impuestos no pagados. Para resolver este interrogante, se plantea las siguiente hipótesis.
Ho: B1=B2=..Bk = 0 (Implica que Y no depende de las Xi).
Ha: Por lo menos una Bi≠0 (Implica Y depende al menos una de las Xi)
Se usa el análisis de ANOVA para demostrar esta hipótesis, en este caso la F calculada es de 118.52, la F critica según los grados de libertad es de 9.78, como Fcalculada > Fcritica, y además la probabilidad (P) es menor que el nivel de significancia, es decir, 0.05>0.000, se rechaza la hipótesis nula, lo cual implica que al menos una de las variables independientes es significativa.
En este sentido la siguiente pregunta a resolver sería cuál de ellas (en este caso, las horas de auditoria, las horas en computadora y el pago de recompensas), es la significativa o la mas significativa. Para ello se usará la prueba de t de student, para cada una de las variables independientes. En este caso el valor t a comparar sería aquel que corresponda a una prueba de dos colas con un nivel de significancia del 5% y n-k-1, grados de libertad, es decir 10-3-1= 6. Dicho dato es 2.447
El planteamiento sería.
Variable: Horas de auditoria de campo (B1).
Ho: B1 = 0 (No es una variable explicativa significativa)
Ha: B1 ≠ 0 (Es una variable explicativa significativa)
De la tabla de Excel o minitab, el dato de t para esta variable es 7.39. Cómo la tcalculada>tcritica (7.39>2.447). Se rechaza la Ho y de dice que la Horas de auditoria en campo son una variable significativa.
Variable: Horas de computadora (B2).
Ho: B2 = 0 (No es una variable explicativa significativa)
Ha: B2 ≠ 0 (Es una variable explicativa significativa)
...