En este momento estás viendo Regresión escalonada

¿Qué es la regresión por pasos?

La regresión gradual implica la construcción iterativa paso a paso de un modelo de regresión que implica la selección de variables independientes para su uso en un modelo final. Implica agregar o eliminar posibles variables explicativas de sucesión y probar la significancia estadística después de cada iteración.

Debido a la disponibilidad de paquetes de software estadístico, es posible realizar una regresión por fases, incluso en modelos que contienen cientos de variables.

Conclusiones clave

  • La regresión gradual es un método que examina iterativamente la significancia estadística de todas las variables independientes en un modelo de regresión lineal.
  • El enfoque de selección comienza sin nada e incrementa todas las variables nuevas, probando la significancia estadística.
  • El método de eliminación hacia atrás comienza con un modelo completo cargado con varias variables y luego se elimina una variable para probar su importancia en relación con los resultados generales.
  • Sin embargo, la regresión por fases tiene desventajas porque es un enfoque basado en modelos para lograr el resultado deseado.

Tipos de regresión de graduación

El objetivo principal de la regresión por fases, a través de una serie de pruebas (por ejemplo, pruebas F, pruebas t), es obtener un conjunto de variables independientes que tengan un impacto significativo en la variable dependiente. Esto se hace con computadoras de tres iteraciones, que es el proceso de tomar resultados o decisiones a través de rondas o ciclos repetidos de análisis. Realizar pruebas automáticamente con la ayuda de paquetes de software estadístico tiene la ventaja de ahorrar tiempo y limitar los errores.

La regresión gradual se puede lograr probando una variable independiente a la vez e incluyéndola en el modelo de regresión si es estadísticamente significativa o incluyendo todas las posibles variables independientes en el modelo y eliminando aquellas que no son significativas estadísticamente. Algunos usan una combinación de ambos métodos, por lo que hay tres enfoques para la regresión por fases:

  1. Selección hacia adelante comienza sin variables en el modelo, prueba cada variable a medida que se agrega al modelo, luego mantiene las que se consideran estadísticamente significativas, repitiendo el proceso hasta que los resultados sean óptimos.
  2. Eliminar un gol comienza con un conjunto de variables independientes, eliminando una a la vez y luego probando para ver si la variable extraída es estadísticamente significativa.
  3. Eliminar bilateralmente Es una combinación de los dos primeros métodos de prueba qué variables deben incluirse o excluirse.

Ejemplo

Un ejemplo de regresión por fases que utiliza el método de agotamiento inverso es un intento de comprender el uso de energía en una fábrica utilizando variables como el tiempo del equipo, la antigüedad del equipo, el tamaño del personal, las temperaturas exteriores y la época del año. El modelo incluye todas las variables; luego, cada una de ellas se elimina, una a la vez, para determinar cuál es de menor importancia estadística. Al final, el modelo podría mostrar que la época del año y las temperaturas son las más significativas, lo que sugiere que quizás el consumo máximo de energía en la fábrica es cuando el uso de un acondicionador de aire está en su nivel más alto.

Límites de la regresión por fases

El análisis de regresión, tanto lineal como plurianual, se utiliza ampliamente en el mundo de la economía y la inversión en la actualidad. A menudo, la idea es encontrar patrones pasados ​​que puedan volver a ocurrir en el futuro. Una regresión lineal simple podría, por ejemplo, observar las relaciones precio-ganancias y los rendimientos de las acciones durante muchos años para ver si las acciones con relaciones P / E bajas (variables independientes) producen rendimientos más altos (variable dependiente). El problema con este enfoque es que las condiciones del mercado cambian con frecuencia y las relaciones anteriores no tienen que ser verdaderas en el presente o en el futuro.

Mientras tanto, hay muchas críticas en el proceso de regresión por fases e incluso hay llamadas para usar el método por completo. Los estadísticos notan una serie de desventajas del enfoque, incluidos resultados incorrectos, sesgo fundamental en el proceso en sí y la necesidad de una potencia informática significativa para desarrollar modelos de regresión complejos a través de la iteración.