¿Qué es la regresión lineal?
La regresión lineal es una gráfica de datos que representa gráficamente la relación lineal entre una variable independiente y una variable dependiente. Por lo general, se usa para mostrar la fuerza de la relación y la extensión de los resultados, todo para explicar el comportamiento de la variable dependiente.
Digamos que queríamos probar la fuerza de la relación entre la cantidad de helado ingerido y la obesidad. Tomaríamos la variable independiente, la cantidad de helado, y la conectaríamos con la variable dependiente, obesidad, para ver si existe una relación. Cuando se muestra la regresión, hay una representación gráfica de esta relación, la variabilidad en los datos es menor, la relación es más fuerte y el ajuste para la línea de regresión es más fuerte.
Conclusiones clave
- La regresión lineal imagina la relación entre las variables dependientes e independientes.
- El análisis de regresión se puede lograr si las variables son independientes, si no hay heterogeneidad y si los términos de error de las variables no están relacionados.
- La regresión lineal es más fácil de modelar en Excel con el paquete de herramientas de análisis de datos.
Consideraciones importantes
Hay algunas suposiciones críticas sobre su conjunto de datos que deben ser verdaderas para continuar con el análisis de regresión:
- Las variables deben ser verdaderamente independientes (utilizando una prueba de Chi-cuadrado).
- Los datos no deben tener diferentes tasas de error (esto se llama heterocedasticidad (también deletreada heterocedasticidad)).
- Los términos de error de cada variable no deben estar relacionados. Si no es así, significa que las variables están correlacionadas en serie.
Si esas tres cosas son complicadas, lo son. Pero el efecto de una de esas circunstancias que no es cierto es una estimación sesgada. Básicamente, estaría tergiversando la relación que está midiendo.
Regresión de salida en Excel
El primer paso para ejecutar el análisis de regresión en Excel es verificar que esté instalado el paquete de herramientas gratuito de análisis de datos de Excel. Este complemento facilita el cálculo de una serie de estadísticas. es no necesario para trazar una línea de regresión lineal, pero simplifica la creación de tablas estadísticas. Para verificar si está instalado, seleccione «Detalles» en la barra de herramientas. Si «Análisis de datos» es una opción, la función está instalada y lista para usar. Si no está instalado, puede solicitar esta opción haciendo clic en el botón de Office y seleccionando «Opciones de Excel».
Con las herramientas de análisis de datos, solo unos pocos clics para crear una salida de regresión.
La variable independiente va en el rango de X.
A la luz de los rendimientos del S&P 500, digamos que queremos ver si podemos evaluar la solidez y la relación de los rendimientos de las acciones de Visa (V). La columna 1 es la variable que depende de los datos de devolución de acciones de Visa (V). Los datos de retorno del S&P 500 llenan la columna 2 como variable independiente.
- Seleccione «Detalles» en la barra de herramientas. El menú muestra «Detalles».
- Seleccione «Análisis de datos». El cuadro de diálogo muestra Análisis de datos – Herramientas de análisis.
- En el menú, seleccione «Regresión» y haga clic en «Aceptar».
- En el cuadro de diálogo Regresión, haga clic en el cuadro «Input Y Range» y seleccione los retornos de valores de datos de la variable dependiente (Visa (V)).
- Haga clic en el cuadro «X Input Range» y seleccione los datos de la variable independiente (devoluciones del S&P 500).
- Haga clic en «Aceptar» para ejecutar los resultados.
[Note: If the table seems small, right-click the image and open in new tab for higher resolution.]

Interprete los resultados
Usando esos datos (los mismos de nuestra sección R-cuadrado), obtenemos la siguiente tabla:

El r.2 El valor, también conocido como coeficiente de determinación, mide la proporción de varianza en la variable dependiente que explica la variable independiente o qué tan bien se ajusta el modelo de regresión a los datos. El r.2 el valor varía de 0 a 1, y un valor más alto indica que es mejor. El valor p, o valor de probabilidad, también está entre 0 y 1 e indica si la prueba es significativa. En contraste con R.2 valor, el valor p es menos favorable porque indica una correlación entre las variables dependientes e independientes.
Regresión de gráficos en Excel
Podemos registrar regresiones en Excel resaltando los datos y trazándolos como un gráfico. Para agregar una línea de regresión, seleccione «Diseño» en el menú «Herramientas de gráficos». En el cuadro de diálogo, seleccione «Línea de tendencia» y luego «Línea de tendencia lineal». A la R.2 valor, seleccione «Más opciones de tendencia» en el menú «Línea de tendencia». Finalmente, seleccione «Mostrar valor R-cuadrado en un gráfico».
