En este momento estás viendo Regresión lineal múltiple (MLR)

¿Qué es la regresión lineal múltiple (MLR)?

La regresión lineal múltiple (MLR), también conocida como regresión múltiple, es una técnica estadística que utiliza varias variables explicativas para predecir el resultado de las variables de respuesta. El objetivo de la regresión lineal múltiple (MLR) es modelar la relación lineal entre las variables explicativas (independientes) y la variable de respuesta (dependiente).

En esencia, la regresión múltiple es la regresión de la regresión cuadrada normal más pequeña (MCO) porque involucra más de una variable explicativa.

Conclusiones clave

  • La regresión lineal múltiple (MLR), también conocida como regresión múltiple, es una técnica estadística que utiliza varias variables explicativas para predecir el resultado de las variables de respuesta.
  • La regresión múltiple es una extensión de la regresión lineal (MCO) que utiliza una única variable explicativa.
  • MLR se usa ampliamente en economía e inferencia financiera.

Fórmula y cálculo de regresión lineal múltiple














y

I


=


β

0


+


β

1



X


I

1



+


β

2



X


I

2



+

.

.

.

+


β

pag



X


I

pag



+

ϵ
















dónde,


por



I

=

norte



observaciones:

















y

I


=

variable dependiente
















X

I


=

variables explicativas
















β

0


=

intercepción y (término constante)
















β

pag


=

coeficientes de pendiente para todas las variables explicativas















ϵ

=

término de error del modelo (también conocido como residuos)






begin {alineado} & y_i = beta_0 + beta _1 x_ {i1} + beta _2 x_ {i2} + … + beta _p x_ {ip} + epsilon \ & textbf {donde, para } i = n textbf {observaciones:} \ & y_i = text {variable dependiente} \ & x_i = text {variables explicativas} \ & beta_0 = text {intersección y (término constante)} & beta_p = text {coeficientes de pendiente para todas las variables explicativas} \ & epsilon = text {término de error del modelo (también conocido como residuos)} end {alineado}


yI=β0+β1XI1+β2XI2+...+βpagXIpag+ϵdonde, para I=norte observaciones:yI=variable dependienteXI=variables explicativasβ0=intercepción y (término constante)βpag=coeficientes de pendiente para todas las variables explicativasϵ=término de error del modelo (también conocido como residuos)

Lo que la regresión lineal múltiple puede decirle

La regresión lineal simple es una función que permite a un analista o estadístico hacer una predicción sobre una variable basándose en la información conocida sobre otra variable. La regresión lineal solo se puede utilizar cuando una de ellas tiene dos variables continuas: una variable independiente y una variable dependiente. La variable independiente es el parámetro utilizado para calcular la variable dependiente o el resultado. Un modelo de regresión múltiple se extiende a una serie de variables explicativas.

El modelo de regresión múltiple se basa en los siguientes supuestos:

  • Existe una relación lineal entre las variables dependientes y las variables independientes
  • No existe una correlación excesivamente correlacionada entre las variables independientes
  • yI Las observaciones se seleccionan de forma independiente y aleatoria de la población.
  • Los residuos deben distribuirse normalmente con media 0 y varianza σ

El coeficiente de determinación (cuadrado R) es una métrica estadística utilizada para medir la magnitud del cambio en el resultado que puede explicarse por la varianza en las variables independientes. R.2 siempre aumenta a medida que se agregan más predictores al modelo MLR, aunque es posible que los predictores no estén relacionados con la variable de resultado.

R.2 por lo tanto, no puede usarse para determinar los predictores que deben incluirse en un modelo y quiénes deben excluirse. R.2 solo puede estar entre 0 y 1, donde 0 indica que ninguna de las variables independientes se puede predecir y 1 indica que el resultado se puede predecir sin error a partir de las variables independientes.

Al interpretar los resultados de regresión múltiple, los coeficientes beta válidos y todas las demás variables son constantes («todo lo demás es igual»). La salida de múltiples regresiones se puede mostrar horizontalmente como una ecuación o verticalmente en forma de tabla.

Ejemplo de cómo utilizar la regresión lineal múltiple

Por ejemplo, los analistas pueden querer saber cómo el movimiento del mercado afecta el precio de ExxonMobil (XOM). En este caso, el valor del índice S&P 500 será la variable independiente, o predictor, y el precio de XOM será la variable dependiente de su ecuación lineal.

De hecho, existen numerosos factores que predicen el resultado de un evento. El movimiento de precios de ExxonMobil, por ejemplo, depende más que del desempeño general del mercado. Otros pronósticos como el precio del petróleo, las tasas de interés y el movimiento del precio de los futuros del petróleo pueden afectar el precio de XOM y los precios de las acciones de otras compañías petroleras. Para comprender una relación en la que están presentes más de dos variables, se utiliza la regresión lineal múltiple.

La regresión lineal múltiple (MLR) se utiliza para determinar una relación matemática entre varias variables aleatorias. En otras palabras, MLR examina la relación de múltiples variables independientes con una sola variable dependiente. Una vez que se han establecido todos los factores independientes para predecir la variable dependiente, la información sobre las múltiples variables se puede utilizar para crear una predicción precisa del nivel de efecto que tienen sobre la variable de resultado. El modelo crea una relación en forma de línea recta (lineal) que se aproxima mejor a todos los puntos de datos individuales.

Refiriéndose a la ecuación MLR anterior, en nuestro ejemplo:

  • yI variable dependiente – precio XOM
  • Xi1 Tasas de interés
  • Xi2 precio del petróleo
  • Xi3 = Valor del índice S&P 500
  • Xi4precio futuros del petróleo
  • B.0 = intersección con el eje y en cero
  • B.1 cambio de la unidad de medida del coeficiente de regresión en la variable dependiente cuando xi1 cambios: el cambio en el precio de XOM cuando cambian las tasas de interés
  • B.2 cambio de la unidad de medida del coeficiente de valor en la variable dependiente cuando xi2 cambios: el cambio en el precio de XOM cuando cambian los precios del petróleo

Estimaciones de los cuadrados más pequeños, B.0, B.1, B.2… B.pag, generalmente se calculan con software estadístico. Se pueden incluir tantas variables en el modelo de regresión en el que cada variable independiente se diferencia por un número: 1,2, 3, 4 … p. El modelo de regresión múltiple permite a los analistas predecir un resultado en función de la información proporcionada sobre múltiples variables explicativas.

Sin embargo, el modelo no siempre es perfectamente preciso, ya que cada punto de datos puede diferir ligeramente del resultado previsto del modelo. El valor residual, E, que es la diferencia entre el resultado real y el resultado previsto, se incluye en el modelo para tener en cuenta estas pequeñas variaciones.

Suponiendo que ejecutamos nuestro modelo de regresión de precios XOM a través del software de cálculo de estadísticas, devuelve este resultado:

Imagen

Imagen de Sabrina Jiang © Investopedia 2020

Los analistas interpretarían que esta salida significaría que si otras variables se mantienen estables, el precio de XOM aumentará un 7,8% si el precio del petróleo en los mercados sube un 1%. El modelo también muestra que el precio de XOM caerá un 1,5% después de un aumento del 1% en las tasas de interés. R.2 sugiere que el 86,5% de las variaciones en el precio de las acciones de Exxon Mobil pueden explicarse por cambios en la tasa de interés, el precio del petróleo, los futuros del petróleo y el índice S&P 500.

La diferencia entre regresión lineal y múltiple

La regresión del cuadrado lineal normal (MCO) compara la respuesta de las variables dependientes a la luz de un cambio en algunas variables explicativas. Sin embargo, rara vez una variable dependiente explica solo una variable dependiente. En este caso, los analistas usan regresión múltiple, que intenta explicar una variable dependiente usando más de una variable independiente. Varias transiciones pueden ser lineales y no lineales.

Los múltiplos se basan en el supuesto de que existe una relación lineal entre las variables dependientes e independientes. Tampoco asume ninguna correlación importante entre las variables independientes.

Preguntas frecuentes

¿Qué significa regresión «múltiple»?

La regresión múltiple considera el efecto de más de una variable explicativa sobre algún resultado de interés. Evalúa el efecto relativo de estas variables explicativas o independientes sobre la variable dependiente y todas las demás variables del modelo fijo.

¿Por qué se usaría una regresión múltiple en lugar de una regresión simple de MCO?

Las variables dependientes rara vez explican solo una variable dependiente. En tales casos, los analistas usan regresión múltiple, que intenta explicar una variable dependiente usando más de una variable independiente. Sin embargo, el modelo asume que no existen correlaciones importantes entre las variables independientes.

¿Puedo hacer varias regresiones manualmente?

Probablemente no. Los modelos de regresión múltiple son complejos y se vuelven aún más grandes cuando se incluyen más variables en el modelo o cuando aumenta la cantidad de datos a analizar. Para ejecutar regresiones múltiples probablemente necesitará utilizar software estadístico especializado o funciones dentro de programas comerciales como Excel.

¿Qué significa tener una regresión múltiple «lineal»?

En la regresión lineal múltiple, el modelo calcula la línea de mejor ajuste que minimiza las variables de cada una de las variables incluidas en relación con la variable dependiente. Debido a que se ajusta a su línea, es un modelo lineal. También existen modelos de regresión no lineal que contienen múltiples variables, como regresión logística, regresión cuadrática y modelos de sucesiones.

¿Cómo se utilizan los modelos de regresión múltiple en finanzas?

Cualquier modelo econométrico que observe más de una variable puede tener múltiples regresiones. Los modelos de factores, por ejemplo, comparan dos o más factores para analizar las relaciones entre las variables y el rendimiento resultante. Fama y French Three-Factor Mod es uno de esos modelos que expande el modelo de precios de activos de capital (CAPM) agregando factores de riesgo de tamaño y valor al factor de riesgo de mercado en CAPM (que es en sí mismo un modelo regresivo). Al tener en cuenta estos dos factores adicionales, el modelo se ajusta a este sesgo mejorado, que se cree que lo convierte en una mejor herramienta para evaluar el desempeño de los gerentes.