En este momento estás viendo Coeficiente de determinación

¿Qué es el coeficiente de determinación?

El coeficiente de determinación es una medida estadística que examina cómo las diferencias en una variable pueden explicarse por la diferencia en la segunda variable, prediciendo el resultado de un evento en particular. Es decir, este coeficiente, llamado R-cuadrado (o R. más a menudo2), evalúa la fuerza de la relación lineal entre dos variables, y los investigadores se basan en gran medida en ellas al analizar las tendencias. Para citar un ejemplo de su aplicación, este coeficiente puede considerar la siguiente pregunta: si una mujer queda embarazada en un día determinado, ¿cuál es la probabilidad de que dé a luz a su hijo en una fecha determinada en el futuro? En este caso, esta métrica tiene como objetivo calcular la correlación entre dos eventos relacionados: mentira y nacimiento.

Conclusiones clave

  • El coeficiente de determinación centrado en el análisis estadístico de modelos de datos es una idea compleja.
  • El coeficiente de determinación se usa para explicar cuánta variabilidad puede causar un factor en su relación con otro factor.
  • Este coeficiente se llama comúnmente R-cuadrado (o R)2), y a veces se le llama «la bondad de la aptitud».
  • Esta medida se expresa como un valor entre 0.0 y 1.0, donde un valor de 1.0 indica un ajuste perfecto, por lo que es un modelo muy confiable para pronósticos futuros, y un valor de 0.0 indicaría que el modelo falla en modelar los datos con precisión en moda.

¿Para que sirve el coeficiente de determinación?

La utilidad de R 2 es su capacidad para encontrar la probabilidad de que los eventos futuros caigan dentro de los resultados previstos. La idea es que si se agregan más muestras , el coeficiente mostraría la probabilidad de que un nuevo punto caiga en la línea.
Incluso si existe una fuerte conexión entre las dos variables, la determinación no prueba la causalidad. Por ejemplo, un estudio sobre cumpleaños puede mostrar que una gran cantidad de cumpleaños suceden en un período de uno o dos meses. Esto no quiere decir que el paso del tiempo o el cambio de estaciones provoque el embarazo.

¿Cómo interpretar el coeficiente de determinación?

En estadistica el coeficiente de determinación es una medida que se usa para explicar cuánta variabilidad puede causar que un factor esté relacionado con otro factor relacionado. Esta correlación, conocida como “bondad de idoneidad” se expresa como un valor entre 0.0 y 1.0. Un valor de 1.0 indica un ajuste perfecto, por lo que es un modelo muy confiable para pronósticos futuros, y un valor de 0.0 indicaría que el cálculo falla en modelar los datos con precisión. Pero un valor de 0,20, por ejemplo, implica que la variable independiente predice el 20% de la variable dependiente, y un valor de 0,50 implica que la variable independiente predice el 50% de la variable dependiente, y así sucesivamente.

Graficar el coeficiente de determinación

En un gráfico, la bondad del ajuste mide la distancia entre una línea de ajuste y todos los puntos de datos dispersos por el diagrama. El conjunto ajustado de datos tendrá una línea de regresión que está cerca de los puntos y tendrá un alto nivel de aptitud, lo que significa que la distancia entre la línea y los datos es pequeña. Aunque R. encaja bien2 cerca de 1.0, este número por sí solo no puede determinar si los puntos de datos o las predicciones están sesgados. Tampoco les dice a los analistas si el coeficiente de valor de determinación es fundamentalmente bueno o malo. Depende de la elección del usuario evaluar el significado de esta correlación y cómo se puede aplicar en el contexto de futuros análisis de tendencias.

Fórmula para el coeficiente de determinación

Existen múltiples fórmulas para calcular el coeficiente de determinación:

  1. Usando el coeficiente de correlación:

Coeficiente de correlación = Σ [(X – X m ) * (Y – Y m )] / √ [Σ (X – X m ) 2 * Σ (Y – Y m ) 2 ]

Donde:

  • X : puntos de datos en el conjunto de datos X
  • Y – Puntos de datos en el conjunto de datos Y
  •  – Media del conjunto de datos X
  •  – Media del conjunto de datos Y

Entonces

Coeficiente de Determinación (R 2 ) = (Coeficiente de Correlación) 2
  1. Uso de salidas de regresión

Coeficiente de Determinación (R 2 ) = Variación Explicada / Variación Total

Coeficiente de Determinación (R 2 ) = MSS / TSS

Coeficiente de Determinación (R 2 ) = (TSS – RSS) / TSS

Donde:

  • TSS – Suma total de cuadrados = Σ (Yi – Ym) 2
  • MSS – Modelo Suma de cuadrados = Σ (Y^ – Ym) 2
  • RSS – Suma Residual de Cuadrados =Σ (Yi – Y^) 2