¿Qué es el valor P?
En estadística, el valor p es la probabilidad de obtener resultados al menos tan extremos como los resultados observados de una prueba de hipótesis estadística, asumiendo que la hipótesis nula es correcta. El valor p se utiliza como alternativa a los puntos de rechazo para proporcionar el nivel mínimo de significación en el que se rechazaría la hipótesis nula. Un valor p más pequeño significa que hay pruebas más sólidas a favor de la hipótesis alternativa.
Conclusiones clave
- Un valor p es una medida de la probabilidad de que una diferencia observada pueda ser solo por azar.
- Cuanto menor sea el valor p, mayor será la significación estadística de la diferencia observada.
- Se puede usar un valor P como alternativa a los niveles de confianza preseleccionados o además para probar hipótesis.
¿Cómo se calcula el valor P?
Los valores p generalmente se obtienen utilizando tablas de valores p u hojas de cálculo / software estadístico. Estos cálculos se basan en la distribución de probabilidad de aceptación o reconocimiento de la estadística específica que se está probando. Los valores p se calculan a partir de la desviación entre el valor observado y un valor de referencia seleccionado, dada la distribución de probabilidad del estadístico, y hay una mayor diferencia entre los dos valores correspondientes a un valor p más bajo.
Matemáticamente, el valor p se calcula utilizando el cálculo central del área debajo de la curva de distribución de probabilidad para todos los valores estadísticos al menos tan lejos del valor de referencia como el valor observado, en relación con el área total debajo de la curva de distribución de probabilidad. . En resumen, cuanto mayor es la diferencia entre dos valores observados, menos probable es que la diferencia se deba a una simple probabilidad aleatoria, y esto se indica mediante un valor p más bajo.
Enfoque del valor p para la prueba de hipótesis
El enfoque del valor p para la prueba de hipótesis utiliza la probabilidad calculada para determinar si hay evidencia para refutar la hipótesis nula. La hipótesis nula, también conocida como especulación, es la afirmación inicial sobre una población (o proceso de generación de datos). La hipótesis alternativa establece si el parámetro poblacional difiere del valor de los parámetros poblacionales mencionados en el dictamen.
En la práctica, el nivel de significancia se establece de antemano para determinar qué tan pequeño debe ser el valor p para rechazar la hipótesis nula. Debido a que diferentes investigadores usan diferentes niveles de significancia al examinar una pregunta, puede ser difícil para un lector comparar los resultados de dos pruebas diferentes. Los valores p proporcionan una solución a este problema.
Por ejemplo, un estudio que comparó los resultados de dos activos separados que usaron los mismos datos pero diferentes niveles de significancia probablemente fue realizado por diferentes investigadores. Los investigadores pueden llegar a conclusiones contradictorias sobre si los activos difieren. Si un investigador usó un nivel de confianza del 90% y el otro requirió un nivel de confianza del 95% para rechazar la hipótesis nula y el valor p de la diferencia observada entre los dos retornos fue 0.08 (correspondiente a un nivel de confianza del 92%), entonces el el primer investigador encontraría que los dos activos tienen una diferencia estadísticamente significativa y el segundo no encontraría ninguna diferencia estadísticamente significativa entre los resultados.
Para evitar este problema, los investigadores podrían informar el valor p de la prueba de hipótesis y permitir que el lector interprete la significancia estadística por sí mismo. Esto se denomina enfoque de valor p para la prueba de hipótesis. El valor p podría ser anotado por un observador independiente, y se puede decidir por sí mismo si esto representa una diferencia estadísticamente significativa.
Un ejemplo del mundo real de valor p
Suponga que un inversor afirma que el rendimiento de su cartera de inversiones es igual al rendimiento del índice 500 de Standard & Poor’s (S&P). Para determinar esto, el inversor realiza una prueba de dos colas. La hipótesis nula establece que los rendimientos de la cartera son iguales a los rendimientos del S&P 500 durante un período específico, y la hipótesis alternativa establece que los rendimientos de la cartera no son rendimientos del S&P 500. Los rendimientos de la cartera son menores o mayores que los rendimientos del S&P 500)
Una prueba de hipótesis de valor P no necesariamente utiliza un nivel de confianza preseleccionado en el que el inversor debe restablecer la hipótesis nula de que los rendimientos son equivalentes. En cambio, proporciona una medida de la cantidad de evidencia para refutar la hipótesis nula. Cuanto menor sea el valor p, mayor será la evidencia en contra de la hipótesis nula. Por tanto, si el inversor encuentra que el valor p es 0,001, existe una fuerte evidencia en contra de la hipótesis nula, y el inversor puede concluir con seguridad que los rendimientos de la cartera no son iguales a los rendimientos del S&P 500.
Si bien esto no proporciona un umbral preciso sobre cuándo el inversor debe aceptar o rechazar la hipótesis nula, tiene otra ventaja muy práctica. La prueba de hipótesis de valor P proporciona una forma directa de comparar la confianza relativa que el inversor puede tener al elegir entre diferentes tipos de inversiones o carteras, en relación con un índice de referencia como el S&P 500.
Por ejemplo, para dos carteras, A y B, cuyo rendimiento difiere del S&P 500 con valores p de 0,10 y 0,01 respectivamente, el inversor puede estar mucho más seguro de que la cartera B, que tiene un valor de la misma, tiene una menor p, consistentemente diferente. resultados.