En este momento estás viendo Medios de comunicación Winsorized

¿Qué es Winsorized Media?

El promedio Winsorizado es un método de promediar que reemplaza los valores más pequeños y más grandes con las observaciones más cercanas. Esto se hace para limitar el efecto de los contornos anormales o valores reales, o contornos, en el cálculo.

Después de reemplazar los valores, se usa la fórmula de la media aritmética para calcular la media ganadora.

traer llave traer

  • El promedio ganador es un método de promediar que incluye las observaciones más cercanas para reemplazar los valores más pequeños y más grandes en un conjunto de datos.
  • Mitiga los efectos del flujo de salida reemplazándolos por valores menos extremos.
  • El promedio ganador no es el mismo que el promedio de recorte, que implica eliminar puntos de datos en lugar de reemplazarlos, aunque los resultados de ambos suelen ser cercanos.

Fórmula para el medio Winsorizado













Medios de comunicación Winsorized

=





X

norte





X


norte

+

1




+



X


norte

+

2






X

norte



NORTE.
















donde:




















norte


=









Número de detalles más grandes y más pequeños















puntos para reemplazar la observación















más cercano a ellos




















NORTE.


=

Número total de puntos de datos






begin {align} & text {Promedio Winsorized} = frac {x_ {n} dots x_ {n + 1} + x_ {n + 2} dots x_ {n}} {N} & textbf {donde:} \ & begin {alineado} n = & text {Datos máximos y más pequeños} \ & text {puntos para reemplazar la observación} \ & text {más cercana}} final {alineado} \ & N = text {Número total de puntos de datos} end {alineado}


Medios de comunicación Winsorized = NORTE.XnorteXnorte+1 + Xnorte+2Xnortedonde:norte = Número de detalles más grandes y más pequeñospuntos para reemplazar la observaciónmás cercano a ellosNORTE. = Número total de puntos de datos

Los métodos Winsorizados se expresan de dos formas. A «knorte«promedio ganador» se refiere al reemplazo de las observaciones más pequeñas y más grandes «k», donde «k» es un número entero.

El promedio ganador se logra reemplazando los puntos de datos más pequeños y más grandes, luego resumiendo todos los puntos de datos y dividiendo la suma por el número total de puntos de datos.

¿Qué le dicen los medios de comunicación Winsorized?

El promedio ganador no es tan sensible como los migrantes porque podría reemplazarlos con valores menores. Es decir, es menos susceptible a los migrantes frente al medio aritmético. Sin embargo, si se distribuyen colas gruesas, el efecto de eliminar los valores más altos y más bajos de la distribución tendrá poco efecto debido al alto nivel de variabilidad en las cifras de distribución.

Una de las principales desventajas de los métodos ganadores es que, naturalmente, introducen sesgos en el conjunto de datos. Al reducir el impacto de los esquemas, el análisis se modifica para un mejor análisis, pero también se elimina la información sobre los datos subyacentes.

Ejemplo de cómo utilizar Winsorized Media

Calculemos el promedio ganador para el siguiente conjunto de datos: 1, 5, 7, 8, 9, 10, 34. En este ejemplo, asumimos que el promedio ganador está en el primer orden, en el que sumamos los valores más pequeños y más bajos. .más grande en lugar de los valores más pequeños y más grandes las observaciones más cercanas a ellos.

El conjunto de datos ahora se muestra de la siguiente manera: 5, 5, 7, 8, 9, 10, 10. Si toma una media aritmética del nuevo conjunto, se crea un promedio ganador de 7.7, o (5 + 5 + 7 + 8 + 9 + 10 + 10) dividido por 7. Tenga en cuenta que la media aritmética sería mayor – 10,6. El promedio ganador reduce efectivamente el impacto del valor 34 como esquema.

O piense en un promedio de ganancias del 20% que toma el 10% superior y el 10% inferior y los reemplaza con el siguiente valor más cercano. Ganaremos el siguiente conjunto de datos: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Ambos serán reemplazado por el siguiente valor más cercano – 20 puntos de datos mínimos – 20% de los 20 puntos de datos. Entonces, el nuevo conjunto de datos es el siguiente: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. El ganador el promedio es 33,9, o el total de datos (678) dividido por el número total de puntos de datos (20).

Recorte medio Winsorizado frente al recorte medio

El promedio ganador implica la modificación de puntos de datos y el promedio de recorte implica la eliminación de puntos de datos. El promedio ganador y el promedio de recorte suelen ser cercanos o iguales a su valor a veces.