¿Qué es un percentil ejemplo?

Signo de percentil

Por ejemplo, si tu puntuación en un examen está en el percentil 95, una interpretación común es que sólo el 5% de las puntuaciones fueron superiores a la tuya. La mediana es el percentil 50; se suele suponer que el 50% de los valores de un conjunto de datos están por encima de la mediana.

Pero hay que tener cierto cuidado para dar a los percentiles una definición precisa que funcione para todos los rangos y todas las listas. Para ver por qué, consideremos un ejemplo extremo en el que todos los alumnos de una clase obtienen una puntuación de 75 en un examen. Entonces, 75 es un candidato natural para la mediana, pero no es cierto que el 50% de las puntuaciones sean superiores a 75. Además, 75 es un candidato igualmente natural para el percentil 95 o el 25 o cualquier otro percentil. Hay que tener en cuenta los empates -es decir, los valores de datos iguales- al definir los percentiles.

También hay que tener cuidado con la altura exacta de la lista cuando el índice correspondiente no está claro. Por ejemplo, ¿cuál debe ser el percentil 87 de una colección de 10 valores? ¿El octavo valor de la colección ordenada, o el noveno, o algún punto intermedio?

Algoritmo del percentil

Se puede demostrar, como ilustran los autores de nuestro libro de texto, que las estadísticas de orden \(Y_1<Y_2<\cdots<Y_n\) dividen el soporte de \(X\) en \(n+1\) partes y, por lo tanto, crean \(n+1\) áreas bajo \(f(x)\ y por encima del eje \(x\), con cada una de las áreas \(n+1\) igual, en promedio, \( \dfrac{1}{n+1} \):

Ahora, si recordamos que el percentil (100p) \(\pi_p\) es tal que el área bajo \(f(x)\) a la izquierda de \(\pi_p\) es \(p\), entonces el gráfico anterior sugiere que debemos dejar \(Y_r\) servir como un estimador de \(\pi_p\), donde \( p = \dfrac{r}{n+1}\):

El percentil (100p) de la muestra se define como \(Y_r\), el estadístico de orden \(r^{th}), donde \(r=(n+1)p\). Para los casos en los que \((n+1)p\) no es un número entero, utilizamos una media ponderada de las dos estadísticas de orden adyacentes \(Y_r\) y \(Y_{r+1}\).

Un informe del Instituto de Transporte de Texas sobre las estrategias de reducción de la congestión puso de manifiesto el tiempo de viaje extra (debido a la congestión del tráfico) para los desplazamientos al trabajo por viajero al año en horas para 13 grandes zonas urbanas diferentes de Estados Unidos:

Calculadora de percentiles

Este documento describe el percentil como una medida robusta de la tendencia central y la dispersión dentro de una distribución de valores. Se dan ejemplos de su aplicación en el contexto de los resúmenes de datos del suelo.

Dentro de un conjunto de datos, el n-ésimo percentil describe el valor por debajo del cual cae el n% de los datos, una vez ordenados. Por ejemplo, dentro de la secuencia de números enteros que va de 0 a 100, 50 es el percentil 50 o la mediana, 10 es el percentil 10 y 90 es el percentil 90.

Consideremos un histograma derivado de los valores de las reservas de carbono que representan varias regiones de Estados Unidos. Dentro de esta distribución, una reserva de carbono de 85 toneladas/ha está asociada al 16º percentil. En otras palabras, el 16% de los valores de reservas de carbono recogidos son inferiores a 85 toneladas/ha.

La estimación de los percentiles se basa en la clasificación de los datos originales. La interpolación entre los valores observados es necesaria cuando el tamaño de la muestra es pequeño (generalmente menos de 10 observaciones). Consideremos los valores (1,3,5,6,7,9,9,10). La estimación de los percentiles 10, 50 y 90 da como resultado 2, 7 y 10 respectivamente. Dado que no solemos estar interesados en los percentiles estimados al pie de la letra, las estimaciones interpoladas se aproximan lo suficiente. El estimador Harrel-Davis es un método robusto para derivar los percentiles en presencia de empates y cuando el tamaño de la muestra es pequeño.

Cómo funciona el percentil

Para una muestra, se puede encontrar cualquier cuantil ordenando la muestra. El valor medio de la muestra ordenada (cuantil medio, percentil 50) se conoce como mediana. Los límites son los valores mínimo y máximo. Cualquier otra ubicación entre estos puntos puede describirse en términos de centiles/percentiles.

Los centiles/percentiles son descripciones de cuantiles relativos a 100; así, el percentil 75 (cuartil superior) es el 75% o las tres cuartas partes de una lista ascendente de valores ordenados de una muestra. El percentil 25 (cuartil inferior) es una cuarta parte del camino hacia arriba en este orden de clasificación.

El rango percentil es la proporción de valores de una distribución a la que un valor concreto es mayor o igual. Por ejemplo, si un alumno es más alto o tan alto como el 79% de sus compañeros de clase, el rango percentil de su altura es 79, es decir, está en el percentil 79 de las alturas de su clase.

Método 1: Este es un método común que emula la inversa de la distribución de probabilidad empírica con el promedio donde hay discontinuidades (Hyndman y Fan, 1996), Este es también el método universal por defecto en Stata