Que representa la mediana

Que representa la mediana

Ver más

Fui profesor de matemáticas y estadística en el instituto durante 14 años. Y mi curso de estadística siempre comenzaba con la visualización de la distribución de una variable mediante un simple cuadro o gráfico. De una en una, nos centrábamos en crear, interpretar y describir los gráficos adecuados. En el caso de las variables cuantitativas, utilizábamos histogramas o gráficos de puntos para discutir las características físicas específicas de la distribución. ¿Por qué? La visualización de datos ayuda a los estudiantes a sacar conclusiones sobre una población utilizando datos de muestra que las estadísticas de resumen por sí solas.
Este post pretende repasar los fundamentos de cómo se utilizan las medidas de tendencia central -media, mediana y moda- para medir lo que es típico. Específicamente, le mostraré cómo inspeccionar las distribuciones de las variables visualmente y diseccionar cómo se comportan la media, la mediana y la moda, además de las formas comunes en que se utilizan. En última instancia, puede ser difícil, imposible o engañoso describir un conjunto de datos utilizando un solo número; sin embargo, espero que este viaje de exploración de datos te ayude a entender cómo los diferentes tipos de datos pueden afectar a la forma en que describimos lo que es típico.

Calculadora de medianas

En teoría de grafos, una división de las matemáticas, un grafo mediano es un grafo no dirigido en el que cada tres vértices a, b y c tienen un único mediano: un vértice m(a,b,c) que pertenece a los caminos más cortos entre cada par de a, b y c. Todo árbol es un grafo mediano.
Todo árbol es un grafo de mediana[4] Para ver esto, observa que en un árbol, la unión de los tres caminos más cortos entre los pares de los tres vértices a, b y c es, o bien un camino en sí mismo, o bien un subárbol formado por tres caminos que se encuentran en un único nodo central de grado tres. Si la unión de los tres caminos es en sí misma un camino, la mediana m(a,b,c) es igual a uno de a, b o c, cualquiera de estos tres vértices que esté entre los otros dos del camino. Si el subárbol formado por la unión de los tres caminos no es un camino, la mediana de los tres vértices es el nodo central de grado tres del subárbol.
Otros ejemplos de grafos de mediana son los grafos de cuadrícula. En un grafo cuadriculado, las coordenadas de la mediana m(a,b,c) pueden hallarse como la mediana de las coordenadas de a, b y c. A la inversa, resulta que, en todo grafo de la mediana, se pueden etiquetar los vértices por puntos en un entramado de enteros de tal manera que las medianas pueden calcularse por coordenadas de esta forma[5].

Leer más  Calculo de area de un triangulo

Media

Una vez obtenidos los datos experimentales, es importante decidir cómo representarlos. Hay que resumirlos sin confundir a los lectores. La representación gráfica es más rápida de asimilar para la mayoría de las personas. Por otro lado, la descripción numérica suele ser más compacta y las cantidades pueden representarse con mayor precisión.
La desviación estándar es una forma de representar el grado de dispersión de los datos. Cuanto mayor sea la desviación estándar, más separados estarán los puntos de datos. A menudo encontrarás la desviación estándar abreviada como SD o s.
El error estándar de la media, por otro lado, es una forma fácil de representar la precisión de la media medida. Esto es probablemente lo que quiere hacer la mayor parte del tiempo, a menos que esté interesado en describir la amplitud de la dispersión. El error estándar se suele abreviar como SE, SEM o SE.
Ambos conceptos están interconectados. De hecho, la desviación estándar está en el numerador de las fórmulas para calcular el error estándar de la media. Pero este último se reduce aún más por el tamaño de la muestra N y, por tanto, es más pequeño que la desviación estándar.

Cómo encontrar la mediana

Esta es una simplificación engañosa común a muchos textos introductorios. Depende de lo que quieras averiguar (/lo que significa típico para tus necesidades particulares). Puede ser perfectamente razonable estar interesado en el comportamiento de la media con una distribución sesgada, y cuando la media no es exactamente lo que necesitas, ¡puede ser fácilmente que la mediana sea aún menos útil!
Como ejemplo, consideremos el tiempo que espero en los semáforos de una intersección concreta cuando voy al trabajo. Este tiempo de espera está bastante sesgado. Me interesa la espera media (por ejemplo, para calcular mi tiempo medio de viaje o el tiempo que pierdo en esa intersección en un año); en cambio, si me preocupa llegar tarde al trabajo, ni la media ni la mediana me sirven directamente; me interesa mucho más la posibilidad de que la espera supere, por ejemplo, los 10 minutos (en caso de tráfico intenso, a veces ocurre)
Si está interesado en un intervalo para la mediana de la población para una variante continua, se puede producir uno sin siquiera asumir una forma de distribución (una estimación no paramétrica/libre de distribución), basada en cuantiles de la muestra (o más precisamente, en estadísticas de orden).

Acerca del autor

Rebeca Sánchez

Rebeca Sánchez

Ver todos los artículos