FÓRMULA

DEDUCCIÓN DEL COEFICIENTE GINIEsta información es tomada del libro “MÉTODOS CUANTITATIVOS PARA ECONOMISTAS” de Gastón Acosta C., Quito-Ecuador

1.0 DEFINICIÓN
Para definir de manera clara el índice de Gini es necesario recordar la figura presentada al describir la Curva de Lorenz. Recuérdese que el eje vertical corresponde al porcentaje de ingresos y por tanto su longitud es 1. Así mismo el eje horizontal corresponde al porcentaje de población y su longitud también es 1. En consecuencia se trata de un cuadrado de lado 1 cuya área vale 1 y la mitad de este cuadrado cruzado por la diagonal tiene como área el valor 0.5. En la figura que sigue se aprecia la curva de Lorenz, la diagonal principal y un área que corresponde al Índice o Coeficiente de Gini, marcada con la letra “A”. También puede apreciarse el área bajo la Curva de Lorenz, marcada con la letra “B”. El origen tiene como coordenadas (0,0) y el extremo de la diagonal tiene como coordenadas el punto (1,1). Es decir que a diferencia de los coeficientes o índices de Pareto y de Lorenz, que son funciones, el de Gini es una relación de áreas definido, de acuerdo al gráfico del modo siguiente:

Tomando en cuenta a todo el cuadrado se puede ver que hay un área que es de 1, un área bajo la curva de Lorenz y una correspondientes al área Gini. Este análisis equivale a considerar la mitad del cuadrado, es decir el triángulo inferior, como en la figura que consta a la izquierda, en la cual se aprecia la línea de equidistribución o diagonal o línea de 45°, la curva de Lorenz y dos áreas: el área A correspondiente al área Gini y el área B que es el área bajo la curva de Lorenz. Con estos elementos definimos el coeficiente Gini de la siguiente manera.

El coeficiente Gini usualmente se define matemáticamente a base de la curva de Lorenz. Este coeficiente se mide o calcula mediantge la relación entre el área que se forma entre la línea de equidistribución y la curva de Lorenz, marcada como A en el gráfico de Wikipedia, y el área total que se encuentra debajo de la línea de equidistribución, esto es:






El Coeficiente Gini puede tomar los valores extremos de 0 y 1. El 0 indica completa igualdad y el 1 extrema desigualdad, al punto que todo el ingreso se lleva una sola persona. Este coeficiente puede ser expresado en porcentaje. El Coeficiente Gini no solamente puede ser utilizado para medir la desigualdad de los ingresos de una colectividad sino también en otros campos del saber humano como así lo han demostrado sus aplicaciones en química, en biodiversidad, en la propia estadística, etc.

1.0 PROCEDIMIENTO MATEMATICO

Si el área entre la línea de perfecta igualdad y la Curva de Lorenz es A, como consta en el gráfico, y el área bajo la Curva de Lorenz es B, el Coeficiente Gini es:




Puesto que A+B = 0.5 ya que es la mitad del cuadrado de área 1, se tiene:





Debido a la naturaleza misma del cuadrado.

En cambio, si la Curva de Lorenz es representada por la función:

Y = F(X)

El valor del área B puede ser encontrada recurriendo a la integración de una función, así:





Sin referencia directa a la Curva de Lorenz. Para aplicar esta última forma es necesario conocer la función F(X), ya sea por regresión o por otros métodos, uno de los cuales se desarrolla a continuación.

1.2 MÉTODO DE LA SUMA DE RECTÁNGULOS

Una integral de la forma que estamos necesitando corresponde al área bajo la curva de la función F(X), entre los puntos 0 y 1. Gráficamente esto corresponde a la figura que consta a continuación.


En esta figura se puede apreciar el área A limitada por la curva Y = F(X) mayor que 0, el eje x y las ordenadas x = a y x = b con b mayor que a.

Si se divide el intervalo a__b, en partes iguales de longitud ∆x cada una, y en cada punto de división se traza la ordenada, el área queda repartida en n rectángulos, como muestra la figura. Como se desconocen las áreas correspondiestes bajo la curva , se trata de expresar aproximadamente el área de cada rectángulo cuya superficie si se puede calcular . En la segunda figura se muestra esta aproximación, en forma sombreada. Para aclarar la exposición, en el segundo gráfico se ha procedido a ampliar la parte sombreada.

Es evidente el rectángulo i-ésimo Pi a partir del punto a. Sea Xi la abscisa del punto medio de su base y Yi la ordenada del punto Pi. De igual manera podemos pasar una paralela al eje X precisamente por el punto Pi. Hecho esto tenemos el rectángulo RSMN. Este rectángulo tiene una superficie igual a Yi∆X, que es aproximadamente igual al área que cubre la curva en la parte sombreada. Hay un área en exceso (la que se encuentra encima de la curva) y un área por defecto (la parte no sombreada por debajo de la curva). Se considera que si los rectángulos son lo suficientemente pequeños estas dos áreas se compensan de modo que el área del cuadrado corresponde, aproximadamente, al área que cubre la curva en la parte sombreada. Generalizando el problema y tomando en cuenta que hay n rectángulos. Hay que observar que se puede tomar la base del rectángulo como aquella que se inicia en cada uno de los puntos de las (eje X) y la altura como la correspondiente al punto de la abscisa. Se establece la siguiente igualdad, que equivale al área bajo la curva:
Si se aumenta indefinidamente el número de rectángulos de modo que ∆x→0, la suma de las áreas de los rectángulos se irá aproximando más y más a la verdadera área bajo la curva, de modo que se puede plantear la expresión que sigue como una expresión aproximada del área bajo una curva. A partir de ésta expresión se deriva la fórmula para calcular el Coeficiente de Gini, en la forma que se desarrolla a continuación.

Como se ve hay n Cuadrados en los cuales la altura de cada uno es Yi y la base es ∆X = Xi – Xi-1, de modo que, por ejemplo, el primer rectángulo tiene como base ∆X = X2 – X1 y, así mismo, la base del último rectángulo es ∆X = Xn – Xn-1. Aplicando estos criterios a todos los rectángulos y luego sumándolos, se tiene:
Esa es la formula básica que forma parte del coeficiente de Gini, de la siguiente manera:
Que es la formula básica para calcular el índice o coeficiente de Gini. De esta expresión es posible deducir varias fórmulas que permiten el cálculo de dicho índice. Una de las fórmulas más utilizadas es la que se deduce de la fórmula básica, de la siguiente manera:

Aplicación

Ahora se aplica la suma aproximada, es decir la deducida por medio de los rectángulos Para ello considérese la figura que sigue a continuación.

Considérese la función Y1 = X^2 y 10 rectángulos, ente los puntos 0.00 y 1.00, cuyas bases se encuentran al principio de cada uno de los 10 puntos del eje X y que tienen una longitud común igual a 0.1 y cuya altura está definida el valor de la ordenada que pasa por el punto medio de la base. Para ejemplificar sea cualquier rectángulo de las figura 12 y 13, uno de los rectángulos, por ejemplo el primero de la figura 11 tiene como base X2 – X1 = ∆X = 0.1 y el valor de la altura de dicho rectángulo es el valor de la ordenada que pasa por el punto medio de la base, esto es (0,00 +0,01)/2=0.005, en cuyo caso la ordenada es, reemplazando el valor de 0.005 en la función dada, de una altura de 0.000025, en cuyo caso el área vale 0.1*0.000025=0.0000025, y así sucesivamente hasta completar los 10 puntos y calcular el área. A continuación consta un cuadro con estos requerimientos.

A fin de realizar comparaciones entre el verdadero valor del área y sus aproximaciones debemos considerar que la función existe en el intervalo 0 ≤ x ≤ 1. El área bajo la curva de esta función, aplicando el concepto de integral definida es: Que es la respuesta correcta.

Respecto del verdadero Valor del coeficiente Gini, el valor aproximado obtenido tiene un error por defecto del 19,7%, error un tanto grande que es necesario corregir.


1.3 MÉTODO DE LA SUMA DE TRAPECIOS

Otro de los métodos para calcular en forma aproximada el área bajo la curva es el denominado Regla del Trapecio. Consiste en la aproximación del área por trapecios, en lugar de rectángulos, ya analizado. Para ello toma la misma función dada de la cual se conoce el área bajo la curva. .

Ahora se aplica la suma aproximada, es decir la que se deduce por medio de trapecios. Para ello considérese la figura que sigue a continuación.

Hay 10 trapecios cuya base se encuentra al principio de cada uno de los 10 puntos del eje X que tiene una longitud igual a 0.1 y cuya altura está definida por los extremos del intervalo. Para ejemplificar sea el trapecio de la figura que aparece a continuación, uno de los trapecios del ejemplo. La base es X2 – X1 = ∆X = 0.1 y el valor de la altura de dicho trapecio es (Y1 + Y2)/2, de modo que el área del trapecio es A = ∆X(Y1 + Y2)/2 en dicho punto.

En este caso el área aproximada bajo la curva Y = X^2, es:

A = ∆X[(Y0+Y1)/2+(Y1+Y2)/2+(Y3+Y4)/2+(Y5+Y6)/2+(Y7+Y8)/2+(Y6+Y9)/2+ (Y9+Y10)/2]

A = 0.1[(0,00+0,01)/2+(0,01+0,04)/2+(0,04+0,09)/2+(0,09+0,16)/2+(0,16+0,25)/2+(0,25+0,36) +(0,36+0,49)+(0,49+0,64)+ (0,64+0,81)+ (0,81+1,00)/2]/2

A = 0,1*(0,005+0,025+0.065+0,125+0,205+0,305+0,425+0,565+0,725+0,905)

A = 0,1(3,35) = 0.335

Este resultado frente al valor verdadero (0.333), significa un error de estimación de alrededor del 0.6 %, por exceso, que es bastante bajo y se lo puede aceptar.

Se puede afirmar, entonces que un buen procedimiento para calcular el área aproximada bajo una curva consiste en la aplicación de la Regla de los trapecios. Generalizando para todo el intervalo y recordando que la base es ∆X = Xi+1 - Xi, se tiene:

Por tanto se toma la expresión de la que proviene para calcular el Coeficiente de Gini, con la ventaja de que se produce una simplificación de la fórmula, lo cual facilita los cálculos, tal como se ve a continuación. Solo recordemos que: el incremento ∆X y la semisuma de las ordenadas contiguas desaparecen

Para terminar hay que poner los límites de la sumatoria. De acuerdo con lo que anota la fórmula que se encuentra dentro de la sumatoria las variables X, Y, se consideran una sola vez en cada punto en el recorrido del intervalo y cuando ambas variables llegan al punto (n-1), toman en cuenta el siguiente punto que al mismo tiempo es el último punto de ambas series. Por tanto los límites de la sumatoria son 1 y (n-1), como se muestra a continuación y que constituye la fórmula básica de Gini.

Ésta es la fórmula básica para calcular el Coeficiente de Gini. Para que tenga plena validez es necesario incorporar el concepto de valor absoluto tal como aparece. Se la conoce como Fórmula de Brown Existen muchas derivaciones de esta fórmula unas más sencillas que otras, Verificamos la bondad de los resultados utilizando nuestra función y nuestro ejemplo numérico. Para ello se establecen las siguientes indicaciones.

Cuando se trata de variables y de su distribucióncomo equivalentes de dos variables, se suele recurrir a la estadísticadescriptiva para incorporar el concepto de masa de una variable. Un ejemplo es la mejor aclaración de este concepto como es el caso de una distribución de ingresos, en ella bien se puede disponer de la variable ingreso y del número de personas (c/u de las cuales tiene el ingreso indicado) o puede ser también una variable de personas cada una de las cuales tiene el ingreso individual. Cualquiera que sea el caso si multiplicamos las dos variables (o como dicen muchos estadísticos españoles multiplicando la variable por su frecuencia) se establece el ingreso total de un grupo de personas. Este ingreso total, es decir la multiplicación de la variable por su frecuencia o la multiplicación de las dos variables, es lo que se conoce como MASA, en este caso Masa Salarial. Por lo general con las distintas fórmulas para estimar el coeficiente de Ginise puede calcular tanto el coeficiente individual como el total. Algunas calculadores automáticos disponibles en el Internet calculan solo el coeficiente global, como es el caso de un calculador “on line calculator: inequality”, cuya dirección electrónica es www.poorcity.richcity.org/calculator/.

Para el caso de la función Y1=X2, es menester obtener la función Y para establecer la estimación correcta del coeficiente de Gini. Ello se consigue multiplicando la variablex por la Función, tal como lo muestran los cálculos que constan en el cuadro que sigue a continuación, en el cual yi´ es el valor original de la función y yi es el valor xi*yi´ (yi = xi * yi´).

El cuadro con estas indicaciones es el siguiente:

Entonces:

G = 1 – 0.6727 = 0.3273

Este coeficiente de Gini, establece como sabemos la concentración del ingreso. En el caso del ejemplo diremos que como el resultado es la tercera parte de uno, la concentración tiende a una igualación. Por otro lado al utilizar la fórmula de Gini para obtener su coeficiente se determina que el resultado aproximado apenas difiere en 1.9 %.

La utilización del coeficiente de Ginino se aplica solamente en la distribuciónde ingresos sino en cualquier clase de distribución. Esto significa que el coeficiente Gini puede ser utilizado no solamente en economía sino en cualquier otra disciplina que requiera su uso como en química, medicina, geografía, etc. Se sugiere que al usar este coeficiente en áreas que no son estadísticas o económicas, se debe tener mucho cuidado con el significado de las variables, en este sentido se aconseja que se identifique en primer lugar la variablesobre la que se busca la concentración, en el presente caso se trata de la y y no de la x; en el caso de los ingresos veremos que se trata de los ingresos y no de las personas.

Para aplicar la fórmula de Gini a una tabla de distribución ésta debe contener la variable básica (Xi), cuyo intervalo de existencia puede estar dividido en partes iguales ya sean quintiles, deciles o cualquier otra clase de esta naturaleza estadística. Puede estar también en valores absolutos, siempre.

Aplicación a un caso económico

Para aplicar a un caso concreto, se puede disponer de la distribuciónde los ingresos de Quito investigada por el INEC en el año 2003 y publicadas tanto en medios impresos como electrónicos bajo el nombre de ENIGHU. Estas distribuciones están presentadas por quintiles de ingreso, es decir que el recorrido del ingreso total fue dividido en 5 partes, de modo que al quintil 1 y a todos los demás quintiles les corresponde el 20% del ingreso y el 20 % de la población.

Para facilidad de los procedimientos sea:

x = POBLACIÓN
y = INGRESO

Puede advertirse que las variables están especificadas en minúsculas, esta advertencia es importante en lo sucesivo.

Ahora procedemos a obtener las frecuencias relativas de las dos variables y el resultado se presenta en el cuadro a continuación:

Las variables xi/x. yi/y, son las variacionesrelativas o cuando se desee porcentuales, respecto a la suma total de cada una, de modo que cualquier valor de la población o del ingreso dados en el cuadro anterior se divide para la suma total de la respectiva variableque también aparece como TOTAL en el cuadro anterior.

Respecto a los resultados de este cuadro hay que hacer dos anotaciones. La primera es que las cifras obtenidas son las frecuencias relativas, o (si se multiplican por 100 las cifras) los porcentajes que corresponden a cada quintil. De modo que para el tercer quintil el ingreso que le corresponde al 19.9% de la población es 17.4%. La segunda anotación es que la suma de los parciales no coincide con el total debido a las aproximaciones, estos cálculos se realizaron en Excel.

Hasta este momento ya es posible el análisis de la distribuciónde ingresos. Se aprecia en el último cuadro que mientras la participación porcentual de la población a medida que se recorre los quintiles va disminuyendo, la participación porcentual de esta población en el ingreso, en cambio va en aumento, hasta que, en el último quintil el 14.4% de la población de Quito se asegura un ingreso del 36.5% por ciento del total. Cabe decir que cada persona del quintil 5 recibe un ingreso equivalente a 2.5 unidades en tanto que una persona del quintil 1 recibe solamente el equivalente de 0,74, lo que significa que los del quintil 5 perciben, en promedio casi tres veces y media más de lo que perciben los del quintil 1.

Prosiguiendo con el cálculo se establece los valores acumulados de cada variableya que las escalas tanto de la Curva de Lorenzcomo del coeficiente Giniestán establecidos es escalas acumuladas relativas o porcentuales. Con la siguiente denominación:

X (Mayúscula): Valor acumulado de la variablerelativa xi/x
Y (Mayúscula): Valor acumulado de la variablerelativa yi/y

Siendo xi, yi, cualquiera de los valores de las variables originales y siendo “x”, “y” la suma de las respectivas variables.

El cuadro de cálculo se completa con los siguientes resultados:


La fórmula parta el cálculo del coeficiente de Gini, como se recordará es:
Al aplicar la fórmula hay que tener presente que el área que se busca parte del punto de coordenadas (0,0), decir del origen; sin embargo el punto (0,0) no se utiliza, es decir no está presente en los cálculos. Para superar este situación las primeras celdas de la tercera y cuarta columna del cuadro anterior corresponden a las primeras celdas de la primera y segunda columnas, respectivamente, para luego si aplicar la fórmula en forma rigurosa.

Aplicando la fórmula del Coeficiente de Gini, se tiene:

G = 1 – 0.6054 = 0.3946, tal como aparece en el cuadro anterior

Índice que equivale a un poco más de la tercera parte de 1 o sea que la distribución está más cerca de una distribución equitativa que de una injusta.