Hace unos días, el Dane anunció que la tasa de pobreza monetaria en 2021 fue 39,3%. Esta cifra se presentó con una explicación detallada de los métodos de cálculo de las líneas de pobreza monetaria y de los ajustes que se hicieron a los datos de la Gran Encuesta Integrada de Hogares (GEIH) para captar lo mejor posible las transferencias que recibieron las familias a través de los distintos programas de subsidios monetarios del gobierno nacional. Un encomiable trabajo, sin duda alguna.
La publicación de la nueva cifra de pobreza del DANE revive una importante discusión que hemos sostenido desde hace un año acerca de cuál de las siguientes interpretaciones de la tasa de pobreza es la correcta:
- 39,3% de la población fueron pobres durante 2021 (es decir, que en el año tuvieron en promedio ingresos mensuales per cápita de su hogar inferiores a la línea de pobreza correspondiente a su lugar de residencia)
- 39,3% es el porcentaje de la población que algún mes fueron pobres (es decir, que algún mes del año tuvieron ingresos per cápita de su hogar inferiores a la línea de pobreza correspondiente a su lugar de residencia)
- 39,3% es el promedio en los 12 meses del año del porcentaje de la población que fueron pobres mensuales (es decir que, en el mes de la encuesta, tuvieron ingresos per cápita de su hogar inferiores a la línea de pobreza correspondiente a su lugar de residencia)
- Todas las anteriores
- Ninguna de las anteriores.
De conversaciones que hemos tenido en el pasado con muchos colegas detectamos una creencia generalizada en que la respuesta correcta es la 4, y que diferenciar entre las opciones 1 a 3 equivale a no entender que las muestras de la GEIH son construidas en forma aleatoria rigurosa (más exactamente, que las muestras mensuales son aleatorias idénticamente distribuidas e independientes por hogar, iid). Nos parece que quienes eso creen están en un error pues, aunque las encuestas estén rigurosamente diseñadas, las opciones 1 a 3 sí son distintas, ya que los hogares pueden cambiar de estado, es decir, ser pobres por ingresos unos meses del año y otros no.
A través de diferentes simulaciones de Montecarlo y estimaciones con datos oficiales de la GEIH, en el documento de trabajo titulado “Annualizing labor market, inequality, and poverty indicators” demostramos que la respuesta correcta es la 3, no la 4. La definición matemática de cada uno de los indicadores en las tres interpretaciones es distinta; las tres son iguales solamente cuando los hogares no cambian de estado a lo largo del año (es decir, que los hogares que son pobres un mes lo son el resto de los meses del año).
La interpretación 1 sería la tasa de pobreza anual, que consideramos más adecuada que el promedio de las tasas de pobreza mensuales, que es el cálculo que hace actualmente el Dane, y que corresponde a la interpretación 3. Y la interpretación 2 sería la tasa de incidencia anual de las pobrezas mensuales, es decir qué tanta gente a lo largo del año cayó por lo menos un mes en la pobreza. Esta tasa de incidencia es necesariamente mayor que el promedio de las tasas de pobreza mensuales, a menos que todos los meses los hogares pobres sean exactamente los mismos. En esa línea, el documento mencionado encontró que la tasa de pobreza anual en Colombia en 2019 fue 3 puntos porcentuales menor al promedio de las tasas de pobreza mensuales, mientras que la incidencia anual de las pobrezas mensuales fue 4 puntos porcentuales mayor.
Es importante conocer la tasa de pobreza anual porque puede ilustrarnos sobre la persistencia de la pobreza y ayudarnos a analizar qué tan suficientes y tan bien asignadas están las transferencias. Si quienes caen en la pobreza un mes tienen muy poca probabilidad de caer en la pobreza en el año completo es evidente que necesitan menos apoyo (o quizás no necesiten ninguno) que quienes están todos los meses en esa condición, y por lo tanto no logran sobrepasar la línea de pobreza anual (entendida como 12 veces la línea de pobreza mensual).
A su vez, es importante conocer la tasa de incidencia anual de las pobrezas mensuales porque nos dice cuánta gente que es vulnerable económicamente cae efectivamente en la pobreza algún mes del año. Si esa población es muy grande, podríamos estar montados en un polvorín de descontento. Es muy posible que esta incidencia de la pobreza haya sido muy alta en 2021 porque hubo por los menos tres shocks brutales que afectaron más a unos hogares que a otros: las cuarentenas, el estallido social y las alzas de precios de los alimentos. Es totalmente factible que en algunas ciudades haya aumentado la tasa de incidencia anual, aunque haya bajado la ‘tasa de pobreza’ de la que habla el Dane.
Para poder producir estos otros indicadores de la pobreza hay que usar mejor los datos mensuales de la GEIH y de las transferencias; también hay que calcular líneas de pobreza mensuales. El método actual oscurece los patrones mensuales, entre otras cosas porque sólo se calculan líneas de pobreza semestral. Además, mientras que algunos ingresos y transferencias sí son datos mensuales, otros se ‘mensualizan’; por consiguiente lo que se obtiene estrictamente hablando tampoco son pobrezas mensuales.
Consideramos que el DANE está en la capacidad de producir datos mensuales o promedios móviles de tres meses de las tasas de pobreza (mensual), junto con las respectivas tasas de severidad de la pobreza (es decir, qué tan pobres son los pobres). Por supuesto, estas tasas se podrían luego promediar en el año, como se hace con otros indicadores mensuales (como la tasa de desempleo o de informalidad). Lógicamente, esto implica esfuerzos adicionales, no solo para calcular las líneas de pobreza, sino además para realizar mensual o trimestralmente los respectivos procedimientos de imputación de valores faltantes, detección de falsos ceros, y corrección de valores extremos.
Sin embargo, el Dane podría ir incluso un paso más adelante, calculando cada año las tasas de pobreza anual (la interpretación 1) y las tasas de incidencia anual de la pobreza mensual (la interpretación 2). Para esto necesitaría estimar el ingreso anual de los hogares encuestados en un mes cualquiera en la GEIH (ya que solo para algunos hogares con condiciones económicas muy estables tienen los mismos ingresos los 12 meses del año).
En el documento de trabajo mencionado sugerimos diferentes alternativas para estimar la tasa de pobreza anual con los datos mensuales de la GEIH. Dado que los ocupados reportan el número de meses que trabajan al año, es posible estimar, con algunos supuestos sencillos, su posible ingreso anual. Sin embargo, la encuesta no indaga por el número de meses trabajados por los individuos que se encontraban inactivos o desempleados en el mes que fueron encuestados. En estos casos la estimación se vuelve más desafiante, y requiere hacer uso de algún algoritmo de imputación de datos. En ese documento sugerimos una serie de preguntas muy sencillas que podrían ser incluidas en la encuesta y facilitarían enormemente la estimación de la tasa de pobreza anual.
Ningún país del que tengamos conocimiento calcula la tasa de pobreza anual, pero esto no es excusa para que Colombia no pueda ser el primero. Podríamos ponernos a la vanguardia en esta dimensión aprovechando la calidad técnica de nuestro Departamento de Estadística, y la riqueza y periodicidad de las encuestas de hogares.