La visibilidad estadística de la población LGBT en las encuestas de hogares

Por Andrés Ham (@ahamg), Angela Guarín (@AngelaGuarin) y Juanita Ruiz (@JuanitaRuizCon1)

La evidencia es fundamental para informar y guiar las políticas públicas. Con esta premisa, se ha invertido tiempo y recursos en crear sistemas de información en los países de América Latina y el Caribe mediante la institucionalización de las encuestas de hogares. Estas encuestas nos permiten monitorear los mercados laborales, la pobreza y desigualdad de ingresos y otros indicadores socioeconómicos. Adicionalmente, gracias a las mejoras continuas en términos de muestreo, en muchos casos permiten analizar resultados de grupos considerados más vulnerables que otros para entender mejor su situación y las posibles rutas para mejorar sus condiciones de vida.

Este es el caso del Departamento Administrativo Nacional de Estadística (DANE) en Colombia, que ha establecido un marco solido de medición con la Gran Encuesta Integrada de Hogares (GEIH). Esta encuesta se realiza de manera continua durante el año y provee información pertinente para informar a académicos y tomadores de decisiones en el país (varios que son lectores de este blog). En los últimos años, el DANE circuló e implementó la Guía para la inclusión del Enfoque Diferencial e Interseccional en la Producción Estadística del Sistema Estadístico Nacional (DANE, 2020). El objetivo de esta estrategia es visibilizar a poblaciones que tradicionalmente son “ estadísticamente invisibles” en encuestas de hogares en términos de género, sexualidad, discapacidades, etnia y campesinado. Después de un proceso de validación, se implementaron las recomendaciones propuestas por la guía a partir de los procesos de levantamiento de datos de la GEIH en 2021.

Una de las poblaciones priorizadas para la cual no se tenía información y se quería recolectar era la población LGBT. La Guía del DANE proponía incluir dos preguntas nuevas en adición a la pregunta estándar de sexo asignado al nacer (hombre/mujer):

  1. ¿Usted se reconoce cómo? Hombre, mujer, hombre trans, mujer trans u otro
  2. ¿Usted siente atracción sexual o romántica por? Hombres, mujeres, ambos sexos u otro

Sin embargo, esta metodología de respuesta directa puede no identificar bien a la población LGBT debido a estigmas u otros factores que hacen que las personas no respondan verazmente. En un estudio financiado por el Gender and Diversity Lab del BID nos hacemos dos preguntas. Primero, ¿cuál es el tamaño de la población LGBT y existen indicios de discriminación laboral a este grupo usando datos de la GEIH? Segundo, ¿cuál es el tamaño de la población LGBT si preguntamos sobre pertenencia a este grupo usando preguntas indirectas mediante un experimento de lista?

De acuerdo con la encuesta de hogares la población LGBT oscila entre el 1% y 4% de todos los habitantes en Colombia. Bogotá es la ciudad con mayor número de personas LGBT, aproximadamente 2,3% de las personas de la ciudad pertenecen a este grupo, mientras que otras zonas urbanas y áreas rurales concentran cerca del 1,5% y 1,0% respectivamente. En promedio, los individuos que se identifican como LGBT son adultos jóvenes y solteros entre los 18 y los 40 años. Según los datos de la GEIH, las personas LGBT tienden a tener mayor nivel educativo y viven en mejores condiciones socioeconómicas que las personas que no lo son. Cuando exploramos si experimentan algún tipo de discriminación o barrera en el acceso al mercado laboral, los resultados revelan que i) esta población parece no experimentar discriminación en este ámbito y ii) en promedio las personas LGBT participan más en el mercado laboral y no hay evidencia significativa de brechas salariales. En ese sentido los datos sugieren que la población LGBT no experimenta discriminación o vulnerabilidades como se suele creer. Pero ¿es ese el caso verdaderamente?

Figura 1. Población autoreportada como LGBT en Colombia (2021-2022)

Fuente: Elaboración propia con base en datos de la GEIH 2021-2022.

Existen dos posibles explicaciones para estos resultados. Por un lado, es probable que la encuesta de hogares no esté logrando identificar y por ende medir correctamente la población LGBT. Por otro lado, a la hora de estimar la discriminación pueden haber múltiples fuentes de sesgos, incluyendo la identificación de la población misma, así como variables omitidas que generan sesgos cuando intentamos medir discriminación utilizando diferencias de medias o metodologías de descomposiciones.

Nuestra investigación explora formas alternativas de aproximarse a la identificación y la medición de la población LGBT, que permitan atacar o mitigar el sesgo de deseabilidad social que emerge cuando se abordan preguntas sobre temáticas sensibles.[1] En ese sentido, diseñamos un experimento de lista que pretendía incrementar la percepción de anonimidad y privacidad de los encuestados al preguntar indirectamente por su identidad de género y sexual. El experimento se realizó en la ciudad de Bogotá con 2.025 adultos. La muestra es representativa para la ciudad y se seleccionó de manera aleatoria estratificando por sexo, edad y localidad, a partir de un registro del Centro Nacional de Consultoría que contenía 2 millones de números de telefónicos de personas que residían en Bogotá. Los participantes seleccionados fueron contactados a través de WhatsApp y si daban su consentimiento para hacer parte del estudio, recibían un enlace con la encuesta online[2].

Primero, los participantes respondían preguntas sobre características sociodemográficas como su edad, educación, estatus marital y ocupación. Después, se les recordaba a los participantes que sus respuestas eran confidenciales y anónimas, y se les asignaba de manera aleatoria al grupo de respuesta directa (grupo de control) o al grupo de respuesta indirecta (grupo de tratamiento). Quienes eran asignados al grupo de respuesta indirecta recibían 4 listas, cada una con 4 ítems o frases neutrales y para cada una el participante debía reportar cuántos, no cuáles, de esos ítems o frases aplicaban o eran ciertos para sí mismo/a. Este grupo además debía responder directamente una pregunta sensible sobre su identidad de género u orientación sexual, cabe mencionar que el orden en el que aparecían las listas y las preguntas directas se aleatorizaba. En contraste, las personas asignadas al grupo de respuesta indirecta únicamente recibían 4 listas, cada lista contenía los mismos 4 ítems neutrales que contenía la lista del grupo de control, más un ítem adicional que se refería a la característica o preferencia sensible cuya prevalencia queríamos medir. En cada lista, las personas del tratamiento debían responder cuántos de esos ítems eran ciertos o aplicaban para ellos/as mismos/as. A continuación, se encuentra un ejemplo de una lista que utilizamos:

Lista 1 – Identidad de Género
Grupo de Respuesta Directa

 

1.        Si tuviera la opción de decidir, yo votaría para legalizar el aborto.

2.        Yo dediqué tiempo a jugar al aire libre cuando era niño.

3.        El uso de métodos anticonceptivos debería ser ilegal.

4.        Todos y todas tenemos derecho a decidir sobre nuestro cuerpo.

 

 

 

 

 

 

Cuántas de las afirmaciones anteriores aplican/son ciertas para usted:

0 1 2 3 4

Usted se reconoce como:

Hombre 01
Mujer 02
Hombre trans 03
Mujer trans 04
Otro 77
Grupo de Respuesta Indirecta

 

1.        Si tuviera la opción de decidir, yo votaría para legalizar el aborto.

2.        Yo dediqué tiempo a jugar al aire libre cuando era niño.

3.        El uso de métodos anticonceptivos debería ser ilegal.

4.        Todos y todas tenemos derecho a decidir sobre nuestro cuerpo.

5.        Me identifico con un sexo diferente al que me fue asignado al nacer.

 

Cuántas de las afirmaciones anteriores aplican/son ciertas para usted:

0 1 2 3 4 5

 

 

 

 

 

 

 

 

 

De acuerdo con la teoría, dado que los participantes se asignaron de forma aleatoria a cada tratamiento, la diferencia en el promedio de ítems que los encuestados reportan como ciertos en el grupo de reporte indirecto y en el grupo de reporte directo indica la prevalencia del comportamiento o preferencia que se busca medir. Si se estima el efecto del tratamiento indirecto y los resultados muestran que hay una diferencia significativa y positiva entre los grupos, quiere decir que i) el tratamiento de pregunta indirecta si proporcionó una mayor anonimidad y privacidad a los participantes, y ii) que los individuos perciben que hay un costo social de reportar esa preferencia, comportamiento o característica sensible. Nuestros resultados sugieren que las prácticas actuales empleadas en las encuestas de hogares subestiman la fracción de individuos LGBT en la ciudad de Bogotá (Tabla 1). En particular, con la metodología de las encuestas de hogares, calculamos que el tamaño de la población LGBT oscila entre el 1-4%, mientras que con la metodología de reporte indirecto el tamaño estimado de esta población se encuentra entre 12-22% para la ciudad de Bogotá.

 

Tabla 1. El efecto del tratamiento de reporte indirecto en el tamaño de la población LGBT

Reporte directo ∆ en reporte de ítem sensible (Reporte indirecto) Prevalencia estimada del ítem sensible
   Identidad de género 0.010 0.106 0.116
(0.002) (0.054)** (0.054)**
   Atracción al mismo sexo 0.041 0.180 0.221
(0.004) (0.058)*** (0.056)***
   Atracción a ambos sexos 0.023 0.150 0.173
(0.003) (0.050)*** (0.050)***

Fuente: Elaborada por los autores a partir de la muestra del experimento de lista recolectada entre junio y julio de 2022

Notes: N=2.025, con 1.002 en condición de reporte directo. La columna 1 es el promedio de la muestra. La columna 2 es el coeficiente que captura el efecto del reporte directo obtenido de una regresión sin controles (Panel A) y con controles (Panel B). Los controles incluyen sexo al nacer, variables dicótomas para el grupo de edad, estado civil, logro educativo, y efectos fijos de zona. La columna 3 es la suma de las columnas 1 y 2. Errores estándares entre paréntesis: la columna 2 presenta errores estándares robustos a la heteroscedasticidad, y los errores estándar de las columnas 3 se obtuvieron a partir de un “bootstrap” con 1000 repeticiones.

Niveles de significancia: ***p<0.01; **p<0.05; ***p<0.10.

 

Ahora bien, el experimento sugiere que no todos los grupos LGBT subreportan de la misma manera.  Al observar la lista los resultados para la lista 1 (Tabla 1) encontramos que, preguntarles a los individuos sobre su identidad de género de manera indirecta (protegiendo su privacidad) incrementa el tamaño estimado de este grupo en 10,6 puntos porcentuales. Esto implica que el porcentaje de individuos que no se identifican con su sexo al nacer es 11,6%. Para la lista 2, aproximadamente 4,1% de las personas en reporte directo reportaron tener preferencias sexuales no heterosexuales, mientras que en el grupo de respuesta indirecta esta cifra es 22,1%. Lo anterior implica un subreporte de aproximadamente 18 puntos porcentuales. Por último, para la lista 3 que mide atracción sexual hacia ambos sexos, los resultados sugieren que las personas bisexuales son aproximadamente el 2,3% cuando se autoidentifican directamente, y 17,3% cuando se identifican de forma indirecta. Es decir, que el reporte para este grupo incrementó 15 puntos porcentuales con el tratamiento.

Al poner a prueba la metodología de pregunta directa con nuestro experimento, encontramos que existe un subreporte significativo de las personas LGBT en Bogotá. Esto indica que, si bien los esfuerzos que realiza el DANE por medir la población LGBT y sus condiciones de vida representan un gran avance en la visibilización de estas personas, la naturaleza sistemática del subreporte puede sesgar las estimaciones de desigualdades y discriminación que se obtienen a partir de estas encuestas. En ese sentido, aún es necesario pensar, probar y desarrollar metodologías que permitan identificar de manera más precisa a los miembros de la comunidad LGBT y sus condiciones de vida. La visibilidad estadística contribuye a que estos grupos minoritarios reciban mayor atención por parte de los hacedores de política pública y más y mejores políticas públicas orientadas a atender sus necesidades específicas. En este caso, las encuestas de hogares quizás no son el medio apropiado para lograr dicho fin, pero un paso a la vez lograremos mejores mediciones de este grupo en el futuro.

 

Referencias

 

Agüero, J., & Frisancho, V. (2017). Misreporting in sensitive health behaviors and its impact on treatment effects: An application to intimate partner violence. IDB Working Paper Series.

Coffman, K. B., Coffman, L. C., & Marzilli Ericson, K. M. (2017). The Size of the LGBT population and the magnitude of antigay sentiment are substantially underestimated. Management Science, 63(10), 3168–3186. https://doi.org/10.1287/mnsc.2016.2503

DANE. (2020b). Guía para la inclusión del enfoque diferencial e interseccional en la producción estadística del Sistema Estadístico Nacional. https://www.dane.gov.co/files/investigaciones/genero/guia-inclusion-enfoque-difencias-intersecciones-produccion-estadistica-SEN.pdf

 

 

[1] Al preguntar directamente a los encuestados sobre características, preferencias o comportamientos considerados como sensibles, es posible que estos estén inclinados a mentir o a responder lo que consideran que es “socialmente aceptable” para evitar juicios sociales. A esto se le conoce como sesgo de deseabilidad social y la evidencia empírica sugiere que suele generar estimaciones incorrectas sobre la prevalencia de características, preferencias o comportamientos (Coffman et al., 2013; Agüero Frisancho, 2017)

[2] Todos los participantes del experimento recibieron como incentivo un bono de helado. Adicionalmente, se realizó un piloto (n=30) y el experimento fue aprobado por el comité de ética de La Universidad de Los Andes.