El exceso de confianza, y cómo medirlo.

Muchos libros de texto de psicología, y artículos académicos en el área, contienen aseveraciones del tipo “La tendencia a que uno se evalúe más favorablemente que a otros es un hallazgo típico en la psicología social” (Alicke y otros, 1995). En psicología el exceso de confianza se llama “overconfidence”.

Como las creencias que uno tiene sobre sus posibilidades de éxito en distintas actividades importan en economía, el fenómeno comenzó a estudiarse experimentalmente también en economía, y se generaron citas como “Docenas de estudios muestran que la gente … es en general overconfident sobre sus habilidades” (Camerer, 1997). O esta cita por DeBondt y Thaler (1995) “Tal vez el hallazgo más robusto en la psicología social es que la gente es overconfident.”

Si la gente es overconfident o no es muy importante en economía. Nuestro futuro económico como (digamos) boxeadores, depende de qué tan buenos pensemos que somos en relación al resto. En Uruguay o Argentina, nuestras habilidades como futbolistas, relativo al resto, son centrales para decidir si queremos seguir una carrera profesional. También es importante cómo nos comparamos con otros para decidir si queremos prepararnos para ese examen de ingreso al Nacional Buenos Aires o al Pellegrini, donde los cupos son limitados.

Más en general, las decisiones de los ejecutivos de las grandes empresas sobre si comprar a una firma rival a la que le está yendo mal, dependen de qué tan buenos piensan que son administrando, relativo a los ejecutivos actuales. En mi tesis doctoral (Dubra, 1999) estudié cómo el exceso de confianza afectaba los procesos de búsqueda laboral: veía conocidos que buscaban empleos como gerentes de la Coca-Cola y estaban capacitados para ser repartidores, y eso los mantenía demasiado tiempo desempleados y frustrados.

En esta nota describiré un poco las distintas formas de overconfidence, y les relataré cómo ha ido cambiando su medición.

¿Cómo sería un experimento para mostrar que la gente tiene exceso de confianza? Hay básicamente tres versiones de overconfidence (ver Moore y Healy, 2008 para referencias y una descripción más detallada). Una es que uno se cree mejor de lo que realmente es en términos absolutos: la gente en un experimento debe contestar 20 preguntas, y al final estima cuántas tuvo bien, y en promedio la gente dice que tuvo más respuestas correctas de las que realmente tuvo.

Otra versión es que la gente estima intervalos de confianza muy chicos para cantidades desconocidas (en este sentido confianza sería en un sentido “estadístico”). En experimentos típicos preguntan esencialmente “dame un intervalo de confianza de 90%” para una serie de variables (por ejemplo, el largo del Nilo, la población de Tailandia, o la temperatura promedio en Alaska); la gente debe decir un intervalo tal que su “confianza” de que la variable caerá en ese intervalo es 90%. Sucede que si nos preguntan 100 de esas preguntas, al final 90 de ellas más o menos deberían caer dentro de los intervalos. A menudo sucede que el promedio es 60 o 70.

La tercer forma de overconfidence es el “better than average effect”: demasiada gente cree que es mejor que el promedio de las personas. Uno de los experimentos pioneros sobre este fenómeno juntó a una cantidad de estudiantes universitarios (digamos 100) en un salón y les dijo “miren a su alrededor, y estimen mejor que cuánta de esta gente conducen uds. un auto, y escríbanlo en un papelito” (esto fue Svensson en 1981). El hallazgo en este caso fue que alrededor de 85% de la gente escribió números mayores que 50: el 85% de la gente consideraba que estaba en la mitad superior de habilidades.

Un problema con muchos de estos experimentos en psicología es que no tenía ningún costo para la gente decir “cualquier cosa”. En particular, en el ejemplo del último experimento es gratis para mí decir que manejo mejor que 90% de la gente. En muchos casos, los economistas que comenzaron a estudiar overconfidence, y pasó igual con economistas que se metieron en otros temas de psicología, lo primero que hicieron fue tratar de replicar los estudios de los psicólogos, pero con incentivos. Así por ejemplo, un estudio pionero le mostró a un grupo de estudiantes algunas preguntas de muestra, y le preguntaron a cada uno “qué preferís: ganar USD 10 con probabilidad 50%, o ganar USD 10 si luego de tomar un test con preguntas similares a esas, te ubicás en la mitad de arriba?” Una vez más, los autores (Hoelzl y Rustichini) mostraron que (cuando las preguntas eran fáciles) más del 60% de la gente prefería que se le pagara si estaba en la mitad de arriba. Igual que en el caso de Svensson, más de la mitad de la gente considera que está en la mitad de arriba.

Hay, también en economía, docenas de estos estudios con incentivos y todo. La presunción era que estos experimentos demostraban que la gente es irracional, que por la razón que sea, estas creencias no pueden derivarse en una población que procesa información de forma insesgada.

En el 2007 con mi coautor de larga data, Jean-Pierre Benoît, nos dimos cuenta que en realidad estos experimentos no demostraban tal irracionalidad: datos como esos podían perfectamente surgir en una población que procesa la información en forma correcta. Para entender cómo es eso posible, imaginemos que todo el mundo sabe que hay dos tipos de conductores: aquellos que chocan con probabilidad 10% antes de los 22 años, y los que chocan con probabilidad 30%, y que la mitad de la población es de cada tipo. Entonces, supongamos que voy a correr un experimento con 100 estudiantes como en el experimento original, y que como es esperable, son 50 conductores buenos (que chocan con probabilidad 10% y 50 malos (que chocan con probabilidad 30%), pero nadie sabe con certeza si es bueno o malo.

Del primer grupo habrán chocado en términos esperados 5 personas (10% de 50) mientras que del segundo grupo habrán chocado 15 (30% de 50). En total, habrá 80 personas que pensaban (a priori) que eran buenos conductores con probabilidad 50%, y que luego de conducir durante algunos años, no chocaron. Si a esas 80 personas les preguntamos “¿creés que estás en la mitad de arriba o en la mitad de abajo?” su respuesta racional será “estoy en la mitad de arriba (pues a priori pensaba que tenía 50% de chance, y la información que recibí en este tiempo fue buena: no choqué)”. Es decir, en una población racional, cuando la tarea es “fácil” (en promedio chocan 20% de los sujetos en el ejemplo) es natural que más de la mitad de la gente se coloque en la mitad superior. En nuestro trabajo del 2011 documentamos cómo esta idea sencilla demostraba que ninguno de los experimentos sobre el “better than average effect” demostraba que la población era irracional.

Por supuesto, como la pregunta “¿es la gente overconfident?” es importante, y es necesario tener alguna forma adecuada de contestar la pregunta, también desarrollamos una serie de pruebas que sí podrían demostrar la irracionalidad. Como “anécdota” científica, alguna gente nos pedía que hiciéramos también los experimentos (no sólo el trabajo teórico de desarrollar los tests). Pero ni mi coautor ni yo nos sentíamos capacitados para hacer un experimento “bien” y sentíamos que íbamos a estropear el trabajo teórico (que nos gustaba).

Sin embargo, visité Carnegie Mellon en los semestres de primavera de 2007 a 2009, y ahí conocí a Don Moore, un psicólogo muy bueno, y muy activo, que había trabajado en temas de overconfidence. Le conté de nuestro paper teórico y de nuestras nuevas medidas. Le propuse correr unos experimentos y accedió. Para este trabajo (Benoît, Dubra y Moore, 2015) desarrollamos tres tipos de tests. Uno era directamente basado en el trabajo que había empezado en el 2007 y se publicó como Benoît y Dubra (2011): la gente tenía que elegir entre una apuesta que pagaba $10 con probabilidad 50%, u otra que pagaba $10 si la persona terminaba en el 30% superior de los que tomaban una prueba de lógica; la racionalidad implica que a lo sumo 60% de la gente puede elegir apostar por su performance. En el experimento 52% de la gente dijo “estoy en el top 30%” (eligió apostar por su habilidad) y parece irracional, pero puede provenir de una población racional (aunque también de una que es verdaderamente irracional). Es un test débil en ese sentido, pero hay que notar que en el trabajo de Svensson más de 80% de la gente se colocó en el 30% superior (y por lo tanto había esperanza de demostrar overconfidence).

El problema con esta prueba es que podría haber overconfidence, y no logramos detectarla. Por eso debimos desarrollar un test que tuviera la propiedad que no se rechazaba si y sólo si la población era racional. La forma que encontramos de desarrollar esa prueba es la siguiente: para cualquier evento que en la población tenga probabilidad 50%, si le preguntamos a toda la gente “¿cuál es la probabilidad de ese evento?” el promedio debe ser exactamente 50%. Lo que hicimos entonces fue preguntarle a la gente “¿qué probabilidad creés que tenés de quedar en la mitad superior de los que toman esta prueba?”, como en la población el 50% termina en la mitad de arriba, el promedio de las respuestas debía ser 50%.

¿Cómo podemos hacer para preguntarle a alguien cuál cree que es la probabilidad de algún evento (por ejemplo “probabilidad de quedar en la mitad de arriba en el test”), y que tenga incentivos a contestar lo que realmente cree? Un método desarrollado conceptualmente en 1961 consiste en decirle a la persona que elija entre recibir $10 con probabilidad 1%, o $10 si queda en la mitad de arriba; luego preguntarle si prefiere la apuesta de 2%, o apostar sobre su posición; luego 3%, y así sucesivamente hasta 100%. Presumiblemente preferirá apostar a su habilidad cuando la alternativa es baja (1%, 2%, etc.) y cambiará luego eligiendo las apuestas con probabilidad alta (digamos 97%, 98%, etc.). El número en el cual cambia se interpreta como la creencia de la persona (es indiferente entre las dos apuestas).

Corrimos ese test, y dio un promedio de 67%, y no 50%; se “demostraba” overconfidence. Otra anécdota, más editorial que científica, es que el editor y los árbitros de la revista “no entendían” la asociación entre Moore con Benoît y conmigo: Moore era un “hincha” de overconfidence (“hay overconfidence y estas son sus formas, etc.”) y a nosotros se nos percibía como “anti-overconfidence” (dijimos que los datos que había no demostraban overconfidence pues una población racional podía generarlos, pero se interpretó como “no hay overconfidence, esos datos los genera una población racional”). No entendían por qué nosotros “dábamos por tierra” con nuestra propia teoría. La verdad es que nuestro único objetivo era ver si la gente era overconfident o no.

Todavía sigo trabajando en este tema. Aún esta forma de medir creencias que parece “obvia” o “sólida” tiene problemas. En una próxima entrada contaré sobre cómo arreglarlo, o si les gustó esta columna, vean Benoît, Dubra y Romagnoli (2020).

 

Alicke, M. D., M. L. Klotz, D. L. Breitenbecher, T. J. Yurak, and D.S. Vredenburg (1995), «Personal contact, individuation, and the better-than-average effect,» Journal of Personality and Social Psychology, 68(5), 804-825.

Benoît, J-P. and J. Dubra (2011), «Apparent Overconfidence» Econometrica 79(5), 1591-1625.

Benoît, J.-P., Dubra, J. and Moore, D. A. (2015), “Does the Better-than-average Effect show that People are Overconfident?: Two Experiments. Journal of the European Economic Association, 13: 293-329.

Benoît, J.-P., Dubra, J. and G. Romagnoli (2020), “Elicitation when more than money matters,” MPRA WP 95550.

Camerer, C. (1997), «Progress in Behavioral Game Theory,» Journal of Economic Perspectives, 11(4). pp. 167-88.

De Bondt, W. and R. H. Thaler, (1995), «Financial decision-making in markets and firms: a behavioral perspective’, in (R. A. Jarrow, V. Maksimovic and W. T. Ziemba, eds), Finance, Handbooks in Operations Research and Management Science, vol. 9, pp. 385–410. Amsterdam: North Holland.

Dubra, J. (1999), “Optimism and Overconfidence in Search,” Review of Economic Dyamics 7 (working paper 1999, esta publicación 2004).

Hoelzl, E. and A. Rustichini, (2005), «Overconfident: do you put your money on it?» the Economic Journal, 115, pp. 305-18.

Moore, D. A., and P.J. Healy (2008), «The trouble with overconfidence,» Psychological Review, 115(2), 502-517.