Qué hay de científico en el reconocimiento de expresión facial de la emoción

Introducción

Durante décadas, la idea de que las emociones humanas pueden leerse en el rostro ha capturado tanto la imaginación científica como la cultura popular. Desde manuales de interrogatorio policial hasta series de televisión y cursos de formación corporativa, se ha extendido la creencia de que, observando cuidadosamente la cara de una persona, especialmente sus llamadas microexpresiones, podemos inferir con precisión lo que realmente siente e incluso descubrir si está mintiendo. Esta promesa tiene un atractivo evidente. Si el rostro revela emociones de forma universal y automática, entonces podríamos acceder a una especie de “lenguaje biológico de la verdad”, independiente de las palabras.

El origen científico moderno de esta idea se encuentra principalmente en el trabajo del psicólogo estadounidense Paul Ekman, quien desde finales de los años sesenta defendió que ciertas emociones básicas (alegría, tristeza, ira, miedo, sorpresa y asco) poseen expresiones faciales universales reconocibles en todas las culturas. Junto con Wallace Friesen desarrolló el Facial Action Coding System (FACS), un sistema detallado para describir los movimientos musculares del rostro. Este instrumento permitió estudiar las expresiones faciales de forma más sistemática y cuantificable, marcando un hito en la investigación psicológica de la emoción.

En el ámbito científico, las investigaciones iniciales de Ekman apoyaban la hipótesis de universalidad emocional. Diversos estudios transculturales sugerían que personas de distintas culturas podían identificar emociones básicas en fotografías de rostros con tasas de acierto superiores al azar (Ekman & Friesen, 1971). Posteriormente, metaanálisis como el de Elfenbein y Ambady (2002) encontraron que el reconocimiento emocional se producía por encima del azar entre culturas, aunque con una ventaja intragrupo, es decir, las personas identifican mejor las emociones de individuos pertenecientes a su misma cultura.

Sin embargo, a medida que el campo de las ciencias cognitivas y la neurociencia afectiva avanzaba, comenzaron a surgir preguntas importantes. Entre ellas, salen a debate preguntas como ¿las emociones realmente se expresan siempre de la misma manera en el rostro? ¿podemos realmente inferir con precisión un estado emocional interno únicamente observando una expresión facial? y más allá de eso, ¿es posible detectar engaño o mentira basándose en señales faciales breves?

Estas preguntas se volvieron especialmente relevantes cuando las teorías sobre las microexpresiones comenzaron a trasladarse del laboratorio a contextos aplicados como interrogatorios policiales, seguridad aeroportuaria o inteligencia. Incluso, más allá de estos contextos, la teoría de las microexpresiones se popularizó de tal manera que incluso medios de prensa, consultores en negociación y comunicación e incluso políticos, oradores y hasta vendedores se vieron seducidos por sus supuestos resultados. Los programas de entrenamiento basados en microexpresiones prometían mejorar la capacidad para detectar mentiras o emociones ocultas con altos niveles de precisión. Sin embargo, revisiones científicas posteriores mostraron resultados mucho más modestos y, en algunos casos, directamente contradictorios con esas promesas.

La discusión actual en psicología y neurociencia no se centra tanto en negar que el rostro comunique información emocional, algo ampliamente aceptado, sino en determinar qué tipo de información comunica realmente, con qué grado de fiabilidad y bajo qué condiciones. El rostro humano es un sistema extremadamente complejo de señales musculares, culturales y contextuales, y reducirlo a un conjunto de “códigos universales de emoción” puede simplificar en exceso la realidad psicológica.

Además, la investigación contemporánea sobre emoción ha introducido modelos alternativos que cuestionan la idea de emociones básicas universales. Investigadores como Lisa Feldman Barrett han propuesto teorías constructivistas según las cuales las emociones no son programas biológicos universales con expresiones fijas, sino procesos construidos por el cerebro a partir de predicciones, contexto cultural y experiencia previa (Barrett, 2017).

En este contexto, el debate científico sobre el reconocimiento facial de la emoción se ha vuelto más matizado. Por un lado, existen evidencias robustas de que los humanos pueden reconocer ciertos estados afectivos a partir de señales faciales. Por otro, también existe evidencia creciente de que la relación entre expresión facial y emoción interna es probabilística, contextual y mucho menos determinista de lo que sugieren las interpretaciones populares.

El objetivo de este artículo es analizar críticamente qué parte del reconocimiento facial de la emoción puede considerarse científicamente sólida y qué parte pertenece más bien al terreno de la extrapolación o la sobreinterpretación.

La hipótesis clásica sobre emociones básicas y universalidad facial

Una de las teorías más influyentes en la psicología de la emoción es la propuesta de que existen emociones básicas universales, cada una asociada a patrones específicos de expresión facial. Esta idea tiene raíces históricas que se remontan a Charles Darwin, quien en 1872 defendió que las expresiones emocionales humanas derivaban de mecanismos evolutivos compartidos con otros animales.

Ekman retomó esta idea un siglo después mediante estudios experimentales. En uno de sus trabajos más citados, Ekman y Friesen (1971) mostraron fotografías de expresiones faciales a participantes de diferentes culturas, incluyendo poblaciones relativamente aisladas de Nueva Guinea. Los participantes debían asociar las expresiones con historias emocionales. Los resultados indicaron que las emociones básicas podían reconocerse con tasas de acierto superiores al azar, lo que se interpretó como evidencia de universalidad.

Este programa de investigación llevó al desarrollo del FACS, un sistema que descompone los movimientos faciales en unidades musculares llamadas Action Units. El FACS no identifica emociones directamente, describe movimientos musculares específicos, como el levantamiento de las cejas o la contracción del músculo cigomático mayor. Este sistema ha sido extremadamente influyente en múltiples áreas, desde la psicología hasta la animación digital y la inteligencia artificial.

Metaanálisis posteriores aportaron apoyo parcial a la idea de universalidad. El trabajo de Elfenbein y Ambady (2002), que analizó numerosos estudios transculturales, concluyó que las personas pueden reconocer emociones en rostros de otras culturas con una precisión superior al azar. Sin embargo, también identificó un fenómeno importante: la ventaja intragrupo, según la cual las personas reconocen mejor las emociones de individuos pertenecientes a su misma cultura.

Este resultado sugiere que, aunque puedan existir componentes universales, la percepción emocional está modulada por factores culturales y de aprendizaje. Las llamadas display rules o normas de exhibición emocional, estudiadas por Ekman y Friesen (1969), indican que diferentes culturas regulan de manera distinta cuándo y cómo es apropiado mostrar ciertas emociones.

Además, investigaciones posteriores han mostrado que muchas expresiones faciales no son exclusivas de una sola emoción. Por ejemplo, la elevación de las cejas puede aparecer tanto en sorpresa como en miedo. Esto implica que las expresiones faciales funcionan más como señales probabilísticas que como códigos deterministas.

En resumen, la hipótesis de universalidad emocional cuenta con cierto respaldo empírico, pero su interpretación más fuerte, la idea de que cada emoción tiene una expresión facial única e inequívoca, ha sido progresivamente cuestionada.

Los límites científicos del reconocimiento facial de emociones

Aunque los humanos somos razonablemente buenos interpretando expresiones faciales en contextos cotidianos, la investigación científica ha mostrado que inferir emociones internas a partir del rostro es mucho más complejo de lo que se pensaba inicialmente.

Uno de los principales problemas metodológicos en los estudios clásicos es el uso de fotografías posadas y tareas de elección forzada. En estos experimentos, los participantes suelen elegir entre varias categorías emocionales predefinidas, lo que puede inflar artificialmente las tasas de acierto.

Investigaciones posteriores han demostrado que cuando se eliminan estas restricciones experimentales, la precisión disminuye considerablemente. Además, las expresiones emocionales reales suelen ser dinámicas, contextuales y ambiguas, algo difícil de capturar en fotografías estáticas.

Un trabajo particularmente influyente es el de Barrett et al. (2019), quienes revisaron críticamente la evidencia sobre la relación entre expresiones faciales y emociones. Su conclusión fue que la cara por sí sola rara vez proporciona información suficiente para identificar una emoción específica sin contexto adicional.

Los autores argumentan que el cerebro humano interpreta las expresiones faciales utilizando múltiples fuentes de información, como contexto situacional, tono de voz, lenguaje corporal y conocimiento previo sobre la persona. Sin estos elementos, la interpretación de una expresión facial puede variar considerablemente.

Otro estudio relevante es el de Gendron et al. (2014), quienes investigaron cómo personas de una cultura remota interpretan expresiones faciales emocionales. Sus resultados mostraron que los participantes no asociaban automáticamente las expresiones con las categorías emocionales occidentales clásicas, lo que sugiere que las emociones no se perciben necesariamente como entidades universales discretas.

Estos hallazgos han impulsado el desarrollo de teorías constructivistas de la emoción. Según estas perspectivas, el cerebro no simplemente “detecta” emociones en el rostro, sino que construye interpretaciones emocionales basadas en predicciones y aprendizaje cultural.

En consecuencia, el reconocimiento facial de emociones puede entenderse mejor como un proceso inferencial probabilístico, no como un sistema de lectura directa del estado emocional interno.

Fuente: https://www.paulekman.com/facial-action-coding-system/

La gran controversia de las microexpresiones y la detección del engaño

Pocos temas han sido tan seductores para la cultura popular como la idea de que una mentira deja siempre una grieta visible en el rostro. Dentro de esa narrativa, las microexpresiones ocupan un lugar casi mítico, gestos faciales extremadamente breves, de apenas unas décimas o centésimas de segundo, que supuestamente delatarían una emoción auténtica que la persona intenta ocultar. La hipótesis clásica sostiene que, cuando alguien miente o reprime lo que siente, el control voluntario no logra sofocar por completo la respuesta emocional y se produce una “fuga” facial involuntaria. En teoría, ese destello sería una ventana privilegiada al estado interno real del sujeto. El problema es que una idea intuitivamente atractiva no equivale, por sí sola, a una idea científicamente demostrada. La literatura acumulada en detección del engaño sugiere que esa promesa ha sido, como mínimo, exagerada.

La primera dificultad es conceptual. Incluso si aceptamos que algunas microexpresiones existen y que en ciertos casos pueden reflejar emoción contenida, eso no implica automáticamente que revelen mentira. Mentir y sentir no son la misma cosa. Una persona puede mentir sin experimentar una emoción intensa visible; puede estar entrenada, emocionalmente fría, habituada a engañar o, sencillamente, estar diciendo una falsedad trivial sin apenas activación afectiva. A la inversa, alguien puede decir la verdad y mostrar señales intensas de miedo, tensión, vergüenza o incomodidad. Esto ocurre especialmente en interrogatorios, entrevistas de evaluación, controles de seguridad o situaciones en las que la persona teme no ser creída. En esos contextos aparece con fuerza el llamado error de Otelo, que es confundir la ansiedad de quien teme ser juzgado injustamente con la ansiedad de quien teme ser descubierto mintiendo. Esa distinción es crucial, porque convierte muchos indicios faciales en señales ambiguas: pueden hablar de activación emocional, pero no de veracidad.

La investigación empírica sobre detección humana del engaño refuerza esta cautela. El metaanálisis clásico de Bond y DePaulo, basado en centenares de estudios, encontró que la precisión media para distinguir verdad y mentira ronda el 54 %, apenas por encima del azar. Ese dato es importante no solo por lo bajo que resulta, sino porque desmonta la intuición extendida de que “se nota” cuando alguien miente. Además, las revisiones posteriores muestran que cuando los observadores dependen sobre todo de pistas visuales y no del contenido verbal, su rendimiento no mejora, de hecho, puede empeorar por el peso de los estereotipos sobre cómo “debería” comportarse un mentiroso. Vrij, Hartwig y Granhag resumen este panorama con claridad. Las claves no verbales conocidas del engaño son, en general, débiles e inestables, y las personas que intentan detectar mentiras fijándose en la conducta visible son, como mucho, detectores mediocres.

Aquí aparece una segunda cuestión metodológica decisiva: durante años se ha hablado mucho de microexpresiones, pero se han realizado relativamente pocos estudios capaces de demostrar de manera robusta que constituyan un indicador fiable y generalizable de engaño. Un artículo especialmente revelador de Matsumoto y colaboradores subraya precisamente eso, que pese a décadas de influencia en libros, formación profesional y medios de comunicación, los estudios que han probado directamente si las microexpresiones distinguen mentiras de verdades han sido escasos, y sus resultados, en conjunto, equívocos. Los propios autores afirman que la evidencia previa era, como mucho, ambigua, y que la rareza de estas expresiones limita mucho su utilidad práctica como pista diagnóstica. Dicho de otro modo, incluso si existen, aparecen poco, duran poco y no ofrecen una relación simple ni estable con la mentira.

A eso se suma un problema de frecuencia y de base estadística. Para que una señal sea útil en contextos reales, policiales, clínicos, jurídicos o de seguridad, no basta con que pueda aparecer alguna vez asociada al engaño, tiene que hacerlo con suficiente consistencia, y además diferenciarse claramente de lo que ocurre en personas veraces. Las microexpresiones no cumplen bien esa condición. Son fenómenos raros, difíciles de captar incluso con vídeo analizado cuadro a cuadro, y su mera presencia no resuelve el problema fundamental de la inferencia: una microexpresión puede indicar emoción, pero no especifica por sí sola la causa de esa emoción. Un rostro puede filtrar miedo, asco, tensión o sorpresa por múltiples razones, muchas de ellas independientes de estar mintiendo. Pretender que el observador salte desde “he visto una fugaz señal emocional” a “esta persona está engañando” es un salto inferencial mucho mayor de lo que suele reconocerse fuera de la literatura científica.

El entusiasmo aplicado por los programas de entrenamiento tampoco ha sido respaldado de forma convincente. Jordan y colaboradores evaluaron directamente el Micro-Expressions Training Tool (METT), uno de los programas más conocidos inspirados en este enfoque. Su resultado fue claro, el grupo entrenado no superó ni al grupo control ni al grupo sin entrenamiento, y la precisión global quedó ligeramente por debajo del azar. Además, los análisis bayesianos aportaron apoyo positivo a la ausencia de efecto, algo especialmente relevante porque no se trató solo de “no encontrar diferencias significativas”, sino de obtener evidencia a favor de que el entrenamiento no mejoraba la detección del engaño en esa muestra. En otras palabras, aprender a reconocer microexpresiones no convirtió a los participantes en mejores detectores de mentiras.

Este punto es importante porque ayuda a separar dos preguntas que a menudo se mezclan indebidamente. La primera es si una persona puede mejorar algo su capacidad para reconocer expresiones emocionales muy breves. La segunda, mucho más ambiciosa, es si ese aprendizaje le permite inferir veracidad o engaño. No son la misma cuestión. Uno puede entrenar la percepción de gestos faciales sin que eso se traduzca en mejor juicio sobre si alguien miente, porque la relación entre emoción y engaño no es uno a uno. El propio estudio de Jordan et al. insiste en ello, no hay razón a priori para asumir que reconocer mejor ciertas emociones breves equivalga a reconocer mejor la falsedad de una declaración.

La literatura más amplia sobre comunicación no verbal y mentira apunta en la misma dirección. La revisión de Vrij y colegas subraya que los observadores suelen sobrestimar enormemente el valor diagnóstico de lo visual. Cuando se les enseña a fijarse en la conducta no verbal, pueden desarrollar un sesgo de mentira, es decir, una tendencia a interpretar más mensajes como engañosos de lo que realmente son. Esto sucede porque, en ausencia de información verbal sólida, la mente rellena huecos con estereotipos tipo “si evita la mirada, miente”, “si parece rígido, miente”, y “si duda, miente”. Pero muchos de esos supuestos marcadores no resisten bien el contraste empírico. La consecuencia práctica es seria: la confianza excesiva en señales faciales o gestuales puede aumentar los falsos positivos y llevar a considerar sospechosas a personas veraces pero nerviosas, introvertidas, culturalmente distintas o simplemente incómodas.

Ahora bien, conviene introducir una matización para no caer en el extremo opuesto. Decir que las microexpresiones no son un detector fiable de mentiras no equivale a afirmar que toda investigación sobre comportamiento observable carece de valor. Algunos trabajos han encontrado que conjuntos de múltiples pistas codificadas objetivamente, no una sola señal aislada, y desde luego no una única microexpresión interpretada “a ojo”, pueden permitir clasificaciones mejores que el juicio humano espontáneo. Hartwig y Bond, por ejemplo, mostraron que, cuando se codifican de manera sistemática constelaciones de múltiples conductas, la detectabilidad objetiva de la mentira puede acercarse al 70 %. Pero ese hallazgo no legitima la lectura intuitiva del rostro como si fuera un polígrafo natural. Primero, porque ese rendimiento procede de modelos construidos con múltiples variables y codificación rigurosa, no de observadores improvisados. Segundo, porque incluso en ese escenario “ideal” la precisión dista mucho de ser perfecta. Y tercero, porque esos resultados no convierten a las microexpresiones en la pieza central del proceso; son, como mucho, una parte pequeña dentro de patrones más complejos.

Algo parecido ocurre con los sistemas automáticos y de aprendizaje automático. Algunos estudios recientes reportan que modelos computacionales pueden superar a jueces humanos al clasificar vídeos como veraces o engañosos, sobre todo cuando combinan rasgos faciales, audio, transcripción verbal o condiciones que incrementan la carga cognitiva del entrevistado. Pero esos trabajos no resuelven la tesis fuerte defendida en la cultura popular. De hecho, varios de ellos reconocen explícitamente que los humanos, incluso entrenados, siguen quedándose cerca del azar cuando intentan basarse en microexpresiones faciales, y que los mejores resultados automatizados suelen depender de combinar modalidades, de usar conjuntos de datos concretos o de condiciones experimentales muy controladas. Algunos artículos también advierten de problemas metodológicos serios, como particiones de entrenamiento y prueba que pueden inflar artificialmente el rendimiento del algoritmo. Por tanto, tampoco aquí es razonable concluir que “la cara delata la mentira” de forma universal.

La conclusión científica más prudente es, por tanto, doble. Por un lado, la hipótesis de la “fuga emocional” tiene una plausibilidad teórica limitada y quizá pueda explicar algunos episodios concretos de expresión involuntaria. Por otro, convertir esa intuición en una herramienta fiable de detección del engaño ha demostrado ser mucho más difícil de lo que prometen los discursos comerciales y mediáticos. Las microexpresiones pueden, en ocasiones, aportar información sobre activación emocional, conflicto o esfuerzo de regulación. Pero ese tipo de información no es equivalente a veracidad. En ciencia del engaño, la diferencia entre señal de emoción y prueba de mentira no es un matiz menor, es exactamente el núcleo del problema.

Conclusiones

El reconocimiento facial de la emoción constituye uno de los campos más fascinantes de la psicología y la neurociencia, pero también uno de los más malinterpretados fuera del ámbito científico. A lo largo de las últimas décadas, la investigación ha demostrado que el rostro humano es una fuente rica de información social y afectiva. Sin embargo, también ha mostrado que esta información es ambigua, contextual y probabilística.

La obra de Paul Ekman y sus colaboradores fue fundamental para iniciar el estudio sistemático de las expresiones faciales y desarrollar herramientas metodológicas como el FACS. Estas contribuciones siguen siendo valiosas y ampliamente utilizadas.

No obstante, algunas extrapolaciones derivadas de este trabajo, especialmente la idea de que las microexpresiones permiten detectar mentiras de forma fiable, carecen de apoyo empírico sólido. La evidencia científica actual sugiere que las expresiones faciales no constituyen un “lenguaje universal de la emoción” tan claro como se pensó inicialmente.

Más bien, las expresiones faciales deben entenderse como señales sociales complejas que interactúan con el contexto cultural, el conocimiento previo y las expectativas cognitivas del observador.

En términos prácticos, esto implica que interpretar emociones únicamente a partir del rostro puede conducir a errores significativos. Las emociones humanas no son etiquetas visibles grabadas en la cara, sino procesos psicológicos dinámicos que emergen de la interacción entre el cerebro, el cuerpo y el entorno.

Quizá la lección más importante de este debate científico es que el rostro humano comunica, pero no confiesa. Nos ofrece pistas, no certezas.

La pregunta que queda abierta es profundamente relevante tanto para la ciencia como para la sociedad. Si las emociones no pueden leerse directamente en el rostro, ¿hasta qué punto estamos proyectando nuestras propias interpretaciones sobre los demás cuando creemos entender lo que sienten?

Referencias

  • Aviezer, H., Trope, Y., & Todorov, A. (2012). Body cues, not facial expressions, discriminate between intense positive and negative emotions. Science, 338(6111), 1225–1229.
  • Barrett, L. F. (2017). How emotions are made: The secret life of the brain. Houghton Mifflin Harcourt.
  • Barrett, L. F., Adolphs, R., Marsella, S., Martinez, A., & Pollak, S. (2019). Emotional expressions reconsidered: Challenges to inferring emotion from human facial movements. Psychological Science in the Public Interest, 20(1), 1–68.
  • Bond, C. F., & DePaulo, B. M. (2006). Accuracy of deception judgments. Personality and Social Psychology Review, 10(3), 214–234.
  • Darwin, C. (1872). The expression of the emotions in man and animals. John Murray.
  • Durán, J. I., Reisenzein, R., & Fernández-Dols, J. M. (2017). Coherence between emotions and facial expressions: A research synthesis. Emotion Review, 9(1), 31–41.
  • Ekman, P., & Friesen, W. V. (1969). The repertoire of nonverbal behavior: Categories, origins, usage, and coding. Semiotica, 1, 49–98.
  • Ekman, P., & Friesen, W. V. (1971). Constants across cultures in the face and emotion. Journal of Personality and Social Psychology, 17(2), 124–129.
  • Elfenbein, H. A., & Ambady, N. (2002). On the universality and cultural specificity of emotion recognition. Psychological Bulletin, 128(2), 203–235.
  • Gendron, M., Roberson, D., Van Der Vyver, J. M., & Barrett, L. F. (2014). Perceptions of emotion from facial expressions are not culturally universal. Current Biology, 24(21), 2518–2524.
  • Hartwig, M., & Bond, C. F. (2014). Lie Detection from Multiple Cues: A Meta-analysis.
  • Jordan, S., Brimbal, L., Wallace, B., Kassin, S. M., Hartwig, M., & Street, C. (2019). A test of the microexpression training tool: Does it improve lie detection? Journal of Investigative Psychology and Offender Profiling, 16(3), 222–233.
  • Levine, T. R. (2022). Duped: Truth-Default Theory and the Social Science of Lying and Deception.
    University of Alabama Press.
  • Matsumoto, D., Hwang, H. C., Skinner, L., & Frank, M. G. (2018). Microexpressions Differentiate Truths From Lies About Future Malicious Intent.
  • Vrij, A., Hartwig, M., & Granhag, P. A. (2019). Reading Lies: Nonverbal Communication and Deception.
  • Vrij, A., Fisher, R., & Blank, H. (2017). A cognitive approach to lie detection: A meta-analysis. Legal and Criminological Psychology, 22(1), 1–21.

Deja un comentario

Descubre más desde SERGIO COLADO

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo