// TODO: Revisar qué hace the_post_thumbnail_creditos Análisis de las emociones a través de expresiones orales

Análisis de las emociones a través de expresiones orales E.I.

Inteligencia artificial & CienciaPsicología

De la risa al gemido: el primer atlas sonoro de las emociones

Catalogan 24 emociones básicas que se expresan universalmente a través de sonidos como la risa o el gemido, interpretables por máquinas

En un tiempo en que nos reímos por escrito en clave de “jajaja”; en un tiempo en que hasta la RAE debe precisar la grafía concreta de nuestras emociones, un equipo estadounidense de psicólogos y lingüistas ha radiografiado un catálogo de más de más de 2.000 exclamaciones no verbales conocidas como “explosiones vocales”. Han descubierto que transmiten al menos 24 tipos de emociones, casi el doble de los matices vocales detectados hasta la fecha. Y han subido todos esos sonidos a internet, mostrándolos en un atlas de interjecciones sonoras, agrupadas por sentimientos análogos y dotando a cada cual del porcentaje exacto que hay en ella de matices como tristeza, distracción o culpa.

“Las vocalizaciones emocionales son fundamentales para la vida social humana”, explica desde la Universidad de California-Berkeley el psicólogo Dacher Keltner a El Independiente. “Antes se consideraba que manejábamos 13 emociones en vocalizaciones breves y de 10 a 12 con movimientos musculares faciales”. Kelner fue asesor de Pixar para la película Del revés (Pete Docter, 2015) y autor de varios estudios sobre los ricos y su empatía.

Esta capacidad surge muy pronto en el desarrollo del bebé, se conserva de alguna forma en todas las culturas y da “información de cómo las personas responden emocionalmente a los tonos”. Aquí están las 2.032 ráfagas recopiladas y catalogadas. Al pasar el cursor o tocar en cada una, escucharás el sonido. [Ojo con los altavoces, empieza a sonar una vez pulsas continue]:

 

El equipo aplicó “técnicas de análisis y recopilación de datos a gran escala en 2.032 ráfagas vocales producidas en entornos de laboratorio y 48 encontradas en el mundo real por hablantes de inglés estadounidense”.

“Lo que se entiende poco es cómo se estructura el reconocimiento de las emociones a partir de la vocalización en lo que llamamos un espacio semántico: ¿Cuántas clases distintas de emociones se pueden expresar? ¿Las expresiones transmiten categorías de emoción o evaluaciones afectivas (es decir, hilando más fino, explicando los matices de cada emoción)? ¿El reconocimiento de las expresiones emocionales es discreto (o gradual?”

El estudio se publica en la American Psycologist y se suma a otro de 2015 en que comparaban las tonalidades vinculadas a emociones en la cultura de Estados Unidos, con las expresiones orales espontáneas en Bután.

Un código sonoro universal

En contraste con las teorías de la emoción discreta –que dicen que cada sonido expresa inequívocamente un sentimiento en un momento concreto– , las categorías como simpatía, temor… transmitidas por las ráfagas vocales están unidas por gradientes suaves con un significado que varía continuamente. Es decir, un gemido termina en risa o llanto gradualmente.

La cuestión es que este experimento ha tenido una metodología muy singular para que sus resultados sean aplicables a casi toda la humanidad, y no quede circunscrita a la cultura de la costa oeste norteamericana.

El equipo registró las más de 2.000 ráfagas vocales en boca de 56 actores masculinos y femeninos profesionales y de no actores de los Estados Unidos, India, Kenia y Singapur, al pedirles que respondieran a escenarios emocionalmente evocadores.

A continuación, más de 1.000 adultos (reclutados a través de Mechanical Turk de Amazon) escucharon los estallidos vocales y los evaluaron en función de las emociones y el significado que transmitían. “Esto es lo que es realmente único acerca de este estudio”, con categorías (enfado, vergüenza, simpatía…) y sus matices de evaluación (por ejemplo, si una risa es agradable, excitada, nerviosa…), explica el autor. “Alan y yo reunimos ambos tipos de calificaciones, lo que nos permitió, de la manera más completa, identificar cómo se expresan las emociones en la voz, y lo que impulsa la forma en que percibimos la emoción en la voz, categorías o dimensiones.

Un análisis estadístico de sus respuestas encontró que los estallidos vocales encajan en al menos dos docenas de categorías distintas que incluyen diversión, enojo, temor, confusión, desprecio, satisfacción, deseo, decepción, disgusto, angustia, éxtasis, euforia, vergüenza, miedo, interés, Dolor, realización, alivio, tristeza, sorpresa (positiva) sorpresa (negativa), simpatía y triunfo.

Las exclamaciones vocales son bastante antiguas en nuestra evolución, son anteriores a la palabra hablada y universales

Aproximadamente una docena de ráfagas vocales se reconocen de manera clara en diferentes culturas, incluidas culturas antiguas, conforme al estudio de 2015. “Se observan explosiones vocales en una amplia variedad de mamíferos, lo que sugiere que hay una profunda universalidad en estas formas de comunicación. Son bastante antiguas en nuestra evolución y anteriores a la palabra hablada, por lo ques on una forma muy antigua de comunicación humana universal”.

Esto… ¿para qué sirve?

El algoritmo es capaz de representar porcentualmente los matices. Y ahí es donde está el interés de las empresas tecnológicas. En pleno boom de los asistentes virtuales y el reconocimiento de voz, Keltner reconoce que Google Empathy Lab se ha interesado en su estudio. Para estas empresas, reconocer patrones de emoción en las voces de sus usuarios aporta una valiosísima información a la hora de perfilarlos y pronosticar patrones de comportamiento.

Google Empathy, en concreto, es el laboratorio encargado de entrenar a sus inteligencias artificiales en sus relaciones con humanos y la interpretación de sus mensajes y los matices no literales de la comunicación tanto verbal como no verbal. Es decir, la división de Google que trata de hacer un poco más humanas –o que lo parezcan– a sus redes neuronales artificiales.

Google Empathy, que enseña a las máquinas a relacionarse con humanos, se ha interesado en este proyecto

En cuanto a los usos clínicos, el mapa podría, en teoría, guiar a los profesionales médicos e investigadores que trabajan con personas con demencia, autismo y otros trastornos del procesamiento emocional para que se centren en los déficits específicos relacionados con la expresión de ciertos sentimientos.

Para Cowen, “sería posible contrastar los sonidos para ver si el paciente está reconociendo diferencias de matices entre, por ejemplo, asombro y confusión”.

El estudio sugiere que los humanos están tan en sintonía con las señales no verbales, como los “gugugú” que se entablan entre padres y bebés, y que podemos detectar las diferencias sutiles entre sorpresa y alarma, o una risa divertida o una risa nerviosa.

De hecho, el de las risas es un territorio muy interesante: “Un recorrido a través de la diversión revela el rico vocabulario de la risa, pero también da una vuelta a los sonidos de la adoración, la simpatía, el éxtasis y el deseo; pueden decirte más sobre la vida romántica de lo que podrías esperar”, apunta Keltner. Los matices de la diversión. Los sutiles grados de la pasión. Ahora, también los manejan las máquinas.

logo
De la risa al gemido: el primer atlas sonoro de las emociones