La voz es una cualidad inherente al ser humano. El don de hacer vibrar el aire con un sentimiento, una emoción, o simple información, es patrimonio de esta especie, aunque las ballenas nos sigan de cerca. Una IA podrá imitar ese don si es entrenada convenientemente. El objeto de discusión aquí no es que sea técnicamente capaz de suplir a un humano en algo tan importante como el habla. La cuestión es quién, cómo y con qué derecho ha adiestrado y moldeado ese collage eterno, el entramado de píldoras de información que corren por la red para que hable de forma que resulte imposible saber si es una persona quien lo hace o no.

"Descubrimos que la tecnología había desarrollado modelos de voz capaces de descomponer nuestras interpretaciones para crear simulaciones convincentes"

JAIME ROCA, ACTOR DE DOBLAJE

Doblar bien no es fácil. Hacen falta años llenos de días llenos de horas en la penumbra del estudio para encajar, con la expresividad que requiere cada take (toma) la voz del actor extranjero, que puede ser una estrella internacional. El valor de ese patrimonio de nuestros profesionales es incalculable. Sin embargo, la técnica permite extraer todo ese conocimiento y traspasarlo al teclado para su uso inmediato y a un precio que acaba directamente con la costumbre de nuestros fantásticos dobladores de comer todos los días. ¿Eso es ético? ¿Es legal?

Como si se tratase de una invasión extraterrestre de las que aparecen en esas series o películas que escuchamos en sus voces, han llegado unas criaturas sintéticas que parecen haber aprendido a hablar de la nada. Pero nada ni nadie aprende a hablar sin que alguien le enseñe.

Hablo con Jaime Roca, una de esas voces que encarnan a nuestras estrellas. Y lo hago a punto de que comience una de las muchas reuniones nacionales e internacionales que están manteniendo estos artistas para pedir algo que no es evitar el uso de la tecnología, sino que se haga de forma ética y legal. Para ello es vital informar a los profesionales y también, claro, a los que nos asomamos a ese crisol de realidades paralelas que las plataformas nos ofrecen para consumir estos contenidos. Un encuentro muy interesante.

Jaime Roca estaba ante a los asistentes exponiendo verdades como puños contra un sistema que, una vez más, parece operar con la impunidad que ofrece la ignorancia.

Pregunta.- ¿Quién os iba a decir hace apenas un año que os tendríais que movilizar ya para que se regulase cómo las máquinas harían vuestro trabajo?

Respuesta.- Lo que nos ha ocurrido ha sido muy repentino. Esto era ciencia ficción. Pero de repente, hace aproximadamente un año, vimos que la cosa era real. Hubo unas convocatorias en un estudio de Madrid que resultaron muy raras porque eran para grabar emociones. Nos pusimos a investigar y descubrimos que la tecnología había desarrollado modelos de voz capaces de descomponer nuestras grabaciones e interpretaciones para crear simulaciones convincentes.

P.- Entonces, Jaime, ya estamos ante algo irregular. Si convocas una voz para una locución no es para entrenar a una máquina, ¿verdad?

R.- Exactamente. Estamos hablando de conceptos distintos. No es solo grabar una actuación para exhibirla, sino que se está generando una herramienta que descompone y cuantifica nuestras interpretaciones. Esto alimenta un inmenso banco de datos con el objeto de simular emociones. Por ejemplo, si escribo "hola” y especifico que lo ha de decir enfadado, la máquina genera una interpretación de enfado basada en ejemplos previos. Estamos hablando de algo que trasciende el uso normal de nuestras voces.

P.- ¿Estás diciendo que se están usando vuestras interpretaciones sin el permiso necesario para entrenar estas máquinas?

R.- Exactamente. La alimentación de estos modelos de voz se ha hecho mediante minería de datos, tomando ejemplos de Internet y otros lugares. Por ejemplo, cuando antes de entrar en una web te piden que demuestres que eres humano identificando imágenes poco claras de motos, coches o semáforos. En ese momento, sin saberlo y sin recibir ninguna contraprestación, estás entrenando a una IA que algún día ha de conducir un vehículo o interpretar la imagen de una cámara.

"No estamos en contra de la evolución tecnológica, queremos que se reconozca y remunere nuestro trabajo y experiencia"

Nadie les obliga a decirte qué hacen con ese trabajo de enseñar a identificar objetos. Hay un cierto vacío legal que hace difícil atacar esto. Lo que estamos haciendo es reaccionar e intentar que no se haga de manera fraudulenta. No estamos en contra de la evolución tecnológica, queremos que se reconozca y remunere nuestro trabajo y experiencia como profesionales.

P.- Entonces la lucha no es por evitar el uso de la IA, sino por una regulación justa.

R.- Efectivamente. Nuestro trabajo se orienta en dos direcciones. Primero, los ejemplos usados para entrenar las voces artificiales deben estar identificados y contar con permiso de sus autores. Segundo, cuando hables con una máquina o la escuches, debes saber que es una máquina. Estas son las principales vertientes de nuestra lucha por la primera regulación en este campo.

P.- Has mencionado un “vacío legal”, aunque algunos abogados podrían decir que no es vacío, sino falta de regulación específica. Si te convocan para grabar una locución y lo que están haciendo es otra cosa, no estamos hablando de un vacío legal, sino de un fraude, ¿no?

R.- Efectivamente. Por ejemplo, la usurpación de mi voz, que es un dato biométrico, es un delito. Mi voz es única y eso ya está tipificado. El problema no es ese. Hay páginas que son motores de reproducción de voz. Ellos argumentan que no han clonado la voz, sino que han creado modelos para el público. Cuando detectamos que usan una voz concreta sin consentimiento, enviamos requerimientos y lo retiran, pero el mal ya está hecho. No es un vacío legal, sino falta de regulación específica y adecuada. La defensa de estas páginas se basa en decir que no son responsables, pero en realidad son colaboradores necesarios para la comisión de un delito.

P.- ¿Cuál es el objetivo principal de vuestro movimiento?

R.- La regulación debe ser mundial. Soy presidente de un sindicato y formamos una plataforma nacional con otros trece sindicatos y asociaciones. Contactamos con colegas europeos y formamos una federación mundial de sindicatos y asociaciones de artistas de la voz. Hemos presentado enmiendas a la ley europea y algunas han sido aceptadas. La ley europea es la primera que recoge los principios de consentimiento e información. Creemos que es básico ofrecer ambas cosas. Estamos sentando bases legales para evitar fraudes y problemas futuros. En resumen: no se puede permitir que se hagan cosas con tu voz sin tu consentimiento.

"Estamos sentando bases legales para evitar fraudes. No se puede permitir que se hagan cosas con tu voz sin tu consentimiento"

P.- Es un desafío para el legislativo mantenerse al día con estos desarrollos.

R.- Sí, es un desafío complicado. Los tiempos del legislador son muy lentos comparados con el desarrollo tecnológico. Ahora mismo necesitamos presión en todos los frentes para una regulación adecuada. Desde nuestra plataforma nacional hemos propuesto a las distribuidoras de doblaje que los contratos de cesión de derechos especifiquen que no se puede usar nuestra voz para entrenar máquinas que generen nuevas interpretaciones. Hemos redactado una cláusula específica para las sesiones, llevamos presionando desde enero, y ahora estamos negociando con las distribuidoras. Nuestro objetivo es llegar a un acuerdo para establecer bases en este aspecto de los modelos de voz e inteligencia artificial. Los contratos actuales no cubren estos casos, pero estamos trabajando para cambiar eso.

P.- En ocasiones anteriores, como la caída de los precios de las locuciones con la llegada de los estudios domésticos, no ha habido unión entre los profesionales de la voz. ¿Ahora es diferente?

R.- La unión ha sido notable. Hemos logrado agrupar a 13 sindicatos y organizaciones en España, lo cual es un logro significativo, dada la atomización del sector. Además, hemos creado una federación mundial. Estamos unidos ante esta amenaza común, dejando de lado nuestras diferencias. La inteligencia artificial afecta a todos en el sector, desde los estudios pequeños hasta las grandes multinacionales. Las plataformas digitales han ampliado el mercado del doblaje a nivel mundial, y ahora hay interés en usar voces artificiales para satisfacer esta creciente demanda.

P.- Estamos hablando de dar su valor al arte y la expresión creativa. ¿Esto va más allá de frenar una revolución tecnológica?

R.- Exactamente. Necesitamos transparencia y legalidad en este proceso. Es importante que el público sepa si está consumiendo algo producido por una máquina o por un ser humano. Queremos que se reconozca el valor de los sentimientos y expresiones genuinas que solo un ser humano puede crear.

P.- ¿Eres optimista respecto al futuro de vuestra profesión?

R.- Sí, soy optimista. Aunque inicialmente parecía el fin del sector, creo que nuestra capacidad de generar sentimientos auténticos y creatividad nos permitirá seguir adelante. Será un camino difícil, pero confío en nuestra habilidad para adaptarnos y superar estos retos. Informar al público sobre la realidad es fundamental para la transparencia y el respeto a nuestro trabajo.