15 AGO 2023

¿Cómo se aplica la Inteligencia Artificial en la industria creativa?

¿Cuál es la diferencia entre IA Funcional y la IA Generativa? ¿Cuál de ellas aplica a la producción de contenido e impacta en la experiencia del usuario? El contenido informativo y la clonación de voces en el centro de la escena.

15 AGO 2023
null

Jeremias Klausner, BigData & AI Manager de Grupo Globo, bajo la atenta mirada de Paula Chimenti, consultora del Copead/UFRJ.

Compartir
  • Facebook
  • X
  • Linkedin
  • Whatsapp

El lanzamiento de Free ChatGPT en noviembre del año pasado puso en agenda los impresionantes avances de Inteligencia Artificial (IA) y el rápido desarrollo de herramientas basadas en IA es un tema que afecta directamente a la industria creativa. A veces como una oportunidad, otras como una amenaza. La cuestión fue abordada durante el Congreso de Tecnología y Negocios de Medios & Entretenimiento de SET Expo 2023, realizado en São Paulo, Brasil.

"Es una discusión que nos pone ante una encrucijada entre tecnología y creatividad. Por eso es un asunto que ha generado una mezcla de entusiasmo y aprensión", dijo Bruno Souza, Director de Tecnología, Data & AI de Globo, al dar el puntapié inicial como moderador de la conferencia sobre la evolución y los dilemas de la IA Generativa, realizada por Jeremias Klausner, BigData & AI Manager de Grupo Globo. En su presentación, el ejecutivo explicó las diferencias entre la IA Funcional y Generativa.

“La IA Funcional ha estado trabajando durante años como una herramienta para la toma de decisiones en tiempo real que una persona no podría tomar. Este es el caso de un catálogo de streaming, que trae sugerencias personalizadas para aquellos que acceden, actualizados todo el tiempo de acuerdo con la interacción”, explicó Klausner, al tiermpo que distinguió: "La IA Generativa no es aplicada a la toma de decisiones, sino a la generación de contenido. Tiene la capacidad de procesar un volumen de datos gigantesco, contextualizarlos a todos y crear algo a partir de él. Además, aprende a medida que se utiliza, expandiendo su repertorio y volviéndose más precisa".

Crear algo es el punto que pone a la IA Generativa en el centro de un debate cada vez más acalorado. Para la industria creativa, eso brinda la posibilidad de usar IA para varias tareas, como la generación de texto, imagen, audio y contenido de video. Como ejemplo, destacó la creación y manipulación de imágenes con comandos de texto simples y la generación automática de subtítulos, así como las voces que actúan en varios idiomas y que clonan la voz original del actor o actriz.

Klausner reconoció como desafío la cuestión de los derechos de autor, ya que todo el aprendizaje de la IA tiene su origen en el material ya producido por alguien. Otro problema destacado fue el tráfico de búsqueda, que genera monetización para el mercado, ya que una búsqueda realizada a través de IA Generativa no produce el clic en el link, que genera tráfico, afectando a todo un ecosistema dentro de internet. "Sin mencionar los problemas éticos, existe un desafío que se podrá ver en los próximos años: cómo esto afectará a los trabajos en todo el mundo, los riesgos para la seguridad y la privacidad de las personas, ya que todos tenemos nuestros datos online que pueden ser utilizados por el algoritmo".

Para Paula Chimenti, consultora del Centro de Estudios de Estrategia e Innovación en el Copead de la Universidad Federal de Rio de Janeiro, los dilemas que trae la IA Generativa no son nuevos. “Cada vez que una nueva tecnología cambia las reglas del juego, supone la aparición de oportunidades y amenazas. Fue así en el surgimiento de internet". En consecuencia, afirmó que no existe una respuesta categórica sobre cómo deberíamos lidiar con la IA, porque todas las discusiones actuales son muy recientes. “Necesitamos lidiar con esto como sociedad, como organizaciones y como individuos. Vamos a tener que pensar en soluciones conjuntas. Por lo tanto, la participación de todos en el debate es muy importante".

En la visión de Gabriel Carvalho, Director de Cuentas Clave en Google Cloud, existe una diferencia cuando se usa una solución de IA abierta y gratuita -como Google Bard o ChatGPT- y una aplicación cerrada. "Para la industria de los medios, es preciso actuar con calma antes de entusiasmarse y utilizar la IA de forma aleatoria". El ejecutivo hizo una comparación con lo sucedido hace unos años con los chatbots. "Todos querían usarlo, pero no todos habían madurado en la razón y el propósito de aplicar esta tecnología a su negocio. Con la IA pasa exactamente lo mismo. Es una oportunidad con muchos asteriscos. Y antes de utilizarla será necesario pensar qué problema resolverá, cuál es el propósito de usarlo. No es una solución a todo”, resaltó.

Producción de contenido informativo y experiencia del usuario

"En general, la IA mejora la creación, producción y gestión del contenido; optimiza y personaliza las experiencias de la audiencia, facilitando la monetización. No obstante, en la parte creativa sigo creyendo en la intervención humana en el medio del proceso, auditando y validándo informaciones, así como usando la IA como una herramienta adicional", dijo Carvalho.

El ejecutivo hizo referencia a posibles usos en la industria creativa, destacando la búsqueda de información. "Uno de las mayores dificultades de las compañías de medios pasa por encontrar datos: archivos, imágenes y videos. Google no solo expone esta inteligencia de búsqueda de información, sino también una segunda parte, que es nuestro algoritmo de YouTube, que implica la búsqueda contextual de información. Hemos probado con los clientes sin siquiera tener que generar metadatos adicionales, porque todo está en la herramienta de búsqueda". Como ejemplo, citó NY Times, que ahora permite a todos sus suscriptores buscar lo que deseen en su colección. "La información se encuentra automáticamente, siempre que esté disponible online. Las empresas pueden explorar esto como una monetización", sugirió.

En cuanto al contenido periodístico, Carvalho dijo que las utilidades pasan por la generación de sumarios y títulos, que hoy se realizan manualmente, así como las recomendaciones editoriales. "La IA puede, por ejemplo, ayudar al editor a elegir las mejores historias para colocar hipervínculos dentro de los textos. También es capaz de clasificar reportajes, según las categorías definidas por los editores".

De cara a la experiencia del usuario, la IA aparece en las recomendaciones, ya sea en video en la OTT o en informes periodísticos y contenido de texto en general. En este sentido, el ejecutivo puntualizó que Google ya tiene a Starz entre sus clientes, cuya mejora de sus recomendaciones posibilita un aumentó en el engagament y una disminución en la rotación de usuarios. "Al final, todos estos casos están vinculados con la monetización. Las empresas ya cuentan herramientas que pueden comenzar a usar; aunque todavía existen varias que están en etapa de desarrollo", advirtió.

Clonación de voces

La IA utilizada para clonar voces es un tema que también está agenda, especialmente tras las repercusiones de la huelga en Hollywood. Miguel Dorneles, Business Development de Respeecher en América Latina, explicó el estado de situación: "En esencia, la clonación de voz es una tecnología que permite que un humano ejecutar la voz de otro humano. En este sentido, es importante diferenciarla del deepfake, porque estamos hablando de una voz sintética. Respeecher aisla una determinada voz y permite que esta identidad vocal se use para ejecutar otras cosas. Hoy solo es hablada, pero en el futuro podrá ser cantada", expresó.

"Es clave la intención de cada proyecto, es lo que marca la diferencia. La voz sintética es un uso positivo de la IA porque parte de una premisa jurídicamente legal; es decir, que se tiene el permiso y la autorización para usar esa voz. La idea es democratizar la tecnología para que pueda ser usada tanto por los grandes estudios como por el público en general. Todos, incluidos los pequeños productores de contenido, pueden tener acceso a nuestro mercado de voz, que es una base de datos con más de 100 voces ya disponibles", explicó.

Dorneles detalló que el trabajo funciona desde el siguiente paso a paso: Resphecher garantiza los permisos para el uso de la voz; recopila los datos de la voz objetivo; pone el deep learning en escena y convierte los nuevos datos como fuente. A partir de ahí, las aplicaciones son variadas: televisión, animación, doblaje y localización, games, publicidad, podcasts y audiolibros, entre otras. Están disponibles voces consistentes, escalables y creativas. Incluso hay posibilidades para las llamadas "voces de alta demanda", como las de celebridades difíciles de conseguir en un estudio para grabar un comercial, por ejemplo; y para "voces del pasado", de personalidades que ya han muerto.

La conclusión es que, aunque la tecnología permite cosas muy positivas, innovadoras y capaces de transformar por completo la industria, su mal uso puede conducir a problemas ilegales y políticos. "Es importante estar siempre alerta y comprometerse con el uso legal de estas tecnologías, incluida la contribución y difusión de este uso legal. Tiene que haber un disclaimer -una advertencia al público que diga que se trata de una voz generada por AI-, además de la transparencia y el sentido común siempre", concluyó Dorneles.

Notas relacionadas Notas relacionadas