Ingestia | Inteligencia Artificial y producción Broadcast

19 febrero 2024

Inteligencia artificial

Como tecnología habilitadora, la IA (inteligencia artificial) está presente en casi cualquier sector y a muy diferentes niveles. El caso de la producción de contenidos no es una excepción, y en los últimos años hemos sido testigos de una paulatina adopción de estos sistemas, para áreas tan diferentes como la transmisión de señal o la producción de contenidos.

Podríamos definir dos grandes áreas de aplicación de la IA en procesos de producción broadcast:

  • Accesibilidad y documentación:
    • Transcripción
    • Traducción automática
    • Etiquetado de contenidos automatizado
  • Aplicaciones creativas y experiencia del usuario:
    • Creatividades basadas en IAs generativas
    • Plató virtual
    • Personalización

Accesibilidad y documentación:

Documentar de forma eficiente todo el contenido generado durante la creación de un programa de televisión como un informativo, con varias emisiones diarias en directo, supone un esfuerzo ingente pero irrenunciable, ya que sólo teniendo bien documentados los assets es posible emplearlos con agilidad para crear nuevos contenidos. Tareas como la transcripción son una exigencia legal, como elemento de accesibilidad para personas sordas. También la descripción del contenido de la imagen, es una funcionalidad cada vez más frecuente y que puede ayudar a personas con problemas de visión a entender el contenido de una imagen.

Estas tareas, tradicionalmente recaen en un equipo de profesionales que clasifican de una forma estructurada la información, con las limitaciones que esto puede tener, y que inevitablemente generan sesgos de todo tipo, ya que el esquema de datos no puede prever todas las posibles necesidades de información futuras, y el tiempo disponible es limitado.

Por su naturaleza, el etiquetado de contenido siempre será una tarea parcial, y siempre existirá la posibilidad de que surjan nuevas necesidades que no se hayan previsto (p.e. tal vez no se hayan etiquetado modelos de vehículos, negocios, edades de personas en segundo plano, lugares, mobiliario urbano, condiciones metereológicas, sonidos, emociones…).

Por ejemplo, imaginemos que queremos recuperar las imágenes en las que D.Trump aparece junto a Storm Daniels. Esta última, pudo haber resultad irrelevante para el documentalista hasta que pasa a un primer plano por su denuncia al expresidente, entonces ¿es viable revisar todo el material en el que D.Trump aparece acompañado de otras personas en los últimos 20 años, para ilustrar una nueva noticia? Pues, realmente, hasta hace pocos años no habría otra solución que visualizar cientos de horas de archivo para localizar apenas unos segundos de vídeo. Hoy en día, gracias a sistemas de reconocimiento facial, podríamos automatizar esta tarea y simplemente generar ese registro cuando lo necesitemos. No hay necesidad de previsión, simplemente damos un input actual y el sistema revisa el material digitalizado con ese nuevo criterio.

El etiquetado automático, es la base para agilizar los procesos de producción, ofreciendo un acceso inmediato al creador de contenidos, a materiales de archivo que tal vez no se habían utilizado antes, a través de una interfaz de texto accesible, que le permite generar prompts en lenguaje natural al estilo ChatGPT.

Además de multiplicar la capacidad de producción de nuevos contenidos, es innegable un impacto positivo en la amortización del archivo de contenidos del que dispone el canal. Un programa como “Cachitos de hierro y cromo” que parte del archivo de TVE, se podría generar en minutos prácticamente con un único prompt como “canciones con nombres de mujer”, “duetos en blanco y negro”, “viedoclips con bailarines”. Ya sólo faltaría añadirle los comentarios de la presentadora y los ingeniosos rótulos de los guionistas.

La transcripción de los diálogos, es también una excelente base de documentación, y un paso previo para la traducción de contenidos en tiempo real. Si juntamos traducción en tiempo real y tecnologías de deepfake, podemos disponer de diferentes streams de video en los que el presentador habla con su propia voz y articula su vocalización en idiomas que desconoce. Esto que parece ciencia ficción ya lo están haciendo empresas como Flawless.

Creación de contenidos

¿Y si vamos más lejos, y creamos contenido de la “nada”? (una “nada” relativa, ya que en el caso de IAs generativas, el sistema se ha entrenado con contenidos preexistentes).

¿Cómo puede ayudar la IA generativa a la creación de contenidos broadcast? Tal vez estemos a años luz de ver a una IA generar un programa de TV completo como sugiere el capítulo de Black Mirror “ Joan is Awful”, pero ya estamos en un momento de madurez suficiente para ayudar a los profesionales. Por ejemplo, generar una pista de background sonoro para reforzar la tensión de una noticia, o como ayuda en los procesos de composición digital (p.e. secuencia de paisajes relajantes). Adobe, la suite creativa más popular del planeta, ya integra soluciones basadas en IA como Firefly con la que realizar ediciones de gran calidad simplemente describiendo con texto lo que quieres obtener (por ejemplo, añadir un cielo estrellado a la foto).

Existen algunas cuestiones legales, que deberán ser resueltas en cuanto a la propiedad intelectual, transparencia y veracidad de estos contenidos generados o alterados mediante IAs generativas. A día de hoy, una imagen creada con Midjourney por ejemplo, no genera unos derechos de autor que puedan proteger la obra frente a copias o usos indebidos. Además parece claro que el contenido creado o modificado con inteligencia artificial deberá ser etiquetado de alguna manera, para que el espectador pueda distinguirlo de contenido “raw”.

Next article

Ingestia | Realidad Aumentada y Broadcast

Realidad AumentadaLas capacidades de postproducción avanzadas en tiempo real permiten, facilitan convertir una pequeña ha[...]