|

Tendencias tecnológicas en producción Broadcast

No puedo negarlo, me apasiona el mundo audiovisual, y el proyecto Ingestia me da la excusa perfecta para profundizar en las tendencias tecnológicas que están redefiniendo el medio televisivo y la producción de contenidos para este medio.

Algunas de estas tecnologías llevan ya unos años con nosotros, otras todavía están en fases más experimentales, pero cuyos conceptos ya han calado en los modelos de producción audiovisual actual poniendo de relieve el empleo de soluciones cloud como parte indispensable del modelo a corto plazo :

Ponte cómodo ¡Empezamos!

De la TV lineal a la TV conectada

La introducción en el mercado de la TV conectada (CTV) y la aparición de los servicios OTT o TV por streaming (el contenido que se muestra directamente a los espectadores a través de un servicio de streaming de vídeo por Internet, sin pasar por la televisión por cable tradicional), trae consigo la convivencia de la “televisión lineal” con nuevas formas acceso al contenido como:

  • La TV en todas partes (TVE), también conocido como streaming autenticado o vídeo autenticado bajo demanda (VOD) permite a los consumidores acceder al contenido de entretenimiento que deseen por internet estén donde estén, simplemente con las credenciales de inicio de sesión de su servicio de suscripción.
  • Vídeo bajo demanda (VOD) aquel al que el usuario puede acceder cuando lo desee al contenido de su elección, en otras palabras, hablamos de servicios como Netflix, HBO Max, Apple TV… Hay cuatro tipos principales de VOD, en función del tipo de contrato que se establece por los servicios:
    • Vídeo bajo demanda por suscripción (SVOD): pagas una cuota periódicamente para acceder al servicio. P.e. Filmin.
    • Vídeo bajo demanda transaccional (TVOD): pagas por cada cosa que puedes ver. P.e. Rakuten TV.
    • Vídeo bajo demanda con anuncios (AVOD): en lugar de pagar, admites el visionado de publicidad. P.e. Freevee (Amazon) o los canales de TDT tradicional en sus versiones a bajo demanda.
    • Vídeo bajo demanda premium (PVOD): se ofrecen contenidos exclusivos a un precio más alto (por ejemplo estrenos, o calidades de reproducción superiores). P.e. DAZN además de la suscripción tiene un modelo PPV (pay per view) para determinados eventos.

Más allá de la simple reproducción de contenido, la TV conectada ofrece nuevas posibilidades de interacción para el usuario, convergiendo con las que pueden ofrecer los smartphones, PC o videoconsolas.

Adaptar los procesos de producción a la TV conectada

Todas estas nuevas posibilidades a nivel de consumidor, tienen su reflejo en la aparición de modelos de producción de contenidos audiovisuales tecnológicamente más complejos, que deben considerar diferentes contextos de consumo. Los diferentes dispositivos; la situación del usuario (consumo grupal o individual, usuario premium o estándar…); la demanda de más libertad y profundidad a la hora de relacionarse con el contenido… La producción, ya no puede limitarse a ordenar cronológicamente fragmentos de vídeo (contenidos lineales), debe ofrecer diferentes capas de información que completen su experiencia.

Esta mayor complejidad, podría ser paralizante a la hora de generar contenidos en directo, ya que podría dilatar enormemente los tiempos de producción. Surge por tanto, la necesidad de nuevas herramientas, que se integren en la operativa de captura, edición y retransmisión y que agilicen procesos críticos sobre la marcha.

Para este contexto de producción de contenidos en directo, en Quobis estamos abordando dentro del proyecto de innovación Ingestia (financiado por los fondos NextGeneration EU) diferentes enfoques basados en WebRTC y herramientas de Inteligencia Artificial, tales como el etiquetado automático de contenido, la transcripción, o la edición asistida.

Object based media

Enfoque BBC (object based media)

Este enfoque, todavía experimental, le da la vuelta a la producción tradicional de contenidos. Si tradicionalmente la secuencia es/era:

  1. Captura a través de herramientas tradicionales (videocámaras, repositorios de fotos, videos audios…)
  2. Producción lineal (es decir, los contenidos ordenan en una secuencia temporal, para ser consumidos estrictamente en esa misma secuencia).
  3. Distribución broadcast de un contenido único, paquetizado y procesado para toda la audiencia.
  4. El mismo contenido es reproducido en diferentes dispositivos, con el compromiso de ofrecer una experiencia similar en todos ellos.

El planteamiento de una producción basada en objetos sería algo de este estilo:

  1. La captura tradicional de contenidos se combina con metadatos procedentes de diferentes fuentes. Estos contenidos + metadatos son objetos (p.e. Una fotografía con la descripción de las personas que aparecen en ella, y enlaces a las biografías de estas en la Wikipedia o a videos de entrevistas anteriores).
  2. En lugar de producir un contenido lineal (secuencial), se generan “colecciones de objetos” por las que la audiencia puede navegar en función de sus intereses.
  3. La distribución broadcast, se acompaña de metadatos que describen las diferentes maneras en la que los objetos pueden ser combinados.
  4. El contexto de reproducción condiciona enormemente la experiencia del usuario, de manera que los “objetos “ son presentados de forma diferente según el dispositivo y sus preferencias (pantallas tv, tablets, gafas de VR, radios convencionales, altavoces inteligentes…). Incluso se pueden presentar elementos de interactividad para que el usuario pueda tomar un camino diferente en cualquier momento, detener la historia y profundizar en el personaje, ver información relacionada con elementos que aparecen en pantalla, o pausar su reproducción y continuar posteriormente desde un dispositivo diferente.

Esta forma de producir contenidos, pone una gran presión sobre el aporte de información extra, a través de metadatos que complementen su valor y permitan crear experiencias más completas y profundas. Este tipo de manera de producir contenidos, especialmente en su planificación, tiene más similitudes con la creación de contenidos para webs que con la producción audiovisual tradicional, aunque ojo, no podemos decir que la sustituya sino que la amplía.En Quobis, hemos decidido abordar este desafío de enriquecimiento de contenidos audiovisuales con metadatos. Usando inteligencia artificial, podemos describir el contenido, y convertir estas descripciones en metadatos, que a su vez sirvan para acceder de forma no lineal al contenido audiovisual durante el proceso de producción.

Enfoque Amazon (X-rayAPI)

Hace ya algunos años que Amazon entró en el mercado del streaming de consumo, compitiendo con Netflix, a través de su app Prime Vídeo.

De entrada Amazon parte con una ventaja competitiva, ya que a través de una subsidiaria suya posee IMDB (la mayor BD sobre películas y series del mundo) desde 1998. Esto pone en sus manos la posibilidad de complementar sus series y películas con una ingente cantidad de información sobre los actores, las bandas sonoras, películas similares… Además, lo hace evitando fugas de usuarios a plataformas de terceros.

Esta conexión con otras fuentes de información, marca el camino hacia nuevas fórmulas de explotación comercial del contenido audiovisual, p.e. usando las series, películas o shows televisivos como alternativa al catálogo tradicional de su ecommerce.

Amazon, explora la posibilidad de ofrecer productos en pantalla, que puedes comprar en las tiendas de Amazon, juegos relacionados con el contenido, posibilidad de compartir contenido con terceros… También representa una nueva experiencia para el consumo de contenidos en directo de eventos deportivos (información sobre los jugadores, estadísticas, repeticiones… y una vez más posibilidad de comprar productos relacionados como merchandising).

Aunque el principio fundacional (complementar contenidos con otros datos), es el mismo que en el caso de la BBC, hay grandes diferencias en la distribución. Si la BBC busca aprovechar las características específicas de cada hardware de reproducción, Amazon trata de reproducir la misma experiencia con independencia del hardware, basando su tecnología en HTML (consumible a través del uso de cualquier navegador web) u ofreciendo APPs para IOS y Android (para todo tipo de pantallas: tv, móvil, tablet) e incluso propone el uso de hardware específico a precios relativamente accesibles (Fire Stick.. ) para adaptar “hardware legacy” que no dispone de las capacidades necesarias de partida.

La mastodóntica dimensión de esta empresa (Amazon) le permite buscar un enfoque universal y a la vez privativo, es decir, intenta llegar a todo el mundo ampliando su ecosistema, que controla y administra en solitario. Esta es una estrategia de integración horizontal que hemos visto en otras grandes tecnológicas como Google, Apple, Alibaba, Rakuten… y que en algunos casos coquetea con prácticas “monopólicas” que tienen bajo alerta a las autoridades (al menos Europeas) que en cualquier momento pueden obligar a fragmentar estas empresas y separar sus verticales, abriendo el juego, al menos sobre el papel, a la entrada de nuevos players.

Social TV

El consumo colectivo de contenidos broadcast, tiene su origen en la gran expansión de las redes sociales, la democratización de los servicios de comunicación en tiempo real y en el fenómeno del consumo “multiscreen” (usuarios viendo la TV con el móvil en la mano).

Los que mejor han sabido construir una oferta en torno al consumo social de contenidos, son las plataformas nativas digitales orientadas al mundo del gaming, con una audiencia más joven y muy familiarizada con la tecnología (Twitch, Youtube, Discord…), cuya convergencia con el mundo broadcast tradicional se está produciendo tan lenta como irremediablemente.

También las plataformas sociales, como Instagram o Tiktok, con un diseño “mobile first” y orientadas a un consumo individual, buscan su espacio en el salón, ofreciendo apps para Smart TV. Como curiosidad, hace algunos años Samsung presentó “The Sero” una TV que rotaba para convertirse en una pantalla vertical, que pudiese recibir mejor los vídeos verticales de estas redes, que copan la mayor parte del tiempo de exposición a medios de su población objetivo.

Netflix, ha sido pionero de forma involuntaria en esto del social TV para contenidos broadcast, con la aparición del complemento “no oficial” para navegadores Netflix Party (>2018), con el que un usuario podía hostear una sesión de cine y compartirla con sus amigos a través de un reproductor similar al de Youtube. Obviamente que solo pagase uno, y lo pudiesen ver muchos es algo que a Netflix no le gustó, pero que todavía no ha logrado bloquear. Recientemente, un popular streamer (xQC) fichado por un nuevo competidor de Twitch (Kick, propiedad del “criptocasino Stake”) tuvo que interrumpir una especie de “watch party” durante un directo en el que compartía con su audiencia el visionado de la película “El caballero oscuro” por infringir los derechos de autor de Warner.

Esta cuestión de los derechos sobre el contenido, es más complejo de resolver que la propia cuestión técnica.

Al abrigo de la Pandemia, y de la demanda de socialización de una población recluida en sus casas, las plataformas de contenido como Disney (GroupWatch 2020), Prime Vídeo (WatchParty 2020), Apple (SharePlay 2021) integran de diferentes formas la posibilidad de ver de manera sincronizada mismo contenido con otros espectadores en remoto, ofreciendo además la posibilidad de interactuar con ellos durante la retransmisión. En la práctica es una funcionalidad muy secundaria, y generalmente limitada. En primer lugar por la necesidad de que ambos espectadores posean su propia cuenta de usuario en la plataforma propietaria del contenido, en segundo lugar porque la experiencia de interactividad a través de TV sigue siendo una asignatura pendiente, aunque se ataje en parte con experiencias multidispositivo (veo la TV mientras chateo con el móvil).

En Quobis también hemos experimentado desde 2016 con el Social TV, a través de nuestra plataforma WebRTC, ofreciéndo una solución de Social TV como servicio OTT a operadores y fabricantes que pueden incluirlo como una funcionalidad nueva en sus Set Top Boxes. La idea es sencilla, un visor de contenido unido a un panel con un chat o videoconferencia activo durante la retransmisión.

Aunque no hemos logrado introducir en el mercado nuestra solución de Social TV, ha sido la base para otros proyectos que sí han tenido el respaldo de grandes empresas fuera del mundo broadcast, enfocadas por ejemplo a entornos profesionales como son los comités médicos (eHealth).

Live Streaming

Empresas como USTREAM (2016) ahora parte de IBM o Livestream (ahora integrada en Vimeo), fueron pioneras en la fusión de social media y el broadcasting, ofreciendo a los creadores de contenidos herramientas online de edición de video, la posibilidad de combinar diferentes fuentes de video por internet, y un reproductor (player) fácil de embeber en Web con un backend de administración solvente para gestionar la conversación que se pudiese dar en el chat que incluía el reproductor.

El contexto en 2016 era sustancialmente diferente al actual. El consumo de video por internet estaba prácticamente restringido al PC, con unas tarifas de datos móviles mucho más limitadas que las actuales. Las plataformas de streaming (Netflix, HBO, Primer Video) no habían irrumpido en el mercado, y la convergencia de contenido broadcast con internet apenas era un planteamiento teórico.

Estas empresas, fueron absorbidas por las grandes tecnológicas, pero han definido sin lugar a dudas el modelo de creación de contenidos moderno, en el que podemos incluir el modelo actual de Youtube, Twitch, Tick Tock, Facebook… con un foco innegable en ofrecer herramientas a quienes generan el contenido.

Quizás la gran diferencia de las plataformas modernas con el modelo original de Livestream o Ustream, es que el que “paga” es el productor del contenido por uso de la plataforma. En las versiones gratuítas, el contenido podía ser interrumpido con cierta frecuencia por anuncios, además de estar más limitado en cuanto a la calidad de la imagen de retransmisión permitida, o número de fuentes de vídeo conectadas.

A nivel de distribución Ustream, ya ofrecía un concepto descentralizado, dando facilidades para que el contenido generado pudiese ser compartido fácilmente en otras plataformas (p.e. Youtube).

En la actualidad, muchos creadores de contenido buscan optimizar la distribución de su contenido independizandose de una plataforma en concreto. Soluciones como OBS (programa open source, empleado por la mayor parte de streamers), facilitan esta distribución descentralizada, ofreciendo una plataforma de producción solvente para las necesidades de los streamers, capaz de combinar el uso de fuentes de diferente origen (local o web) y cuyo output pueden integrar con diferentes canales de distribución (Youtube, Twitch…).

Si bien OBS es un software que se ejecuta en local, también nos podemos encontrar en el mercado soluciones de producción broadcast cloud y orientadas al sector profesional como Flowics, que ofrece una alternativa cloud a uno de las herramientas más habituales en una cabina de realización, el equipo de grafismos. Además Flowics va más allá de sustituir una herramienta de rotulación, ofreciendo herramientas de interactividad basadas en el concepto de segunda pantalla (p.e. Quiz para responder desde el móvil durante un concurso tv). Este caso, es un buen ejemplo, de cómo esta evolución hacia solucionescloud, no se puede limitar al simple clonado de una funcionalidad y debe explorar las nuevas capacidades del ecosistema digital del usuario.

La importancia de estos players pioneros, es que han puesto sobre la mesa algunas de las necesidades críticas de los sistemas de producción de contenidos en directo actuales:

  • Capacidad de admitir diferentes fuentes de video/audio a través de internet.
  • Capacidades de edición lineal básicas: transiciones, pasar de un contenido al siguiente, rotulación, introducir diferentes pistas de audio.
  • Distribución de contenido producido a través de APIs.

NFT y blockchain

El IBC, posiblemente la feria de la industria audiovisual más importante de Europa y a la que Quobis ha tenido el placer de asistir en varias ocasiones, bien como expositores, speakers o visitantes , presenta en su programa topics como este “multi-platform delivery” , “OTT” & “monetisation of content”…

Fijémonos por un momento en la monetización de contenidos, y en cómo tecnologías como los NFTs y el blockchain permiten nuevos modelos de negocio, frente a la tradicional cadena de valor (productora > canal > anunciante) restringida a unos pocos players hacia un contexto más abierto.

Entre 2021 y 2022, el segmento de las competiciones deportivas, pioneras en el uso de NFTs, dobló su volumen de negocio alcanzando los US$2 billones, con más de 4 millones de fans comprando NFTc coleccionables. Esto es solo un ejemplo, pero nos da una idea de la dimensión económica de estas tecnologías en los medios.

Tal vez, al público español esto de resulte exótico, o tenga la sensación de que es algo que se está cocinando en exclusiva en el mercado USA, pero sirva como ejemplo el hecho de que LaLiga, haya llegado a un acuerdo con Sorare, un marketplace de “cromos” digitales, para entrar en el mundo de los NFTs.

Cuando se habla de cuestiones relacionadas con blockchain, enseguida surgen los fantasmas resultantes de prácticas especulativas con criptomonedas, así como el impacto medioambiental de este tipo de tecnologías. Parece que pasado el hype inicial, la tecnología empieza a demostrar su madurez para otros casos de uso. El hecho de que Ethereum, haya conseguido reducir su consumo de energía un 99,95%, tiene un impacto muy positivo en el sector de los medios, ya que la mayoría de de las aplicaciones de NFTs usan Ethereum.

¿Para qué sirve un NFT?

Los NFT permiten demostrar la propiedad y los derechos de uso de cualquier contenido digital mediante la asignación al contenido de un identificador específico no duplicable que se registra en una base de datos distribuida, o cadena de bloques, normalmente Flow o Ethereum.

La propiedad de un NFT puede incluir, aunque no es obligatorio, la propiedad del activo digital subyacente. Por ejemplo, en el caso concreto de los NFT deportivos vendidos hasta la fecha, la mayoría no tienen derechos de propiedad o uso en los medios subyacentes. Dicho en otras palabras, el propietario de un NFT de un vídeo con el punto más espectacular de la jornada en la NBA no podrá usar ese contenido para hacer camisetas y venderlas a los fans del equipo.

Cada NFT, incluye un contrato inteligente (smart contract) cuyos términos son aplicables indefinidamente y que se ejecuta de forma inmediata e irrevocable con cada operación.

Derechos de autor y obras derivadas

Los productos audiovisuales, son obras compuestas por diferentes partes (el compositor de la banda sonora, la narración del periodista, la fotografía del cámara…). Los contratos inteligentes, pueden ser empleados para pagar a creadores independientes como autores, músicos y cineastas, sin la necesidad de intermediarios que comisionan por ello.

Al agilizar este proceso, reduciendo la burocracia y evitando la limitación de acceso a materiales de catálogos específicos, el creador del producto final puede disponer de un abanico más amplio de assets al tiempo que se garantiza el pago por el empleo de los assets que conforman la obra final, cada vez que esta es reproducida (salvando las distancias, como sucede cuando escuchas una canción en Spotify pero con un concepto más descentralizado).

Esto puede dar mucha agilidad al proceso de producción, ya que permitiría por ejemplo, meter en un programa de TV un streams en directo de un TikToker, respetando los derechos de autor de cada parte, sin complejos contratos, ya que la pieza queda marcada como una co-autoría desde su creación, y en todas las versiones que se puedan generar en el futuro.

Una nueva era para las agencias de noticias y el periodismo:

La trazabilidad que aporta el blockchain, es una gran ventaja a la hora de garantizar el origen y autoría de una determinada información.

La principal agencia de noticias italiana ANSA, que representa a los 24 mayores periódicos italianos y distribuye unos 3k artículos al día, anunció ya en 2020, el uso de una solución basada en Ethereum para garantizar, que la tanto el contenido en su plataforma como el distribuído en otros sites o medios sociales, son en origen noticias suyas y que no han sido modificadas.

Otra iniciativa, en este caso liderada por “The New York Times Research & Development”, pone su acento en el fotoperiodismo. La premisa de la que parte es que una imagen puede ser fácilmente manipulada y difundida ampliamente a través de redes sociales, mensajería instantánea, buscadores… y que la solución puede ser añadir contexto a dichas imágenes. Por ejemplo: el historial de modificaciones de la imagen, metadatos (hora y lugar, el editor y el pié de fotos original), introducir una marca de agua…

Estas iniciativas nos hablan de cómo asegurar el valor de una información, su veracidad y autoría, aportando información complementaria a los medios compartidos.

Nuevas oportunidades para monetizar los contenidos.

La producción de contenidos, da lugar a un volumen ingente de contenidos que no se llegan a distribuir, pues durante el proceso de edición lineal son descartados para encajar el proyecto en una duración determinada, o en un marco editorial o de producción determinado. Esto supone un creciente coste de almacenamiento, que en principio puede no tener un retorno directo.

Todos conocemos la versión “Directors Cut” de grandes blockbusters, o los contenidos adicionales (muy habituales en los ya defenestrados DVD)… que parecen paliar la frustración de los autores que no han podido desplegar todo el potencial de la obra, por limitaciones de duración o criterios que impuso el productor ejecutivo alejados del criterio artístico.

Contenidos complementarios de valor añadido:

Es un hecho, que cualquier producción genera una serie de subproductos que hoy en día pueden completar la oferta del original, e incluso ofrecerse como experiencias exclusivas o coleccionables.

Marketplace de contenidos:

Ya podemos encontrar en la web, diferentes fórmulas para acceder a los NFTs: comercios, subastas, ferias virtuales de coleccionistas, plataformas de crowdfunding, market places (OpenseaThetadrop)…

Algunas de las mayores productoras de contenidos del mundo, como Fremantle (American Idol, X-Factor…) o FOX ya utilizan estas plataformas para explotar el fenómeno fan, y fidelizar a sus audiencias de diferentes maneras.

Por ejemplo, American Idol (Fremantle), puso a la venta un paquete de cartas digitales (el comprador no sabe lo que le va a tocar), para generar una dinámica de intercambio entre su comunidad de seguidores: ¿qué te ha tocado? ¿Te lo quedas o lo vendes en ThetaDrop (un marketplace)? Además, generaban experiencias combinadas con retransmisión del programa en directo, del tipo, si tienes la carta del artista que ha ganado hoy tienes un premio.

Uno de los grandes desafíos para estos productos es que se mantengan accesibles para grandes audiencias, esquivando las pulsiones especulativas, que terminan por desanimar a los seguidores más acérrimos, realmente vinculados al contenido pero no tanto al aspecto financiero de los NFTs.

Un enfoque más amplio, es el de FOX. Con su mayor éxito “The MaskVerse” (algo así como Mask Singer en España), que a través de la plataforma Eluvio, cubre todo el ciclo transaccional, billetera de medios (wallet) para los usuarios, reventa… siempre con la posibilidad de interoperar con otras plataformas como Ethereum o Solana. Importante, este concepto de apertura a otros canales de distribución.

Interactividad con los contenidos:

Ya hemos visto que las productoras quieren ir más allá de ofrecer un artículo o bien digital coleccionable y profundizar en cómo la audiencia se relaciona con el contenido. Incluso, personalizar la experiencia en función de lo que cada espectador esté dispuesto a hacer a cambio de un contenido diferente o premium, o incluso a cambio de intervenir en decisiones creativas (escoger un final de una serie por ejemplo).

Si hay un nivel máximo de “engagement” es aquel en que la audiencia es partícipe de la propia creación del contenido. En esta línea, el ejemplo de Moviecoin, es tal vez el que lleva más lejos el concepto de crowdfunding, prometiendo que tus NFTs te dan derecho a una participación sobre los beneficios de las películas en las que inviertas.

También hay ejemplos enfocados a la producción TV, como el programa de citas interactivo, lanzado por la criptocomunicadad Mad RealitiesProof of Love, que ha contado con más de 1500 miembros contribuyendo a la co-creación del programa, participando en decisiones tales como escoger quien continúa en el programa o quién es eliminado.

Tokenizar la producción de contenidos, abre la posibilidad de ofrecer contenido premium (o fragmentos de contenido) sólo a quien los pague. Por ejemplo, ¿quieres saber qué hay dentro de la caja? El primero que compre el NFT lo sabrá. En otras palabras, se abren puertas de interacción entre el creador de contenido y la audiencia.

Metadatos de configuración de parámetros de imagen y sonido (Premium / custom / standard)

El ecosistema continúa evolucionando, en parte, gracias a las nuevas capacidades del hardware de reproducción.

Un ejemplo, es la propuesta de Samsung junto con Nifty Gateway, que te permitirá no sólo visualizar y adquirir NFTs en sus TV de gama alta, sino también usar los metadatos adjuntos para modificar los presets de la configuración de tu TV para obtener una experiencia lo más parecida posible a la que el creador del contenido ha previsto.

Inteligencia artificial

Como tecnología habilitadora, la IA está presente en casi cualquier sector, y a muy diferentes niveles. El caso de la producción de contenidos no es una excepción, y en los últimos años hemos sido testigos de una paulatina adopción de estos sistemas, para áreas tan diferentes como la transmisión de señal o la producción de contenidos.

Podríamos definir dos grandes áreas de aplicación de la IA en procesos de producción broadcast:

  • Accesibilidad y documentación:
    • Transcripción
    • Traducción automática
    • Etiquetado de contenidos automatizado
  • Aplicaciones creativas y experiencia del usuario:
    • Creatividades basadas en IAs generativas
    • Plató virtual
    • Personalización

Documentar de forma eficiente todo el contenido generado durante la creación de un programa de televisión como un informativo, con varias emisiones diarias en directo, supone un esfuerzo ingente pero irrenunciable, ya que sólo teniendo bien documentados los assets es posible emplearlos con agilidad para crear nuevos contenidos.Tareas como la transcripción son una exigencia legal, como elemento de accesibilidad para personas sordas. También la descripción del contenido de la imagen, es una funcionalidad cada vez más frecuente y que puede ayudar a personas con problemas de visión a entender el contenido de una imagen.

Estas tareas, tradicionalmente recaen en un equipo de profesionales que clasificaban de una forma estructurada la información, con las limitaciones que esto puede tener y que inevitablemente generan sesgos de todo tipo, ya que el esquema de datos no puede prever todas las posibles necesidades de información futuras, y el tiempo disponible es limitado.

Por su naturaleza, el etiquetado de contenido siempre será una tarea parcial, y siempre existirá la posibilidad de que surjan nuevas necesidades que no se hayan previsto (p.e. tal vez no se hayan etiquetado modelos de vehículos, negocios, edades de personas en segundo plano, lugares, mobiliario urbano, condiciones metereológicas, sonidos, emociones…).

Por ejemplo, imaginemos que queremos recuperar las imágenes en las que D.Trump aparece junto a Storm Daniels. Esta última, puede ser irrelevante para el documentalista hasta que pasa a un primer plano por su denuncia al expresidente, entonces ¿es viable revisar todo el material en el que D.Trump aparece acompañado de otras personas en los últimos 20 años, para ilustrar una nueva noticia? Pues, realmente hasta hace pocos años no habría otra solución que visualizar cientos de horas de archivo para localizar apenas unos segundos de vídeo. Hoy en día, gracias a sistemas de reconocimiento facial, podríamos automatizar esta tarea y simplemente generar ese registro cuando lo necesitemos. No hay necesidad de previsión, simplemente damos un input actual y el sistema revisa el material digitalizado con ese nuevo criterio.

El etiquetado automático, es la base para agilizar los procesos de producción. Ofreciendo un acceso inmediato al profesional creativo, a materiales de archivo que tal vez no se había utilizado antes, a través de una interfaz de texto accesible, que le permite generar prompts en lenguaje natural al estilo ChatGPT.

Además de multiplicar la capacidad de producción de nuevos contenidos, es innegable un impacto positivo en la amortización del archivo de contenidos del que dispone el canal. Un programa como “Cachitos de hierro y cromo” que parte del archivo de TVE, se podría generar en minutos prácticamente con un único prompt como “canciones con nombres de mujer”, “duetos en blanco y negro”, “viedoclips con bailarines”. Ya sólo faltaría añadirle los comentarios de la presentadora y los ingeniosos rótulos de los guionistas.

La transcripción de los diálogos, es también una excelente base de documentación, y un paso previo para la traducción de contenidos en tiempo real. Si juntamos traducción en tiempo real y tecnologías de deepfake, podemos disponer de diferentes streams de video en los que el presentador habla con su propia voz y articula su vocalización en idiomas que desconoce. Esto que parece ciencia ficción ya lo están haciendo empresas como Flawless.

¿Y si vamos más lejos, y creamos contenido de la “nada”? (una “nada” relativa, ya que en el caso de IAs generativas, el sistema se ha entrenado con contenidos preexistentes).

¿Cómo puede ayudar la IA generativa a la creación de contenidos broadcast? Tal vez estemos a años luz de ver a una IA generar un programa de TV completo como sugiere el capítulo de Black Mirror “ Joan is Awful”, pero ya estamos en un momento de madurez suficiente para ayudar a los profesionales. Por ejemplo, generar una pista de background sonoro para reforzar la tensión de una noticia, o como ayuda en los procesos de composición digital (p.e. secuencia de paisajes relajantes). Adobe, la suite creativa más popular del planeta, ya integra soluciones basadas en IA como Firefly con la que realizar ediciones de gran calidad simplemente describiendo con texto lo que quieres obtener (por ejemplo, añadir un cielo estrellado a la foto).

Existen algunas cuestiones legales, que deberán ser resueltas en cuanto a la propiedad intelectual, transparencia y veracidad de estos contenidos generados o alterados mediante IAs generativas. A día de hoy, una imagen creada con Midjourney por ejemplo, no genera unos derechos de autor que puedan proteger la obra frente a copias o usos indebidos. Además parece claro que el contenido creado o modificado con inteligencia artificial deberá ser etiquetado de alguna manera, para que el espectador pueda distinguirlo de contenido “raw”.

Realidad Aumentada

Las capacidades de postproducción avanzadas en tiempo real permiten, facilitan convertir una pequeña habitación en platós de tv infinitos gracias a la realidad aumentada. La experiencia de inmersión es sumamente realista, permitiendo crear experiencias tan explosivas como introducir al comentarista deportivo en mitad de un partido, caminando por la superficie de Marte, o en un fondo submarino.

Las tecnologías de segmentación de imagen, han avanzado impulsadas por los avances en IA. MetaGoogle o Apple han puesto a disposición de los desarrolladores potentes librerías con las que extraer a un objeto o sujeto del resto de la imagen, para posteriormente pegarlo sobre otro fondo. Esto es lo que tradicionalmente se realizaba con un fondo de pantalla verde, y que hoy en día es incluso prescindible. Aplicaciones como Zoom, MS Teams, o Hangout ofrecen una versión a nivel usuario de esta funcionalidad, con la que puedes eliminar o difuminar el fondo de tu imagen durante una videoconferencia. Apple, en la última revisión de su sistema operativo MacOS Sonoma, ofrece esta funcionalidad (Presenter Overlay) integrada en su app FaceTime, compatible con las principales plataformas de videoconferencia.

Las tecnologías de segmentación también pueden ser empleadas para detectar determinados objetos o personas en una imagen, por lo que también ofrece una vía para enriquecer con metadatos un contenido, o incluso sugerir contenido relacionado, o facilitar la venta de productos desde el propio contenido.

In-programme personalisation

Personalización y broadcast parecen a priori conceptos antagónicos. Pero realmente, hay un prometedor espacio de convivencia, en el que un mismo evento pueda ser narrado de diferentes formas adaptadas a los intereses de cada audiencia.

Personalización publicitaria sin interrupción del contenido en curso

Tradicionalmente se asocia la personalización con generación de listas de reproducción personalizadas, guía de programas, product placement y publicidad para los espectadores en cada corte publicitario. Tal vez, lo más interesante sea lo que se puede hacer dentro del propio contenido. Por ejemplo, la empresa 4D Sight, ofrece la posibilidad de mostrar a cada espectador anuncios diferentes dentro del propio contenido, sin interrumpirlo.

Seguro que has visto los típicos banners publicitarios rodeando el terreno de juego de un partido de fútbol, pues la tecnología de esta empresa permite presentar diferentes creatividades en ese espacio, con las que alimentar la señal de diferentes cadenas de TVs en todo el mundo.

Personalización de rótulos

Algunas propuestas de personalización, abordan la posibilidad de personalizar los rótulos/grafismos durante el directo, de manera que cada espectador pueda ser impactado con un mensaje especialmente diseñado para él. El problema que surge, es que tradicionalmente los rótulos son codificados junto con el vídeo antes de la retransmisión , por lo que es complicado modificarlos posteriormente, y en caso de que el algoritmo escoja una calidad de reproducción baja, por ejemplo por una velocidad lenta de la conexión a internet en reproducción, los gráficos también serían escalados hasta el punto de resultar ilegibles.

La tecnología “DASH in-band events” (2017), se basa en conceptos de superposición de gráficos de TV personalizados en el lado del dispositivo (reproductor), nos permite separar la información de video y de los gráficos, puede ayudar a desvincular la calidad de ambos, de manera que podríamos mantener una alta calidad de grafismos aunque el video pierda resolución. Las aplicaciones de este tipo de mensajes personalizados pueden ir desde presentar productos personalizados, información relevante (p.e. la previsión del tiempo en tu zona), acceso a contenido premium (p.e. Regalos como QR que den acceso a un NTF exclusivo).

Realización personalizada

Partiendo de una producción por objetos, es posible adaptar la propia edición del contenido sobre la marcha y con ayuda de IA, al usuario final.

Por ejemplo, si consumes el contenido desde un móvil, la IA te podrá ofrecer una versión resumida, evitará planos demasiado abiertos y difíciles de visualizar en pantallas pequeñas, bajará la música para favorecer que se entienda la voz, o incluso te ofrecerá subtítulos por defecto, ya que en muchos casos el video en smartphones se reproduce sin audio (algo que se ha impuesto por hábito sociales, no por motivos tecnológicos).

Otro ejemplo podría ser, adaptar la realización de un evento deportivo en función del equipo que más te gusta (dando más planos de los jugadores de tu equipo, de tu afición en las gradas…); o adaptar la presencia de contenido explícito (violento o sexual) en función de la edad del espectador o de sus preferencias.

Reflexiones finales

Aunque podemos decir que estamos en un etapa temprana en esta nueva era del entretenimiento de masas, la realidad es que ya se vislumbra un contexto donde el usuario será el pilar sobre el que se construyan experiencias a su medida. La relación con el contenido no será necesariamente pasiva, y los nuevos modelos de negocio buscarán capitalizar al máximo posible los contenidos creados explotando la fidelidad de sus audiencias.

La integración de los sistemas de producción y distribución de contenidos con plataformas cloud es inevitable, ya que favorece el uso a demanda de servicios y una integración inmediata de las herramientas en los procesos de producción, con un compromiso de inversión contenido.

Posiblemente veamos un modelo similar al de los CPaaS, con diferentes proveedores añadiendo capacidades o interviniendo en procesos específicos, poniendo del lado de la productora agregación de servicios que configura su set de herramientas “best-of-bred”. Algunos elementos de esa infraestructura abrirán sus marketplaces a integraciones con esos servicios, siendo una forma de evolucionar sus capacidades a través de terceros.

Desde el proyecto de Ingesta, estamos abordando este enfoque, generando servicios cloud que solucionan necesidades específicas del proceso de producción broadcast (transcripción, etiquetado automático de contenido para enriquecimiento de metadatos, procesados de imagen (sustitución de fondos), simulcast…).

Publicaciones Similares