Fraunhofer Audio Blog

Norwegischer TV Sender NRK demonstriert Streaming Service zur Fußball-WM mit interaktivem Audio und MPEG-H

16. Juli 2018 | Category: Audio, Broadcasting, Erfolgsgeschichten, Hinter den Kulissen
© NRK/Fraunhofer IIS

Der norwegische öffentlich-rechtliche Rundfunksender NRK und das Fraunhofer IIS haben den ersten Test eines Ende-zu-Ende AV-Streaming Services mit dem Next Generation Audio (NGA) Codec MPEG-H in Skandinavien durchgeführt. Bei der Übertragung der Fußball-Weltmeisterschaft 2018 aus Russland wurden insbesondere die Vorteile der Interaktivität für den Ton demonstriert. Im NRK Gebäude in Oslo konnten sich Vertreter von norwegischen Rundfunkanstalten, Technologieunternehmen und andere eingeladene Experten von den Möglichkeiten überzeugen, die die MPEG-H Audio Technologie bietet.

Während der Vorführungen konnte man zwischen Kommentatoren des norwegischen, dänischen und schwedischen Fernsehens sowie von NRK Radio umschalten und so die bevorzugte Sprache einstellen. Auch eine Variante ganz ohne Kommentator konnten die Testpersonen dank MPEG-H Audio auswählen und damit die Stadionatmosphäre in 5.1 Surround-Sound direkt erleben. Weitere Optionen waren, die Lautstärke des Kommentators anzuheben, um die Sprachverständlichkeit zu verbessern oder die Wiedergabeposition des Kommentators zu verändern.

MPEG-H metadata authoring in the Junger MMA © Jünger Audio

MPEG-H Metadaten Authoring in der Jünger MMA © Jünger Audio

Das Jünger Audio Multichannel Monitoring and Authoring (MMA) System wurde in die SDI Infrastruktur von NRK integriert, um die SDI Zuspielung zu empfangen. In der MMA wurden alle vier Kommentatoren als Objekte definiert, die vom Zuschauer verändert werden konnten. Zusätzlich wurden einfache vordefinierte Presets erzeugt: Standard-TV-Mix, Dialogue+ (bessere Verständlichkeit der Kommentare), nur Kommentator (ohne Stadion) und nur Stadionton (ohne Kommentator). In welchem Umfang der Zuschauer das Signal verändern kann, wurde ebenfalls vorab vom Sender in den MMA Einstellungen festgelegt. Die so erzeugten Metadaten wurden dann als 16. Spur des SDI Stroms zusammen mit den unkomprimierten Audio Signalen auf den anderen Spuren dem Encoder zugespielt.

Zum Erzeugen des MPEG-H Live Streams kam der Fraunhofer Echtzeit DASH Encoder zum Einsatz. Der Stream wurde dann in ein anderes Gebäude auf dem NRK-Campus übertragen und in einem zum Wohnzimmer umfunktionierten Büro vorgeführt. Der DASH-Stream wurde von einer MPEG-H-fähigen Android Set-Top-Box empfangen, die  an das Fraunhofer Referenzdesign einer 3D Soundbar angeschlossen war. Die Set-Top-Box ermöglichte die Interaktivität, indem sie die verfügbaren Optionen auf dem Bildschirm darstellte und die Eingaben des Zuschauers über die Fernbedienung registrierte und in den MPEG-H Strom für die Weiterleitung an die Soundbar einfügte. Diese decodierte den Datenstrom und setzte die Änderungen des Zuschauers um. Das Ergebnis war ein raumfüllendes Klangbild, ohne dass viele Lautsprecher im Wohnzimmer installiert werden mussten. Die Zuschauer konnten mit Hilfe der Presets, die bevorzugte Sprache auswählen sowie die Lautstärke des Kommentars beeinflussen oder über ein erweitertes Menü die Lautstärke-Balance zwischen Kommentator und Liveatmosphäre des Stadions einstellen. Zudem konnte der Kommentator vom Bildschirm weg, hin zu einer anderen Position im Raum bewegt werden.

Mehr über MPEG-H erfahren Sie hier http://www.iis.fraunhofer.de/tvaudio und hier  http://www.mpegh.com.


Kommentarfunktion geschlossen