Fehlende Plug-In: Untertitelung // Missing plug-in: Subtitling

KowalskiVU

Vu+ Newbie
(In order to be understood internationally, an English version is also provided at the end of the text . - Um international verstanden zu werden, wird am Ende des Textes auch eine englische Version bereitgestellt.)

Sehr geehrtes BlackHole-Entwicklungsteam,

Ich schätze Ihre Open-Source-Software für digitale Set-Top-Boxen sehr und bin dankbar für ihr langjähriges Bestehen.

Allerdings vermisse ich eine wichtige Funktion: ein Plug-in für die automatische Untertitelung durch Spracherkennung mit künstlicher Intelligenz.

Wozu benötigen wir alle dies?
Viele private, unverschlüsselte und frei empfangbare Fernsehsender bieten oft keine Untertitelung für Nachrichten-, Sport-, und Dokusender sowie bei vielen kleinen lokalen Fernsehsendern. Untertitelung ist in unserem digitalen Zeitalter ein kostbares und unverzichtbares Hilfsmittel, um allen Zuschauern mit Hörbehinderungen und Gehörlosigkeit einen barrierefreien Zugang zu Fernsehmedien zu ermöglichen. Auch anderen Zuschauern können den gesprochenen Inhalt verfolgen, selbst in lauten Umgebungen wie Bars, Clubs oder Fitnesscentern.

Wie sieht das aus?
Aktuell existiert eine Open-Source Künstliche Intelligenz, die eine Spracherkennung besitzt und gesprochene Stimmen schnell in Text umwandeln kann. Es gibt zwei verschiedene, aber identische Open-Source-Systeme: 'Whisperer.cpp' und 'Fast-Whisperer'. Ich stelle mir vor, dass eines der beiden als Plug-In für digitale Set-Top-Boxen entwickelt und eingefügt wird. Die Daten der gesprochenen Stimme werden an das Whisperer-System übermittelt und automatisch in Text umgewandelt. Wenn wir online sprechen, muss die gesprochene Stimme über das Internet mit den Whisperer-Servern verbunden werden. Wenn wir offline sprechen, könnte ein externer USB-Speicherstick genutzt werden (hochwertige digitale Set-Top-Boxen haben oft zwei USB-Anschlüsse). Ein USB-Anschluss kann für das Sprachpaket zur Spracherkennung genutzt werden, um eine automatische Umwandlung in Text zu ermöglichen. Ich denke, dass die Offline-Option eine gute Möglichkeit für alle ist, da nicht immer eine Internetverbindung verfügbar sein muss. Dies gilt insbesondere für Zuschauer in abgelegenen Ortschaften, die nur über Satellit Fernsehen empfangen können.

Whisperer.ccp ttps://github.com/ggerganov/whisper.cpp

Fast-Whisperer https://github.com/SYSTRAN/faster-whisper

Wenn die Anforderungen der Technik nicht ausreichen, sollte die Möglichkeit bestehen, auf andere kostenlose Dienste der Spracherkennung zuzugreifen und sie zu nutzen.

Abschließend möchte ich mich im Voraus für Ihre Bemühungen bedanken, sofern diese realisierbar sind. Ich danke allen, die an der Entwicklung der Software beteiligt sind, und wünsche ihnen viel Erfolg.

---

English version - translated version, translation mistakes possible.

Dear BlackHole development team,

I greatly appreciate your open-source software for digital set-top boxes and am grateful for its many years of existence.

However, I am missing an important function: a plug-in for automatic subtitling using speech recognition with artificial intelligence.

Why do we all need this?
Many private, unencrypted, and free-to-air TV channels often do not offer subtitling for news, sports, and documentary programmes, as well as for many small local TV channels. In our digital age, subtitling is a valuable and indispensable tool for providing barrier-free access to television media for all viewers with hearing disables and deafness. Other viewers can also follow the spoken content, even in noisy environments such as bars, clubs, or fitness centres.

What does that look like?
There is currently an open-source artificial intelligence system that recognises speech and can quickly convert spoken voices into text. There are two different but identical open-source systems: 'Whisperer.cpp' and 'Fast-Whisperer'. I imagine that one of the two will be developed and inserted as a plug-in for digital set-top boxes. The spoken voice data is transmitted to the Whisperer system and automatically converted into text. When we speak online, the spoken voice must be connected to the Whisperer servers via the Internet. If we are speaking offline, an external USB memory stick could be used (high-quality digital set-top boxes often have two USB ports). One USB port can be used for the voice packet for speech recognition to enable automatic conversion to text. I think the offline option is a good option for everyone, as an internet connection does not always have to be available. This is especially true for viewers in remote locations who can only receive television via satellite.

Whisperer.cpp https://github.com/ggerganov/whisper.cpp

Fast-Whisperer https://github.com/SYSTRAN/faster-whisper

If the requirements of the technology are not sufficient, it should be possible to access and use other free speech recognition services.

Finally, I would like to thank you in advance for your efforts if they can be realised. I would like to thank everyone involved in the development of the software and wish them every success.
 
Back
Top