DE / EN
Search
Close this search box.
© Stefan Specht

SCHNELLE, EFFIZIENTE UND SICHERE AUDIO-TRANSKRIPTION MIT WAVERY 

KI UND DAS PROBLEM MIT DEM DATENSCHUTZ

Die praktische Seite von Tools, welche generative künstliche Intelligenz (KI) nutzen, lässt sich kaum noch von der Hand weisen. Egal ob als Alternative zu herkömmlichen Suchmaschinen oder als Helfer im Alltag, ob als Sparringspartner bei kreativen Tätigkeiten, als effektiver Generator künstlicher wie künstlerischer Bilder oder als Werkzeug, um Aufgaben effizienter und schneller zu erledigen – die Einsatzmöglichkeiten, sowohl im privaten Alltag als auch im Job, sind vielseitig. Doch so nützlich diese Werkzeuge auch sein können, bei den meisten steht ein Problem nach wie vor im Raum: die Verarbeitung von Daten.

Denn eine Gemeinsamkeit, die viele dieser Anwendungen teilen, ist, dass sie ausschließlich online funktionieren. Demzufolge werden die Informationen nicht auf dem eigenen Computer verarbeitet, sondern auf einem ausgelagerten Server.

Während es bei der alltäglichen Nutzung für den einen oder anderen gegebenenfalls noch verschmerzbar ist, dass die eingegebenen Informationen verarbeitet werden, sieht das bei sensiblen Daten, wie Angaben zur personenbezogenen Identifikation, noch einmal anders aus.

MEHR PRIVATSPHÄRE MIT WAVERY

Inzwischen gibt es aber auch Alternativen zu den herkömmlichen Tools. Denn einige Anbieter haben Programme entwickelt, die auf dem eigenen Computer installiert werden können und somit auch offline funktionieren. Ein Beispiel hierfür liefert das Berliner Startup Wavery mit der Anwendung “WhisperScript”.

Mit “WhisperScript” können auditive sowie audio-visuelle Aufnahmen transkribiert werden. Das spart dank der einfachen Bedienbarkeit und schnellen Verarbeitung nicht nur Zeit, sondern dient auch dazu, “um Interviews zu zitieren, Zusammenfassungen zu erstellen oder Untertitel für barrierefreie Medien zu produzieren”, wie Jonathan Ho, Co-Founder und CEO von Wavery, im Interview erklärt. Und dabei liegt ein Augenmerk auch auf der Privatsphäre der Nutzer:innen. Damit richtet sich Wavery laut Jonathan Ho ganz klar an all jene, “die mit großen Mengen an sensiblen Daten arbeiten – Medienunternehmen, Creators und Podcasters, aber auch Anwält:innen, Journalist:innen und Akademiker:innen.” Somit können etwa Interviews sicher transkribiert werden, ohne dass die Gefahr besteht, dass Informationen über die interviewten Personen weitergegeben werden.  

Zudem bestehe auch nicht das Risiko, dass die Daten der Nutzer:innen zum Trainieren der KI genutzt werden. Das Tool “WhisperScript” basiert auf dem Open-Source-Sprachmodell “Whisper.cpp”, welches von Wavery zum weiteren Fine-tuning ausschließlich mit Datensätzen trainiert wird, die aus öffentlichen Quellen stammen.

PROBLEME ANALYSIEREN, LÖSUNGEN ENTWICKELN

Neben Jonathan Ho gehört außerdem CTO Kai Shimada zum Gründungsteam von Wavery. Kennengelernt haben sie sich 2020 in Wien. Zu diesem Zeitpunkt hat Kai Shimada dort “Tonmeister” studiert, während Jonathan Ho im Bereich Filmton gearbeitet hat. Den Beginn ihrer Zusammenarbeit markiert ein längeres Gespräch, in welchem sie sich über bestehende Probleme im Arbeitsalltag ausgetauscht haben, sowie darüber, dass sich die Medienbranche oftmals schwer damit tue, neue Technologien zu integrieren.

Dies wollten Jonathan Ho und Kai Shimada angehen. Allerdings hatten die beiden ein Problem: Sie mussten zuerst Programmieren lernen. Dafür hätte die Zeit während Corona eine gute Gelegenheit geboten. Zusätzlich hat Jonathan Ho außerdem den Masterstudiengang “Creative Technologies” an der Filmuniversität Babelsberg KONRAD WOLF absolviert. Das habe ihm auch dabei geholfen, seine Skills noch weiter zu verbessern, wie er berichtet.

Nachdem die beiden Anfang 2020 mit der Arbeit am Projekt begonnen hatten, entstand wenige Monate später der erste Prototyp. 2023 haben sie dann einen Betatest durchgeführt. Daran teilgenommen hatten etwa 4.000 Nutzer:innen. Ziel des Tests war es, mehr über die Bedürfnisse der potenziellen Kund:innen herauszufinden. 

Im Jahr 2024 hat das Team schließlich das EXIST-Gründungsstipendium bekommen, ein Förderprogramm des Bundesministeriums für Wirtschaft und Energie (BMWE). Und im Oktober 2024 folgte die Teilnahme in der zweiten Kohorte des Investment Readiness Programs des MediaTech Hub Accelerators. Hier hat das Gründungsteam laut Jonathan Ho “sehr viele wertvolle Einblicke in den Prozess des Fundraisings bekommen” können. Vor allen Dingen der enge Austausch mit VCs und Expert:innen hat ihnen dabei geholfen, “auch aus ihrer Perspektive zu denken.”

WHAT’S NEXT?

Im Dezember 2024 folgte schließlich der Launch von “WhisperScript”, dem ersten aktuell erhältlichen Programm von Wavery. Und das Tool scheint Anklang zu finden, denn laut Jonathan Ho könne man ein starkes monatliches Wachstum bei den Nutzer:innenzahlen verzeichnen.

Doch “WhisperScript” soll nicht das einzige Angebot im Portfolio von Wavery bleiben. “Wir entwickeln eine Stand-alone-Audio-Suchmaschine, mit der Sounddesigner:innen ihre großen Sound Libraries besser durchsuchen können”, so Jonathan Ho. Natürlich soll auch dies wieder KI-gestützt funktionieren. Darüber hinaus plane das Team aber auch verstärkt in Richtung “Media-Intelligence” zu explorieren, bei dem es um “ein tieferes Verständnis von dem Inhalt des Mediamaterials” geht und nicht nur ausschließlich um die Transkription und Klassifikation.

Um diese Vision weiter vorantreiben zu können, ist das aktuelle Ziel von Wavery, sich für die Phase II des EXIST-Gründungsstipendiums zu bewerben. Außerdem wolle das Team vorerst weiter mit Bootstrapping arbeiten, bevor es sich auch externem Funding zuwendet.

Fotocredit: Wavery

Mehr über den MTH Blog
Die Medientechnologien der Zukunft werden bereits heute angewendet – nicht nur im Entertainmentbereich sondern in den unterschiedlichsten Branchen. Für unseren MediaTech Hub Potsdam Blog sprechen wir einmal im Monat mit Tech-Enthusiast:innen, Unternehmer:innen und Forscher:innen und erzählen die Geschichten, die hinter ihren innovativen Geschäftsmodellen, Ideen, Projekten oder Kooperationen stecken.