Personal Voice: Eigene KI-Stimme in nur 15 Minuten

iOS
Stefan

Mit iOS 17 und iPadOS 17 führt Apple Personal Voice ein. Das Erzeugen einer KI-Stimme, die wie die eigene klingt, dauert normalerweise mehrere Wochen. Auf dem iPhone ist das Ganze in 15 Minuten erledigt.

Personal Voice: Eigene KI-Stimme in nur 15 Minuten

Aphasie, Kehlkopfkrebs oder ALS (Amyotrophe Lateralsklerose) sind nur drei Krankheiten, die zum Verlust der Stimme führen können. Die Sprache ist essenziell für die tägliche Kommunikation. Wer von einem Stimmverlust betroffen ist, hat dann oft keine andere Wahl, als sich mit Papier und Stift oder die Eingabe von Text auf einem mobilen Device oder Computer mitzuteilen.

Viele von euch kennen vielleicht noch den Physiker Steven Hawking, der über 30 Jahre mithilfe eines Sprachcomputers kommunizierte. Die Stimme des Computers klang dabei sehr technisch und wenig persönlich. Doch wie wäre es, wenn man seine Stimme konservieren könnte, um im Fall einer Krankheit eine KI-Stimme zu nutzen, die klingt wie die eigene? Und das mit jedem iPhone oder iPad.

Personal Voice macht es möglich

Eine Computerstimme zu erzeugen, die wie die eigene klingt, ist in der heutigen Zeit kein Problem. Das sogenannte Voice Banking dauert auf aktuellen Systemen jedoch mehrere Wochen. Um ein eigenes Stimmmuster anzulegen, muss man einen speziellen Computer mit round about 1.500 Sprachsamples trainieren. Das kostete Zeit und Geld.

Vergangenen Dienstag hat Apple in seinem Newsroom mehrere neue Features für die Barrierefreiheit angekündigt, die mit iOS 17, iPadOS 17 und macOS 14 erscheinen sollen. Dazu gehört u. a. Personal Voice. Dabei handelt es sich um nichts anderes als einen solchen Sprachcomputer, der auf jedem kompatiblen iPhone oder iPad funktioniert - mit nur 150 Phrasen, die man einsprechen muss.

In nur 15 Minuten einsatzbereit

Der Clou von Personal Voice ist dabei nicht nur, dass man seine eigene Stimme quasi in der Hosentasche mit sich herumtragen kann: Das Training der Software soll man in einem Bruchteil der Zeit erledigen können, die man auf vergleichbaren Systemen benötigt.

Wie man in der Redaktion von 9to5mac erfahren hat, soll man mit Personal Voice nur schlappe 15 Minuten benötigen:

  • „Nutzer können eine persönliche Stimme erstellen, indem sie eine zufällige Reihe von Textaufforderungen vorlesen, um 15 Minuten Audio auf dem iPhone oder iPad aufzunehmen. Diese Funktion für die Zugänglichkeit von Sprache nutzt maschinelles Lernen auf dem Gerät, um die Informationen der Nutzer privat und sicher zu halten, und lässt sich nahtlos in Live Speech integrieren, sodass die Nutzer mit ihrer Persönlichen Stimme sprechen können, wenn sie sich mit ihren Lieben verbinden.“

Abgesehen davon, dass nicht jeder Zugang zu einem herkömmlichen Sprachcomputer hat, will man nicht mehrere Wochen damit verbringen, ein Computersystem mit seiner Stimme zu füttern. Personal Voice ist so etwas wie ein Gamechanger, mit dem man - ähnlich wie bei einer Versicherung - für die Zukunft vorsorgt.

Datenschutz & Privatsphäre

Interessant ist außerdem, wie Personal Voice arbeitet. Während herkömmliche Systeme auf Online-Lösungen setzen und das Training auf Servern passiert, die irgendwo auf der Welt stehen, findet Personal Voice lokal auf dem iPhone oder iPad statt. Infolgedessen benötigt man auch keine aktive Internetverbindung.

Das sagte Sarah Herrlinger, Leiterin für Barrierefreiheit bei Apple, gegenüber 9to5mac. Die gesamte Verarbeitung erfolgt mithilfe der Neural Engine lokal auf dem eigenen Gerät. Die Neural Engine wurde zusammen mit dem A11 Bionic und dem iPhone X eingeführt. Unklar ist jedoch, ab welcher Version Personal Voice unterstützt wird. Im Vergleich zum A11 bietet die Neural Engine des A12 schon fünf statt 0,6 TOps (Billionen Operationen pro Sekunde). Beim A15 sind es 15 und beim A16 17 TOps.

In der Pressemitteilung wird Personal Voice als neues Feature von iOS 17 und iPadOS 17 genannt. Ob und wann die Funktion auch für macOS 14 verfügbar sein wird, bleibt abzuwarten.

Bisher keine Kommentare
Kommentieren
Als Amazon-Partner verdiene ich an qualifizierten Verkäufen.