OpenAI hat kürzlich eine aufregende Funktion für ChatGPT vorgestellt: den Sprachmodus. Während sich viele auf eine noch natürlichere Kommunikation mit der KI freuen, hat ein unerwartetes Phänomen für Aufsehen gesorgt. Bei internen Tests kam es nämlich vor, dass ChatGPT plötzlich mit der Stimme des Nutzers antwortete. Ein Szenario, das eigentlich unmöglich sein sollte – und dennoch passiert ist.
Wenn ChatGPT „Ich“ sagt – und das klingt wie du
Stellen Sie sich vor, Sie reden mit einer KI, und plötzlich hören Sie Ihre eigene Stimme aus dem Lautsprecher – aber es ist nicht Ihr Echo. Genau das geschah bei internen Tests des „Advanced Voice Mode“ von ChatGPT. Während die meisten von uns wohl denken würden, dass dies nur in Horrorfilmen passiert, ist es ein reales Problem, das OpenAI im neuesten Bericht zu GPT-4 enthüllt hat.
Im Bericht beschreibt OpenAI, wie der erweiterte Sprachmodus sicherer gemacht werden soll, und berichtet dabei auch von diesem unheimlichen Vorfall. Ein Beispiel zeigt, wie das KI-Modell mit einem entschiedenen „Nein!“ antwortet, und das – überraschenderweise – in der Stimme eines Testers. Dabei sollte die KI eigentlich nur eine von vier voreingestellten Stimmen verwenden, die mit professionellen Synchronsprechern entwickelt wurden.
Warum passiert das?
Natürlich fragt man sich: Wie konnte es überhaupt dazu kommen? Während OpenAI keine genauen Details nennt, gibt es Vermutungen. Es könnte an Hintergrundgeräuschen gelegen haben. Störgeräusche wie Vogelgezwitscher oder Verkehrslärm könnten die KI so verwirrt haben, dass sie versehentlich die Stimme des Nutzers nachahmte. Das ist vergleichbar mit sogenannten Prompt Injections, einem Angriff, bei dem Software, die auf Sprach-KIs basiert, manipuliert wird.
Prompt Injections sind in der Welt der IT-Sicherheit ähnlich wie die gefürchtete Remote Code Execution: Der Angreifer übernimmt die Kontrolle über die KI. In diesem Fall könnte das KI-Modell gezwungen worden sein, die voreingestellte Stimme zu ignorieren und stattdessen die Stimme des Nutzers zu imitieren – wenn auch ungewollt.
Ist das wirklich so schlimm?
Es klingt unheimlich, wenn eine KI plötzlich Ihre eigene Stimme nachahmt. Aber OpenAI beruhigt: Es handelt sich um Einzelfälle, die selten auftreten. Trotzdem zeigt dieses Beispiel, wie komplex und unerwartet die Interaktionen mit einer so fortschrittlichen Technologie sein können. Während OpenAI daran arbeitet, diese Probleme zu beheben, bleibt der Sprachmodus vorerst auf wenige Nutzerinnen und Nutzer beschränkt – und das wohl auch aus gutem Grund.
Fazit: Sprechen ist Silber, Schweigen ist…?
Der neue Sprachmodus von ChatGPT ist zweifellos ein spannender Schritt in die Zukunft der KI-Kommunikation. Doch wie bei jeder neuen Technologie gibt es Kinderkrankheiten. Dass die KI plötzlich die Stimme des Nutzers imitiert, ist sicherlich nicht das, was OpenAI im Sinn hatte. Es zeigt aber auch, wie wichtig es ist, solche Technologien gründlich zu testen, bevor sie für die breite Masse zugänglich gemacht werden. Bleibt zu hoffen, dass die Entwickler das Phänomen bald in den Griff bekommen – und dass wir uns in Zukunft nicht selbst aus dem Lautsprecher hören, wenn wir mit einer KI plaudern.
