ChatGPT: Das KI-Modell hinter den Kulissen von YouTube-Videos

Eine Million Stunden YouTube-Videos – das ist nicht nur eine immense Zeitmenge, sondern auch eine beträchtliche Datenmenge, die OpenAI offenbar für das Training seines ChatGPT-Modells verwendet hat. Doch wie kam es dazu und welche Folgen könnte das haben?

Berichten zufolge soll OpenAI, das Unternehmen hinter ChatGPT, das Trainingsmaterial für sein KI-Modell Ende 2021 erweitert haben wollen. Da bereits alle öffentlich verfügbaren englischen Texte in den Trainingsdaten enthalten waren, war das Unternehmen auf der Suche nach neuen Datenquellen. Und wo findet man mehr Text als in den Untertiteln von YouTube-Videos?

Mittels eines Programms namens „Whisper“ soll OpenAI massenhaft den Ton von YouTube-Videos in Text umgewandelt haben, ohne Google oder die Videoersteller darüber zu informieren. Obwohl Google Kenntnis von dieser Praxis hatte, griff der Konzern nicht ein, da er selbst Inhalte von YouTube und anderen Diensten für das Training eigener KI-Modelle verwendet.

Doch nicht nur in den USA, sondern auch in der EU gibt es rechtliche Bedenken bezüglich der Nutzung urheberrechtlich geschützter Inhalte für KI-Training ohne entsprechende Lizenzvereinbarungen. Unternehmen wie Google und Facebook haben bereits Nutzungsbedingungen geändert, um solche Verstöße zu verhindern.

Inzwischen schließen einige Unternehmen sogar explizite Lizenzvereinbarungen mit Datenquellen ab, um rechtliche Probleme zu vermeiden. Doch OpenAI berief sich intern auf das US-amerikanische Rechtskonstrukt des „fair use“, um die Verwendung der Daten zu rechtfertigen.

Während eine Million Stunden YouTube-Videos auf den ersten Blick viel erscheinen mag, relativiert sich dies angesichts des rasanten Wachstums der Plattform. Bereits 2019 wurden jede Minute etwa 500 Stunden Video hochgeladen, und diese Zahl dürfte inzwischen noch höher liegen.

Es bleibt jedoch die Frage, wie OpenAI die Videos ausgewählt hat und welche Auswirkungen dies auf die Rechte der Videoersteller hat. Trotzdem zeigt dieser Vorfall, wie tief KI in unser tägliches Leben eingreift – selbst hinter den Kulissen von YouTube-Videos.

Hinterlasse einen Kommentar