Eine Studie, durchgeführt von Forschenden der Eidgenössischen Polytechnischen Hochschule in Lausanne (EPFL) und der Fondazione Bruno Kessler in Italien, hat ergeben, dass das Sprachmodell GPT-4 Menschen in Online-Diskussionen dazu bringen kann, ihre Meinung zu ändern. In einer Reihe von Gesprächen zu politischen und ethischen Themen konnte GPT-4 Menschen mit einer höheren Wahrscheinlichkeit überzeugen als menschliche Diskussionspartner – allerdings nur unter bestimmten Bedingungen.
Die Studie zeigte, dass GPT-4 Menschen mit einer Wahrscheinlichkeit von knapp 82 Prozent häufiger von ihren Standpunkten abbringen konnte als menschliche Diskussionspartner. Dies funktionierte jedoch am besten, wenn das Sprachmodell persönliche Informationen über seinen Gesprächspartner erhielt. Die Daten wurden auf der Preprint-Plattform Arxive veröffentlicht.
Die Forschenden bauten eine Online-Plattform, auf der Teilnehmer zufällige Diskussionsthemen und ihre eigenen Standpunkte zugeteilt bekamen. Dabei wurde nicht verraten, ob der Gesprächspartner ein Mensch oder ein Sprachmodell war. Die Themen waren so gewählt, dass sie kontrovers waren, aber keine speziellen Kenntnisse erforderten.
Insgesamt wurden vier verschiedene Kombinationen getestet: Mensch-Mensch, Mensch-Mensch mit persönlichen Informationen, Mensch-KI und Mensch-KI mit persönlichen Informationen. Ohne persönliche Informationen schnitt GPT-4 nicht besser ab als der menschliche Durchschnitt. Mit mehr persönlichem Kontext stieg jedoch die Wahrscheinlichkeit, dass die KI ihre Gesprächspartner überzeugen konnte, um rund 80 Prozent.
Die Ergebnisse der Studie werfen jedoch auch Fragen nach möglichen Missbrauchsszenarien auf. Die Forschenden warnen davor, dass böswillige Akteure die Personalisierungsfunktion von KI nutzen könnten, um Desinformationskampagnen zu betreiben. Online-Plattformen und soziale Medien sollten daher Maßnahmen ergreifen, um die Verbreitung von KI-gesteuerter Überzeugungsarbeit einzudämmen.
Es bleibt jedoch abzuwarten, wie gut sich die Ergebnisse der Studie verallgemeinern lassen, da die Testpersonen ausschließlich aus den USA rekrutiert wurden und der Ablauf der Debatten sehr formal strukturiert war.
