Kampf gegen die Halluzinationen in der Wikipedia
Mathias Schindler, ein erfahrener Wikipedianer und Mitbegründer von Wikimedia Deutschland, hat auf dem 39C3 einen bemerkenswerten Vortrag gehalten, in dem er zeigt, wie er versehentlich ein Werkzeug zur Identifizierung von KI-generierten Inhalten in der Wikipedia entwickelt hat. Schindler wollte ursprünglich nur einige fehlerhafte ISBNs in Wikipedia-Artikeln korrigieren, stieß dabei jedoch auf eine viel größere Problematik: Artikel, die ganze Plagiate waren und von großen Sprachmodellen wie ChatGPT erstellt wurden.
Die Entdeckung fehlerhafter ISBNs
Bei seiner Untersuchung der ISBNs in der deutschsprachigen Wikipedia erkannte Schindler, dass viele in den Artikeln aufgeführten Bücher nicht existierten. Obwohl sie scheinbar glaubwürdige Titel und Autoren hatten, konnte er sie in keiner Quelle finden. Diese von KI generierten Inhalte bezeichnet Schindler als „halluziniert“ und hebt hervor, dass solche Einträge eine ernsthafte Gefahr für die Integrität der Wikipedia darstellen.
Ein Nischenphänomen, aber mit Zukunft
Obwohl Schindler etwa 150 Artikel identifizieren konnte, bei denen er Verdacht schöpfte, dass sie teilweise KI-generiert waren, betont er, dass dies nur einen kleinen Bruchteil der über drei Millionen deutschsprachigen Wikipedia-Artikeln ausmacht. Dennoch zeigt diese Entdeckung, dass die Gefahr, die von KI-generierten Inhalten ausgeht, nicht ignoriert werden kann. Schindler stellt fest, dass es wichtig ist, wachsam zu bleiben, um solche Inhalte frühzeitig zu erkennen.
Wikipedia als Ziel der KI-Generierung
Die Herausforderung von KI-generierten Texten ist nicht nur akademisch; sie berührt die Grundwerte von Wikipedia als Enzyklopädie, die auf Verlässlichkeit und Fakten basiert. Schindler warnt davor, dass Inhalte, die auf den ersten Blick wahr erscheinen, die Leser*innen in die Irre führen können. Die rechtmäßigen Referenzen, die für die Glaubwürdigkeit entscheidend sind, könnten durch diese neuen Tendenzen in Gefahr geraten.
Zukunftsausblick
Was folgt im Kampf gegen die Verbreitung von KI-generierten Artikeln? Schindler hebt hervor, dass das entwickelte Werkzeug nicht als alleinige Lösung fungieren kann, da es nicht alle möglichen Halluzinationen erfasst. Dennoch ist es ein wichtiger Schritt in die richtige Richtung und zeigt, wie wichtig kreative Lösungen im Netz sind, um die Integrität von Online-Enzyklopädien zu wahren.
Zusammenfassend zeigt Schindlers Vortrag, dass der Einfluss von Künstlicher Intelligenz auf Informationsplattformen wie Wikipedia von grundlegender Bedeutung ist. Es ist notwendig, dass alle Beteiligten sich aktiv mit diesem Thema auseinandersetzen, um die Qualität und Glaubwürdigkeit von Informationen im digitalen Zeitalter zu sichern.