2.1 Funktionsweise von ChatGPT
ChatGPT operiert auf Grundlage eines Large Language Modells, eines interaktiven Sprachmodells, welches durch eine große Menge von Texten trainiert wurde. Hierdurch kann es menschlichen Text verstehen, verarbeiten und menschen-ähnlichen Text produzieren.1) Seit ChatGPT im März 2023 vorgestellt wurde, kann die KI auch Bilder beschreiben und analysieren. Es existieren unterschiedliche Formen der Sprachmodelle. Das Sprachmodell von ChatGPT zählt zu denen, die auf künstlichen neuronalen Netzen basieren.2)
Die Chatfunktion der KI funktioniert durch einen „generative pre-trained Transformers“ (GPT, bei den Versionen 3.5 und 4.0). Die folgenden drei Merkmale sind laut Theisen (2023) charakteristisch für ChatGPT:
„1. Das System beschränkt sich nicht auf die Methoden einer Suchmaschine, sondern generiert eigene Texte, Gedanken und Antworten (‚generative‘).
2. Alles, was das System speichert, verarbeitet und nutzt, ist ihm angelernt, also antrainiert worden (‚pre-trained‘). Umfang und Zeitpunkt des ‚Training‘ bestimmen damit die Aktualität und den Horizont der KI-Informationen. ‚Deep-Learning-Netze‘ führen fortlaufend zu neuen und höheren Qualitäten.
3. Die zugrundeliegende Technologie basiert auf komplexen Algorithmen, die unter Verwendung der statistischen Wahrscheinlichkeitsrechnung Muster und Beziehungen aus großen Datenmengen gewinnen (‚transformer‘; vgl. Rieck, 2023, S. 13 f.).„3)
Die Kommunikation mit der KI verläuft über ein Eingabefenster in Form eines Chats, es können in 100 unterschiedlichen Sprachen genutzt werden. Die erste Eingabe in das Chatfenster wird als prompt bezeichnet.4)
ChatGPT wurde mit digital offen verfügbaren schriftlichen Informationen aus dem Internet bis September 2021 trainiert und hatte dann zunächst keinen laufenden Zugriff auf neues Material aus dem Internet. In der bezahlpflichtigen Version der KI, kann diese nun auch auf das offene Internet zugreifen.5)
Der von der KI produzierte Text entsteht, indem diese alle ihr zu Verfügung stehenden Informationen nach dem Wahrscheinlichkeitsprinzip kombiniert. Begriffe und die Konstruktion der Antworten entstehen nach der größten Wahrscheinlichkeit.6) Durch das statistische Modell wird auf Basis der Datengrundlage, mit der die KI trainiert wurde, berechnet, welches Wort in diesem Kontext am wahrscheinlichsten als nächstes im Satz erscheinen sollte. Die KI ist nicht in der Lage, auf semantischer Ebene Text zu produzieren, durch die Analyse von Sprachmustern wird der Text berechnet. In der Trainingsphase bekam die KI regelmäßig Feedback von Forscher*innen, ob die Vorhersage bezüglich des nächsten Wortes korrekt war.7)