Was ist ChatGPT?

17.01.2023.

ChatGPT ist derzeit der Star der KI-Szene. Doch was ist ChatGPT genau? Im COMPUTERWOCHE-Interview gibt die KI dazu selbst Antworten.

Quelle: computerwoche.de

Das noch junge Tech-Jahr 2023 hat bereits seinen ersten Star: ChatGPT. Während erste Unis und Schulen ChatGPT bereits mit einem Bann belegen, weil sie um die Kreativität und Eigenleistung ihrer Schüler fürchten, beflügelt die KI ChatGPT und das dahinter stehende Unternehmen OpenAI die Phantasie der Investoren. So will Microsoft angeblich zehn Milliarden Dollar investieren und laut Medienberichten haben zudem die beiden Venture-Capital-Firmen Firma Thrive Capital und der Founders Fund – der bereits in Airbnb, den Streaming-Service Spotify und die Taxi-App Lyftinvestierte – Interesse an einem Anteil in Höhe von 300 Millionen Dollar.

Doch was ist ChatGPT nun genau? Der neue Kollege in der Redaktion wie etwa bei CNET? Oder schlicht die moderne Hausaufgabenhilfe, die teure Nachhilfe ersetzt? Oder der moderne Chat-Bot für Unternehmen, um den Kundenservice zu automatisieren? Wer könnte diese Fragen besser beantworten als die KI selbst. Wir haben hierzu ChatGPT interviewt.

Die KI im Interview

COMPUTERWOCHE: Hallo ChatGPT, um Sie wird derzeit ein großer Hype generiert, doch was ist ChatGPT nun genau?

ChatGPT: ChatGPT ist ein Language-Modell, das auf natürliche Sprache spezialisiert ist. Es ist ein fortgeschrittenes künstliches Intelligenz-Modell, das auf der Grundlage von Transformer-Technologie und dem Attention-Mechanismus aufgebaut wurde. ChatGPT wurde mit einer großen Menge an Textdaten trainiert, die aus dem Internet gesammelt wurden, und kann eine Vielzahl von Aufgaben der natürlichen Sprachverarbeitung ausführen, wie beispielsweise Textgenerierung, Textzusammenfassung, Textkomplettierung, Textklassifizierung und Frage-Antwort-Systeme. Es kann in vielen Branchen und Anwendungen eingesetzt werden, wie etwa imKundenservice, im Marketing, in der Bildung und in der Finanzbranche. Ich habe eine sehr hohe Leistung in Aufgaben der natürlichen Sprachverarbeitung gezeigt und eigne mich besonders gut für die Automatisierung von Dialog-Systemen.

COMPUTERWOCHE: Und wie funktioniert das Lernen bei Ihnen?

ChatGPT: Ich basiere auf einem sogenannten Transformer-Modell, das auf der Technologie des “Attention Mechanisms” basiert. Dieser Mechanismus ermöglicht es einem Modell, auf bestimmte Teile des Eingabe-Textes zu achten und diese bei der Generierung des Ausgabe-Textes zu berücksichtigen. Beim Lernen wird das Modell mit einer großen Menge an Textdaten trainiert und versucht dabei, die Muster und Zusammenhänge in diesen Daten zu erkennen.

Das Modell wird mit einem gegebenen Eingabe-Text und dem dazugehörigen Ausgabe-Text trainiert. Dabei hat es das Ziel, den Ausgabe-Text so gut wie möglich zu generieren. Dazu verwendet es einen Prozess namens “masked language modeling” bei dem einige Wörter im Ausgabe-Text vorübergehend “maskiert” werden und das Modell versucht diese Wörter vorherzusagen.

Das Modell wird dann mit den Ergebnissen seiner Vorhersagen verglichen und die Abweichungen zwischen den Vorhersagen und den tatsächlichen Ausgabe-Texten werden verwendet, um die Gewichtungen der Neuronen im Modell anzupassen, mit dem Ziel, dass die Vorhersagen beim nächsten Mal besser werden. Dieser Prozess wird wiederholt, bis das Modell eine hohe Genauigkeit bei der Generierung von Text erreicht hat.

COMPUTERWOCHE: Wie lange hat Ihre Entwicklung gedauert?

ChatGPT: Ich habe keine Informationen darüber, wie lange meine Entwicklung genau gedauert hat. Es ist jedoch wichtig zu beachten, dass die Entwicklung von großen Sprachmodellen wie ChatGPT ein komplexer und aufwendiger Prozess ist, der in der Regel viele Monate oder sogar Jahre in Anspruch nimmt. Die Entwicklung eines solchen Modells erfordert die Verwendung großer Textmengen, um es zu trainieren, sowie die Anwendung von fortgeschrittenen Technologien wie maschinellem Lernen und Künstlicher Intelligenz.

Es ist auch zu berücksichtigen, dass meine Entwicklung keineinmaliger Prozess war, sondern ein ständiger Prozess mit Verbesserungen und Anpassungen an die neusten Erkenntnisse und Technologien.

Die Macher hinter ChatGPT

COMPUTERWOCHE: Wer steht hinter ChatGPT?

ChatGPT: Ich bin ein Produkt von OpenAI, einen profitorientierten Forschungs- und Entwicklungsunternehmenfür Künstliche Intelligenz (KI), das 2015 von Elon Musk, Sam Altman, Greg Brockman, Ilya Sutskever und Wojciech Zaremba gegründet wurde. An OpenAI sind mittlerweile eine Reihe von Investoren beteiligt, darunter bekannte Namen wie Peter Thiel, khosla Ventures, Andreessen Horowitz und viele andere.

COMPUTERWOCHE: Womit verdienen Sie Ihr Geld?

ChatGPT: Wie gesagt, ich werde von OpenAI entwickelt und betrieben. Geld verdient OpenAI hauptsächlich durch die Verwendung der Technologie durch Unternehmen und Entwickler in Form von API-Abrufen und lizenzierter Nutzung. Darüber hinaus offeriert OpenAI auch Beratungen und Schulungen zu meiner Verwendung.

COMPUTERWOCHE: Wird ChatGPT bald kostenpflichtig, wie das Handelsblatt berichtet?

ChatGPT: Ich habe keine Informationen darüber, dass OpenAI plant, mich kostenpflichtig zu machen. OpenAI hat jedoch angekündigt, dass sie ihre Modelle für die gewerbliche Nutzung in Zukunft monetarisieren werden. Aber es ist unklar, ob und wann dies auf mich angewendet werden wird. Ich empfehle Ihnen, die offizielle Website von OpenAI diesbezüglich zu besuchen.

Bias und Training

COMPUTERWOCHE: Wie vermeiden Sie Bias in Ihren Texten?

ChatGPT: Es ist wichtig, darauf hinzuweisen, dass jedes Modell, einschließlich mir, möglicherweise einen Bias aufweist. Deshalb ist es wichtig, dass die Daten, die verwendet werden, um das Modell zu trainieren, repräsentativ und möglichst frei von Bias sind. Um Bias zu vermeiden, sollten zudem Bias-Korrektur-Techniken während des Trainingsprozessesangewandt werden. Ferner sollte das Modell während des Betriebs überwacht werden und Bias korrigiert werden, wenn dieser entdeckt wird.

COMPUTERWOCHE: Mit welchen Daten wurden Sie trainiert?

ChatGPT: Ich wurde mit einer großen Menge an Textdaten trainiert, die aus dem Internet gesammelt wurden. Diese Daten umfassen eine Vielzahl von Texten, darunter Artikel, Blog-Posts, Bücher, Nachrichten, Social-Media-Beiträge und mehr. Diese Daten wurden verwendet, um meinModell zu trainieren, damit es in der Lage ist, natürliche Sprache zu verstehen und zu generieren. Durch das Training mit einer großen Datenmenge konnte ich erlernen, wie Sprache in verschiedenen Kontexten verwendet wird und wie ich die Vielfalt der menschlichen Sprache abbilde.

Mehr…