GPT-3 vs. Data-to-Text – KI oder Textroboter: Suchst du nach einer Lösung für die automatisierte Content-Produktion, stößt du, gerade im Zuge des augenblicklichen ChatGPT-Hypes schnell auf diese beiden Ansätze. Welches Verfahren ist das richtige für dein Unternehmen? Wo sind die Unterschiede? Lass uns einen genaueren Blick darauf werfen:

Möchtest Du automatisiert Content erstellen oder wissen, wie Textgeneratoren überhaupt funktionieren? Dann willkommen bei uns! Wir erklären dir, wie Data-to-Text- und GPT-3-Tools automatisch Text erzeugen, wie sie arbeiten und wo sie eingesetzt werden.

Willst du dir lieber ein Video anschauen? Dann schau dir unser Webinar zu dem Thema an:

Sowohl GPT-3 (die Technologie von ChatGPT) als auch Data-to-Text (wie unser Textroboter) sind sogenannte NLG-Technologien. NLG bedeutet „Natural Language Generation“ und bezieht sich auf die automatische Generierung von Texten in natürlicher Sprache. Der Text wird von einem Textroboter, um genauer zu sein, einer Software, erzeugt.

NLG-Tools ermöglichen es dir, sehr schnell große Mengen an Text zu produzieren – bis zu 500.000 in einer Stunde. Obwohl sowohl GPT-3 als auch Data-to-Text NLG-Technologien sind, gibt es doch wesentliche Unterschiede.

Was sind GPT-3 und Data-to-Text und was sind die Unterschiede?

Data-to-Text bezieht sich auf die automatisierte Produktion von natürlichsprachlichen Texten auf der Grundlage von strukturierten Daten. Strukturierte Daten sind Attribute, die so aufbereitet sind, dass sie in Tabellenform dargestellt werden können. Beispiele für strukturierte Daten sind Produktdaten aus einem PIM-System, Spieldaten eines Fußballspiels oder Wetterdaten – sie enthalten also Informationen, die in den Texten verwendet werden können.

Wichtig dabei zu wissen:Die Benutzer:innen haben jederzeit die Kontrolle über das Textergebnis, können jederzeit in die Texterstellung eingreifen sowie Aktualisierungen oder Anpassungen vornehmen. Mehr noch: Die Texte werden zu 100% in der gewünschten Tonalität, dem Sprachstil und dem Duktus verfasst. Dies stellt die Konsistenz, Aussagekraft und Qualität der Texte sicher. Durch die volle Kontrolle werden die Texte exakt so klingen, wie Du es möchtest. Die Texte sind zudem personalisierbar und skalierbar.

Das bedeutet, dass Werkzeuge, die auf strukturierten Daten basieren, zum Beispiel Hunderte von Texten zu Produkten mit variablen Details, in wenigen Augenblicken erstellen können. Und da jeder Text unique produziert wird, hast Du für alle Deine Ausgabekanäle immer genügend Content.

Darüber hinaus ist die Texterstellung in mehreren Sprachen möglich. So kannst Du denselben Text in Englisch, Deutsch, Italienisch und vielen anderen Sprachen generieren.

Wie arbeitet GPT-3?

Das GPT in GPT-3 steht für „Generative Pre-trained Transformer“. Dabei handelt es sich um ein Sprachmodell, das aus vorhandenem Text zu “lernen” versucht und verschiedene Möglichkeiten zur Erstellung eines Satzes anbieten kann. Es wurde mit Hunderten von Milliarden von Wörtern trainiert, die einen bedeutenden Teil des Internets repräsentieren – einschließlich des gesamten Korpus der englischen Wikipedia, unzähliger Bücher und einer schwindelerregend hohen Anzahl von Webseiten.

Im Gegensatz zu Data-to-Text kann GPT-3 nur dazu verwendet werden, einzelne Texte zu generieren, obwohl dies schnell möglich ist. Der Nutzer hat jedoch keine Kontrolle über die generierten Inhalte. Mehrsprachigkeit ist mit GTP-3 noch kaum möglich, wie mit Data-to-Text. Hier kannst Du nur Texte in Englisch ODER Deutsch ODER Italienisch erstellen.

Die häufigsten Mythen

  • Ein Textroboter ist irgendwie so eine Art künstliche Intelligenz (KI).
  • Eine künstliche Intelligenz die irgendwie Texte umschreiben kann.
  • Es steck eine Art „lernfähiger“ Algorithmus dahinter, der Texte generiert, die mit der Zeit in der Qualität immer besser werden.
  • Es gibt kaum Einfluß darauf, welchen Content die KI produziert und wie die Texte dann klingen. Soweit ist die KI noch nicht.
  • Fehlerhafte Aussagen in automatisch produzierten Texten muss ich einkalkulieren. Solche Maschinen sind nicht perfekt.
Good to know!

Welche Technologie zur Generierung von Texten ist für welchen Anwendungsfall geeignet?

  • Welche Technologie vorzuziehen ist, hängt vom jeweiligen Anwendungsfall ab. Während sich GPT-3 als Grundlage für Inspirationen oder als Grundgerüst für einen Fließtext, z. B. einen Blogbeitrag, eignet, findet Data-to-Text-Software aufgrund ihrer Skalierbarkeit Anwendung in Unternehmen, die eine große Menge an Texten benötigen. 

Data-to-Text

Data-to-Text wird beispielsweise in Branchen wie E-Commerce, bei Banken, im Finanzsektor, der Pharmabranche, im Medien- und Verlagswesen eingesetzt.

Für E-Commerce-Unternehmen ist Data-to-Text deswegen gewinnbringend, weil sie für viele Produkte mit ähnlichen Details qualitativ sehr hochwertige Beschreibungen erstellen können – in verschiedenen Sprachen und in gleichbleibender Qualität. Das spart Zeit und Geld, erhöht die SEO-Sichtbarkeit und die Konversionsraten auf den Produktseiten.
Das manuelle Verfassen großer Textmengen, wie tausende von Produktbeschreibungen für einen Online-Shop, ist schier unmöglich. Vor allem, wenn diese Texte regelmäßig überarbeitet werden müssen, um sie auf dem neuesten Stand zu halten, etwa aufgrund von saisonalen Einflüssen.

Data-to-Text-Software ist für diesen Anwendungsfall sehr gut geeignet. Denn wenn das Projekt einmal eingerichtet ist, müssen nur noch die Daten aktualisiert werden. Dann wird der bestehende Text sofort aktualisiert oder es werden sofort neue und einzigartige Texte erstellt. Durch diese Entlastung haben Texter:innen und Redakteur:innen mehr Zeit für kreative Tätigkeiten und konzeptionelle Arbeit.

Für Pharma- und Finanzunternehmen ist die Software z.B. interessant, weil aus den Daten oder Statistiken heraus automatisiert Texte wie Reportings, Analysen usw. erstellt werden können.

GPT-3

Die GPT-3-Tools können besonders beim Brainstorming und als Inspirationsquelle hilfreich sein. Wie wertvoll ein Text-Ergebnis ist und wie sehr er im Nachgang bearbeitet werden muss, hängt meist vom Thema ab. Je spezifischer das Thema, desto ungenauer und sinnloser erscheint der Inhalt, wie Nutzer in diesem Reddit-Thread berichten.

Das liegt daran, dass GPT-3 keine wirkliche Intelligenz hat oder über allgemeines Wissen verfügt. Die Technologie kann nur vorhandenen Content aus Datenquellen abrufen und in einem Text wiedergeben. Sie kann die Aussagen nicht bewerten, auf Richtigkeit prüfen oder filtern. Daher kann es sein, dass die Inhalte keinen Sinn ergeben oder sogar üble Worte enthalten und ethisch fragwürdige Aussagen machen.

Dennoch kann sich der Einsatz von GPT-3 durchaus lohnen. Zum Beispiel für ein Grundgerüst des Textes, der dann überarbeitet wird oder wenn der Copywriter mit einer Schreibblockade kämpft und sich von dem Text inspirieren lassen möchte.

Auch wenn ein großer Text auf der Grundlage einer kleinen Eingabe automatisch generiert werden soll, kann der Einsatz von GPT-3 durchaus sinnvoll sein. Oder in Situationen, in denen es nicht effizient oder sinnvoll ist, die Textausgabe von Menschen erstellen zu lassen. Ein Beispiel hierfür ist der Einsatz eines Chatbots zur Beantwortung wiederkehrender Kundenanfragen.

Im folgenden Beispiel wurde einem GPT-3-Tool der erste Satz vorgegeben. Der Rest wurde von der Software generiert. Es wurde ein Text über mögliche Aktivitäten an heißen Tagen angefordert. Die Aussage des generierten Textes weicht deutlich von der ursprünglichen Aussage ab:

GPT-3 kann einen Eingabetext sowohl umschreiben als auch fortsetzen, wie im vorliegenden Beispiel. Das Modell hat die Eingabe analysiert und auf der Grundlage eines Textprädiktors vorhergesagt, wie der Text am wahrscheinlichsten weitergeht. So wird aus dem heißen Sommertag ein Tag, an dem alle um 5 Uhr morgens aufstehen müssen und Wolken und Regen aufziehen. Es wird schnell klar, dass die gewünschten Sätze über mögliche Aktivitäten an einem heißen Tag auf diese Weise nicht generiert werden können. Es liegt also auf der Hand, dass der resultierende Text nur als Inspirationsgrundlage dienen kann.

GPT-3 vs. NLG DE Blogbeitrag

Vor- und Nachteile von GPT-3 und Data-to-Text

Natürlich haben beide Technologien ihre Stärken und Schwächen. Beide generieren automatisch Texte – eignen sich aber für einen anderen Anwendungsfall.

  • Data-to-Text basiert auf strukturierten Daten in maschinenlesbarer Form. Das Geschichtenerzählen sowie das Verfassen von Blogbeiträgen oder Social-Media-Posts bleibt damit dem Menschen überlassen. Als Grundlage für die Erstellung dieser Art von Texten ist GPT-3 eine brauchbare Alternative, denn diese Texte können mit Data-to-Text-Software nicht sinnvoll erzeugt werden. Besonders in Blogbeiträgen werden in der Regel wechselnde Themen mit komplett unterschiedlichen Eigenschaften und Merkmalen abgehandelt. Die Anzahl von Blogbeiträgen ist außerdem relativ gering und steht in keinem Verhältnis zum einmaligen Einrichtungsaufwand, der doch recht umfangreich sein kann. 

 

Während sich Data-to-Text durch die Eingabe von Daten an der Nutzerrealität orientiert, handelt es sich bei GPT-3 um eine neuronale Netzwerklösung, die Sprache aus Texten generiert und keinen direkten Bezug zur realen Welt hat. Das bedeutet, dass die Texte zwangsläufig nachbearbeitet werden müssen, um eine gewisse Qualität, vor allem aber eine Sinnhaftigkeit der Texte zu gewährleisten.

 

Unter Berücksichtigung der Tatsache, dass die Option Data-to-Text sich immer dann eignet, wenn große Mengen ähnlicher Inhalte mit variablen Details auf der Grundlage strukturierter Datensätze erzeugt werden sollen, haben wir folgende Gegenüberstellung verfasst:

Data-to-text vs GPT-3

Wenn du bedenkst, dass der Content bei GPT-3 nicht aus einem Datenkontext entsteht,

wird eindeutig, welches System sich jeweils für die diversen Branchen und Anwendung eignet:

Data-to-text vs GPT-3 - Blogbeitrag DE

Generell gilt: Wenn Besonderheiten, die aus der Masse hervorstechen, extra betont und über zig-tausend Texte hervorgehoben werden sollen, dann empfiehlt sich Data-to-Text.

Wenn es hingegen nicht effizient oder durchführbar ist, den Text von einem Menschen erstellen zu lassen, und es nichts ausmacht, wenn v. a. in längeren Texten Wiederholungen vorkommen, anstatt dass zusätzliche Informationen hinzugefügt werden, dann solltest du zu GPT-3 greifen. Das ist auch dann der Fall, wenn keine Kapazitäten für Korrekturlesen und Faktencheck zur Verfügung stehen. 

Fazit zur Textqualität und Skalierbarkeit

Kann GPT-3 Texte schreiben? Die Antwort ist „ja“, aber du musst dir immer bewusst machen, welches Ziel du verfolgst, welchen Anspruch du an deine Texte hast und wie viel Eigenaufwand du bereit bist zu investieren!  Behalte immer vor Augen, dass GPT-3 mit dem ganzen Internet „gefüttert“ wird und dann den wahrscheinlichsten Output abliefert. De facto handelt es sich dabei um die Wiedererkennung eines bereits wahrgenommenen Musters. Gerade darin sehen wir die Grenzen dieses Systems, da es eben nicht “verstehen” und abwägen kann. 

Zwar werden die verwendeten Wörter fehlerfrei generiert und die Grammatikregeln korrekt angewandt, aber häufig geht der Sinn der Aussagen verloren. Das heißt, GPT-3 kann zwar Texte generieren, aber das Ergebnis kann von minderer Qualität sein, dass sich durch eine nachträgliche Überarbeitung des Textes kaum Zeit sparen lässt. Außerdem können die Benutzer:innen das GPT-3-Programm nicht mit Wissen, zum Beispiel in Form von Daten, füttern, um es zu verbessern. Dies ist aber in vielen Fällen eine entscheidende Voraussetzung für den Einsatz. Hier bietet sich Data-to-Text an, weil es mit strukturierten Daten gefüttert wird und darauf basierend Text generiert. Allerdings ist das Modell von der Datenqualität abhängig und das Setup eines ersten Projekts ist zeitaufwändiger.

Jetzt Online-Demo buchen

Share post: