In nicht einmal 2 Jahren sind KI Chatbots zu einem integralen Bestandteil digitaler Interaktion geworden. Der Launch von OpenAIs ChatGPT Ende November 2022 hat breite Wellen geschlagen und den aktuellen KI Wettkampf losgetreten: Googles Gemini ist die direkte Antwort auf die Konkurrenz. Wir schauen uns an, wie sich die beiden Produkte im direkten Vergleich schlagen – wo liegen die Unterschiede, Gemeinsamkeiten und wie bewältigen die jeweiligen KI-Modelle ausgewählte Alltagsaufgaben aus dem Candylabs Team?
Ein Blick auf die Fakten
OpenAIs ChatGPT wurde am 30. November 2022 veröffentlicht und hat die KI nachhaltig ins öffentliche Bewusstsein gebracht. Bekanntlich fördert Microsoft OpenAI sehr stark und integriert die Technologie in diverse Microsoft Produkte, wie etwa Bing Copilot, GitHub Copilot und in zunehmendem Maß auch in Windows und in der Office Suite. Auch Apple wird wohl in Zukunft mit OpenAI kollaborieren. Gemini – ehemals Bard – launchte im März 2023. Der Start wurde zunächst von einer Panne begleitet, nachdem das Modell bei einer Präsentation ein Fehler unterlaufen war.
Preislich liegen sowohl Gemini Advanced als auch ChatGPT Plus zwischen 20 und 30 € pro Nutzer:in. In der Hinsicht nehmen sich beide Tools relativ wenig. Ein Vorteil für Googles Gemini ist die kostenlose Testphase, OpenAI bietet Probeaccounts für ChatGPT Plus nur für Nutzer:innen mit einem Einladungscode an. Ein anderes Thema sind die Kosten für API Calls, die wir uns weiter unten nochmals anschauen.
Integration in Apps und Dienste
Während Microsoft das GPT-Modell für die Integration in eigene Produkte nutzt, ist ChatGPT nachwievor ein unabhängiges Produkt von OpenAI. Durch die API und Bekanntheit gibt es ein reichhaltiges Ökosystem an Plugins und Integrationen, die die ChatGPT API verwenden. Ein Beispiel? Die beliebte Automatisierungs-Plattform Zapier bietet eine Vielzahl an Integrationsmöglichkeiten in beliebte Apps wie beispielsweise Microsoft Teams und Slack.
Googles Gemini Modelle integrieren sich in das Google Ökosystem, sprich Google Docs, Sheets, Mail, usw. Auf der Google I/O 2024 wurde eine Vielzahl an Features und Integrationen vorgestellt, der Großteil der Gemini-Integrationen soll im Laufe des Jahres sukzessive im Google Ökosystem ausgerollt werden. Ähnlich wie bei den Microsoft Produkten mit ihren jeweiligen Copilots ist damit zu rechnen, dass Google eine umfassende nahtlose User Experience vorantreiben will.
Und genau hier ist ein entscheidender Unterschied: Während OpenAI von Microsoft gefördert und wahrscheinlich auch mit Apple zusammenarbeiten wird, besitzt es kein eigenes Ökosystem an Apps und Diensten. Dementgegen werden Googles Gemini Modelle von Haus aus in das reiche Portfolio an Google Apps, Diensten und Betriebssystemen integriert werden.
Funktionsumfang und Tools
Sowohl ChatGPT als auch Gemini bieten eine aufgeräumte und nutzerfreundliche Chat-Oberfläche. Der grundlegende Funktionsumfang ist hier sehr ähnlich, mehr dazu in unserem Praxisvergleich weiter unten. Bildgenerierung liefert ChatGPT via Dall-E. Aktuell kann Gemini in der EU keine Bilder generieren. Zumal Google nach einigen Vorwürfen die Erstellung von Bildern mit Menschen vorerst aus dem Funktionsumfang entfernt hat.Der Punkt Bildgenerierung geht aktuell eindeutig an ChatGPT.
ChatGPT punktet in der bezahlten Variante auch mit dem GPT Builder: einem einfachen No-Code Interface, mit dem sich einfach auf spezifische Aufgaben getunte Modelle erstellen lassen. Zusätzlich können Modelle im GPT Store veröffentlicht werden. Im Vergleich dazu bietet Google aktuell mit Googles Vertex AI Studio eine einfache AutoML-Oberfläche für die Entwicklung maßgeschneiderter KI-Lösungen an.
Während sowohl ChatGPT als auch Gemini individualisierte Lösungen erlauben, unterscheidet sich die Ausrichtung aktuell noch etwas: OpenAIs Angebot ist deutlich stärker auf die Bedürfnisse von Endnutzer:innen angepasst. Googles Vertex AI Studio wiederum ist für Unternehmen und Entwickler:innen ein interessantes Angebot, da hier Gemini-Modelle mit eigenen Daten für spezielle Aufgaben trainiert werden können. Übrigens bietet Google für Neukunden ein Startguthaben von 300 US-Dollar, damit können besonders Entwickler:innen sich mit dem Tool vertraut machen.
Aber auch OpenAIs GPT Builder mit dem einfach bedienbaren GPT Store soll wohl Konkurrenz erhalten: Google hat die Veröffentlichung spezialisierter Gemini Modelle (sogenannte Gems) angekündigt. Wie sich die Angebote vergleichen, bleibt abzuwarten.
Entwicklung und API
Vielfältige ChatGPT Integrationen verwenden deren API, das Pricing hängt wie bei den meisten APIs stark von der Nutzung ab, in diesem Fall also vom jeweiligen GPT Modell, der Größe der Eingabe und der Größe der Ausgabe.
Google bietet für die verschiedenen Gemini Modelle eine kostenlose API an, das dürfte Entwickler:innen beim Experimentieren und Prototyping helfen. Auch hier sind die Kosten stark von der Nutzung abhängig. Im Allgemeinen sind die API Kosten für die Verwendung von Gemini Modellen niedriger angesetzt, Google unterbietet die Konkurrenz.
Candylabs Praxistest
Wir haben Prompts aus den Bereichen Design, Marketing und Development gesammelt, um zu schauen, wie sich beide Modelle in einigen unserer Alltagsaufgaben schlagen.
Design Tasks
Candylabs erster Design Prompt:
Kannst du mir aus folgenden Stichpunkten einen kurzen, prägnanten Claim schreiben, der auf einer Website verwendet werden kann?
- Messbare PoS-Interaktionen.
- Individuelle Ansprache.
- Gesteigertes Umsatzpotenzial.
- Mit der IoT Suite von Sphere.
ChatGPTs Antwort:
Sphere IoT Suite: Personalisierte Interaktion am PoS, die Ihren Umsatz spürbar steigert.
Geminis Antwort:
Sphere: Mit messbaren PoS-Interaktionen und individueller Ansprache das Umsatzpotenzial im Einzelhandel heben.
Die Antworten sind sehr ähnlich. Der einzige Unterschied bestand darin, dass Gemini eine kurze Erklärung, weitere Tipps sowie weitere alternative Formulierungen mitgeliefert hat. Das Resultat ist zwar länger, aber kann beim kreativen Brainstorming durchaus helfen.
Candylabs zweiter Design Prompt:
Erstelle mir zwei Varianten für Typografie und Farbpaletten für eine innovative, neue Marke im IoT Bereich. Die Typografie-Welt sollte eine Mischung aus Serifen-und Nicht-Serifen-Schriften sein. Die Farbwelt sollte modern und farbig sein, und Accessibility Standards wahren.
Die Antwort fiel in beiden Fällen sehr umfangreich aus, sowohl Gemini als auch ChatGPT haben uns Schriftvarianten, Farbpaletten und einige Erklärungen zur Auswahl gegeben. Erfreulich war auch, dass die KIs die Varianten mit Titeln versehen haben – beispielsweise nannte ChatGPT seine erste Variante “Elegante Fusion”.
Perfekt sind die Resultate jedoch sicher nicht: Gemini hat eine Variante einer Nicht-Serifen-Schrift als Serifen-Schrift angegeben und konnte wegen der fehlenden Möglichkeit, Bilder zu generieren, keine Vorschau erstellen. ChatGPT wiederum hat zwar auch nach Anfrage eine Vorschau der Farbpalette erstellt, die Farben entsprechen jedoch nicht exakt den zuvor ausgegebenen Farben. Auch die vermeintlichen Farbcodes auf den generierten Bildern entpuppten sich auf den zweiten Blick als falsch. Dennoch: Für eine erste Inspiration und beim Entwickeln von Ideen sind die Bilder ein hilfreiches zusätzliches Asset, insofern hat ChatGPT hier sicher einen Vorteil.
Development
Wir haben auch unsere Entwickler um ein paar Prompts gebeten, um die KI-Tools wieder mit echten Alltagsaufgaben zu füttern.
Candylabs erster Development Prompt:
Generate a vanilla JS function stub that fires when the user is scrolling up on a page. The function should work on Desktop and Mobile.
Auch hier fielen die Antworten sehr umfangreich aus, der Code war in beiden Lösungen sehr ähnlich und sowohl ChatGPT als auch Gemini erklären die einzelnen Schritte und den Aufbau der Funktion sehr strukturiert. Im Gegensatz zu ChatGPT liefert Gemini einen Verweis auf vermeintlich relevante Quellen, in diesem Fall ein GitHub Repository, daher ist das Ergebnis etwas transparenter.
Candylabs zweiter Development Prompt:
Create a robots.txt file that allows /account/ but disallows all URLs under "account"
Bei dieser Prompt haben beide KIs eher knapp geantwortet, im Gegensatz zum Code, scheinen die KIs hier nicht darauf eingestellt zu sein weitere Erklärungen zu liefern. Tatsächlich war das Resultat von Gemini offensichtlich falsch. ChatGPTs Antwort entspricht der StackExchange Antwort mit den meisten Upvotes und dürfte je nach Setup funktionieren. Hier wären Links mit Quellen oder eine kurze Erklärung der Syntax bei beiden Tools wünschenswert gewesen.
Marketing
Last but not least, wie schlagen sich die Tools für Marketingzwecke? Wir haben zwei einfache Textformate generieren lassen.
Candylabs erster Marketing Prompt:
Schreibe zu diesem Thema einen aktivieren LinkedIn Post:
- neuer Blogbeitrag der ChatGPT und Gemini vergleicht
- Prompts aus dem Candylabs Teams für die Tests
- die Prompts decken Bereiche Marketing, Design und Development ab
Beide Texte haben uns trotz der sehr simplen Prompt mit hoher Qualität überrascht, sie wirken natürlich und ungezwungen – im Fall von Gemini sogar mit Aufforderungen zum Kommentieren des Posts. Insgesamt liefert Geminis Ergebnis einen sehr gut strukturierten Text mit kürzeren Abschnitten. Das Resultat von ChatGPT fällt wiederum etwas länger aus. Ein Vor-oder Nachteil ist das aber keineswegs, sondern eher kleinere stilistische Unterschiede.
Candylabs zweiter Marketing Prompt:
Schreibe einen aktivierenden CTA für eine Website, der Besucher:innen animiert den Newsletter zu abonnieren.
Auch hier ist die Prompt sehr allgemein und diesmal haben beide KI-Tools sehr unterschiedlich darauf reagiert. ChatGPT liefert 5 brauchbare, aber relativ generische Vorschläge. Dementsprechend hat Gemini erstmal Bestandteile und Textschnipsel nach Kategorien wie “Emotionen ansprechen” aufgelistet, anschließend Tipps für gelungene CTAs aufgezählt und abschließend vier Varianten vorgeschlagen. Die Prompt war sehr generisch und Geminis liefert zwar einen entsprechend generischen Output, aber verweist stark auf eine zielgruppengerechte Formulierung. Geminis Resultat liefert dadurch gute Stichpunkte, um das eher generische Ergebnis selbstständig oder in weitere Prompts auf den konkreten Fall anzupassen.
Fazit: Auf welchen KI-Chatbot sollten Sie setzen?
Der Praxistest: Stark mit leichten Unterschieden
Das Resultat ist sicher nicht eindeutig, beide KIs können bei Alltagsaufgaben sehr hilfreich sein. Im Gegensatz zu ChatGPT hat Gemini in zwei Fällen eindeutige Fehler produziert, dabei ist aber zu bedenken, dass wir hier kein repräsentatives Benchmarking betrieben haben.
Für kleinere Designaufgaben hat ChatGPT durch die Möglichkeit der Bildgenerierung eindeutig Vorteile. Wenn Google die Funktion für Gemini in Europa einführt, könnte sich das jedoch ändern. Während Bildgenerierung bei Gemini wünschenswert wäre, punktet Google durch das Einbauen von Weblinks. Resultate wirken dadurch mitunter transparenter und gerade beim Recherchieren kann das sicher hilfreich sein. Ein weiteres praktisches Feature ist, dass Google die Möglichkeit bietet, eine bereits gesendete Prompt zu bearbeiten und neu abzusenden.
Im Bereich Development hat ChatGPT wegen des eindeutigen Fehlers den Gemini ausgegeben hat, eher die Nase vorn. Aber ebenso wie für Design gilt, dass beide Modelle nicht auf den Bereich spezialisiert sind. Sowohl Microsoft als auch Google bieten hier spezialisierte Lösungen, auf die Entwickler:innen zurückgreifen können, dennoch können beide Chatassistenten je nach Einsatzszenario brauchbare Antworten generieren.
Als Sprachmodelle performen sowohl ChatGPT als auch Gemini sehr stark in Marketing und Copywriting-Tasks. Selbst die Ergebnisse der relativ generischen und einfach gehaltenen Prompts bieten eine gute Grundlage und sparen einiges an Arbeit.
Integration in Infrastruktur und Digitale Produkte
Mit Blick auf integrierbare und individualisierbare KI Lösungen machen beide Anbieter interessante, aber unterschiedliche Angebote: Eine API bieten beide an, wobei Googles API Pricing niedriger ausfällt. ChatGPT punktet vor allem durch ein einfaches No-Code Interface, das es Freelancern und kleinen Teams ohne technischen Hintergrund erlaubt, spezialisierte KI-Workflows in den eigenen Alltag zu integrieren. Googles Gems könnten hier in Zukunft ein ähnliches Angebot unterbreiten, besonders wenn Unternehmen auf Google Workspace setzen, könnte das ein starker Anreiz sein.
Darüber hinaus bietet Google mit Vertex AI Studio eine AutoML-Plattform an, die zwar Know-how voraussetzt, aber das Finetuning von Gemini-Modellen mit eigenen Daten ermöglicht. Für Unternehmen, die spezialisierte KI-Lösungen in ihre Business Infrastruktur oder Produkte integrieren wollen, kann das durchaus ein interessantes Angebot sein.
Viele der Ankündigungen von Google werden erst in den nächsten Wochen und Monaten starten, daher bleibt abzuwarten, wie sich das Angebot genau entwickelt. Mit Blick auf die fehlende Bildgenerierung in Europa ist auch abzuwarten, ob und wann welche Features auf den europäischen Markt kommen.
Beide Produkte bieten viele Möglichkeiten als Tools, die die Entwicklung digitaler Produkte vereinfachen und als Grundlage für die Integration von KI in die eigenen digitalen Produkte. Vorteile und Nachteile hängen stark vom Usecase, Einsatzszenario und in einigen Fällen auch von den Präferenzen der jeweiligen User ab.