Überblick
Wer einen Online-Shop betreibt, will von der KI empfohlen werden. Aber was ist eine KI-Empfehlung wert, wenn sie fast jeder bekommt? In einem Auswertungs-Run meiner Glas-Studie 2026 habe ich 19 deutsche Glas-Shops einzeln abgefragt, mit einer bewusst simplen Frage: Empfiehlst du diesen Shop? Einmal an Google, also AI Overview und AI Mode, einmal an ChatGPT mit Web.
Das Ergebnis fiel in beiden KI-Welten eindeutig aus, nur in entgegengesetzte Richtungen. Google sagte fast immer uneingeschränkt Ja. ChatGPT sagte kein einziges Mal uneingeschränkt Ja. Im Folgenden die Zahlen, eine mögliche Erklärung und was daraus für die KI-Sichtbarkeit folgt. Eine Beobachtung aus einem Run, keine allgemeingültige Studie.
Sigrid Holzners Beobachtung aus der Glas-Studie 2026: Auf die direkte Frage „Empfiehlst du diesen Shop?“ antwortet Google AI (AI Overview und AI Mode zusammen) in 31 von 35 Fällen mit einem uneingeschränkten Ja. ChatGPT tut das in 0 von 19 Fällen und hängt an jede Empfehlung eine Einschränkung. Die Lesart: Ein Lob, das fast jeder Anbieter bekommt, hat für den Käufer keine Trennschärfe. Fürs GEO folgt daraus, nicht auf das Pauschal-Lob zu optimieren, sondern auf die Substanz, die ChatGPTs Vorbehalte übersteht: echte Bewertungen, saubere Produktdaten, prüfbare Zertifikate. Ein Run, eine Branche, keine allgemeingültige Studie.
Wie unterscheiden sich Google AI und ChatGPT bei der Frage „Empfiehlst du diesen Shop?“
In einem Run der Glas-Studie 2026 gab Google AI bei 31 von 35 Antworten ein uneingeschränktes Ja, ChatGPT bei 0 von 19. Google fasst hier AI Overview und AI Mode zusammen. ChatGPT hängte an jede einzelne Antwort eine Einschränkung, meist den Hinweis, vorab Bewertungen, Lieferzeiten oder Zertifikate zu prüfen. Die Frage war für jeden Shop dieselbe und mit dem Markennamen gestellt, also eine direkte Bitte um ein Urteil.
Google sagt fast immer uneingeschränkt Ja, ChatGPT in keinem einzigen Fall.
Bei Google reichte die Spannweite von einem uneingeschränkten Ja bis zu genau einer kritischen Antwort. Bei ChatGPT gab es diese Spannweite gar nicht erst: jede der 19 Antworten lag im Bereich „ja, aber“.
Die folgende Tabelle zeigt, wie sich die Antworten je Engine auf drei Empfehlungs-Stufen verteilen. Google fasst AI Overview und AI Mode zusammen, ChatGPT steht für sich. In zwei weiteren Fällen erschien bei Google gar keine AI Overview, diese sind hier nicht mitgezählt.
| Antworttyp | Google AI (35 Antworten) | ChatGPT (19 Antworten) |
|---|---|---|
| Uneingeschränktes Ja | 31 | 0 |
| Ja, mit Einschränkung | 3 | 18 |
| Kritisch / vorbehaltlich | 1 | 1 |
Wichtig für die Einordnung: „Empfiehlst du diesen Shop?“ ist ein Brand-Prompt. Der Name des Anbieters steht schon in der Frage, das Modell muss nur noch ein Urteil fällen. Das ist etwas anderes als die offene Kauf-Frage „Welchen Anbieter empfiehlst du?“, bei der die KI erst eine Auswahl trifft. Hier ging es ausschliesslich um die direkte Endorsement-Frage zu einem bereits genannten Shop.
Was bedeutet ein KI-Lob, das fast jeder Anbieter bekommt?
Ein Empfehlungs-Signal trennt nur dann gute von schwachen Anbietern, wenn es nicht alle bekommen. Wenn Google AI fast neun von zehn geprüften Shops uneingeschränkt empfiehlt, verliert das einzelne Lob seine Aussagekraft. Für den Käufer ist die Information „Google empfiehlt diesen Shop“ dann fast wertlos, weil sie ihn nicht von der Konkurrenz unterscheidet.
Ich nenne das für mich Lob-Inflation: je mehr gelobt wird, desto weniger wiegt das einzelne Lob. Das ist meine Lesart der Zahlen, kein gemessener Fakt. Aber die Richtung ist klar. Ein Gütesiegel, das praktisch jeder Teilnehmer bekommt, ist kein Gütesiegel mehr, sondern eine Teilnahmebestätigung.
ChatGPTs eingebaute Vorsicht trennt übrigens genauso wenig zwischen guten und schlechten Shops, denn sie schränkt bei allen ein. Der Unterschied ist ein anderer: ChatGPT zwingt den Käufer wenigstens zum Hinschauen. Ein „ja, aber prüf vorher die Bewertungen“ ist für eine Kaufentscheidung nützlicher als ein pauschales „absolut empfehlenswert“, das ohne jede Bedingung kommt.
Ist ChatGPTs Vorsicht eine echte Bewertung oder ein Textbaustein?
ChatGPTs Einschränkungen können zwei Dinge sein: eine echte, inhaltliche Vorsicht oder ein automatischer Disclaimer-Baustein, der bei jeder Empfehlung mitläuft. Aus einem Run lässt sich das nicht sauber trennen. Wenn es ein fester Baustein ist, wäre ChatGPTs Vorsicht genauso wenig trennscharf wie Googles Lob, nur in die andere Richtung.
Diese Ehrlichkeit gehört dazu, sonst wäre die Beobachtung nur die Hälfte wert. Drei Einschränkungen muss ich klar benennen. Erstens: Das ist ein einziger Auswertungs-Run. Zweitens: Es ist eine einzige Branche, nämlich Glas-E-Commerce, und das Verhalten von KI-Engines ist branchen-, prompt- und zeitabhängig. Drittens: Beide Muster, Googles Pauschal-Lob wie ChatGPTs Pauschal-Vorbehalt, könnten teilweise durch die Art der Frage und durch feste Antwort-Vorlagen der Modelle erzeugt sein.
Was dagegen stabil bleibt, ist der Kontrast selbst. Dass Google in dieser Erhebung 31 von 35 Mal uneingeschränkt empfiehlt und ChatGPT 0 von 19 Mal, ist ein so deutlicher Unterschied, dass er kaum Zufall sein kann. Die Erklärung ist die Hypothese, der Kontrast ist die Beobachtung.
Worauf sollten Anbieter im GEO statt auf Pauschal-Lob optimieren?
Wer in der Google-Welt darauf hofft, durch ein warmes KI-Lob aufzufallen, optimiert auf ein Signal, das fast alle bekommen. Sinnvoller ist die Optimierung auf die Substanz, die ChatGPTs Vorbehalte beantwortet: echte Bewertungen auf Drittplattformen, vollständige und maschinenlesbare Produktdaten mit Schema-Markup, prüfbare Zertifikate und klare Lieferangaben.
In der Google-Welt entscheidet der Wettbewerb ohnehin nicht an der Wärme des Lobs, weil das Lob fast allen zuteil wird. Er entscheidet eine Stufe davor: Kommt die Marke in der Antwort überhaupt vor, und an welcher Position? Wer in der KI-Antwort nicht auftaucht, bekommt auch kein Pauschal-Lob ab. Sichtbarkeit und Position sind hier der eigentliche Hebel, nicht das Adjektiv.
In der ChatGPT-Welt liegt der Hebel an anderer Stelle, führt aber zur selben Arbeit. Weil ChatGPT bei jedem Anbieter einschränkt, gewinnt nicht der mit dem wärmsten Adjektiv, sondern der, dessen Substanz die Einschränkung übersteht. Wenn das Modell rät, vorab Bewertungen und Zertifikate zu prüfen, dann gewinnt, wer genau dort liefert. Beide Welten zeigen in dieselbe Richtung: Substanz vor Adjektiven.
Im GEO zählt nicht, wie warm die KI lobt, sondern ob die Substanz die Vorbehalte der KI übersteht.
Ein pauschales Lob lässt sich nicht optimieren, weil es fast jeder bekommt. Prüfbare Bewertungen, saubere Produktdaten und Zertifikate dagegen schon, und genau diese Signale beantworten die Vorbehalte, die ChatGPT von sich aus formuliert.
In Sigrid Holzners GEO-Audit-Methodik zählt nicht das Adjektiv der KI, sondern ob die nachprüfbare Substanz die Vorbehalte der KI beantwortet.
Häufige Fragen
Empfiehlt Google AI fast jeden Online-Shop?
In einem Auswertungs-Run der Glas-Studie 2026 hat Google AI auf die Frage „Empfiehlst du diesen Shop?“ in 31 von 35 Fällen ein uneingeschränktes Ja gegeben. Google fasst dabei AI Overview und AI Mode zusammen. Drei Antworten kamen mit einer Einschränkung, genau eine war kritisch. Das ist eine Beobachtung aus einem Run in einer Branche, keine allgemeingültige Studie.
Warum schränkt ChatGPT Empfehlungen fast immer ein?
In derselben Erhebung hat ChatGPT auf die Frage „Empfiehlst du diesen Shop?“ in 0 von 19 Fällen ein uneingeschränktes Ja gegeben. An jede Antwort hängte das Modell eine Einschränkung, meist den Hinweis, vorab Bewertungen, Lieferzeiten oder Zertifikate zu prüfen. Ob das eine inhaltliche Vorsicht ist oder ein automatischer Disclaimer-Baustein, lässt sich aus einem Run nicht eindeutig trennen.
Ist eine KI-Empfehlung von Google AI ein verlässliches Gütesiegel?
Ein Empfehlungs-Signal trennt nur dann gute von schwachen Anbietern, wenn es nicht alle bekommen. Wenn Google AI fast neun von zehn geprüften Shops uneingeschränkt empfiehlt, verliert das einzelne Lob seine Trennschärfe. Für den Käufer ist die Aussage „Google empfiehlt diesen Shop“ dann wenig wert, weil sie den Anbieter nicht von der Konkurrenz unterscheidet.
Worauf sollte man im GEO optimieren, wenn Google fast alle Shops lobt?
Statt auf das warme KI-Lob lohnt sich die Optimierung auf die Substanz, die ChatGPTs Vorbehalte beantwortet: echte Bewertungen auf Drittplattformen, vollständige und maschinenlesbare Produktdaten mit Schema-Markup, prüfbare Zertifikate und klare Lieferangaben. In der Google-Welt entscheidet zudem nicht die Wärme des Lobs, sondern ob die Marke in der Antwort überhaupt vorkommt und an welcher Position.
Quellen und Belege
- Glas-Studie 2026, eigene Erhebung, Visua Agency OÜ. Brand-Prompt „Empfiehlst du diesen Shop?“, ein Auswertungs-Run im Mai 2026, 19 deutsche Glas-Shops.
- Engines: Google AI Overview, Google AI Mode, ChatGPT mit Web. Frontend-Erhebung, jede Antwort einzeln klassifiziert (uneingeschränktes Ja, Ja mit Einschränkung, kritisch oder vorbehaltlich).
- Hinweis: In zwei Fällen erschien bei Google keine AI Overview, diese sind in den 35 Google-Antworten nicht enthalten.
Weiterlesen aus den Insights von Sigrid Holzner
Für alle, die tiefer in GEO und KI-Sichtbarkeit einsteigen wollen.
- Zitiert ist nicht empfohlen Warum eine Markennennung in einer KI-Antwort noch keine Empfehlung ist, und welche Stellschrauben den Unterschied machen.
- Konfiguratoren in der KI-Suche: Warum die teuerste UX-Investition unsichtbar bleibt Beobachtungen aus der Glas-Studie 2026: Marke wird genannt, die Kaufempfehlung geht trotzdem an den Wettbewerb.
- Wie monitore ich KI-Sichtbarkeit? Warum Citations eine Sackgasse sind. Eine Monitoring-Methodik mit vier Antwort-Stufen, getrennten Prompt-Sets und API-plus-Frontend-Tracking.
Konkrete Standortbestimmung gesucht? Der ECHO Audit für 590 EUR prüft, wie die eigene Marke und drei Wettbewerber in ChatGPT, Google AI Overview und Google AI Mode erscheinen. Sigrid Holzner liefert Ergebnis und Maßnahmenplan innerhalb von zehn Werktagen.