Im wettbewerbsintensiven Bereich der Unternehmens-SEO bezeichnet die Behebung von Crawling-Fehlern im E-Commerce den Prozess der Beseitigung technischer Hürden, die Suchmaschinen-Bots und KI-Systeme am Zugriff auf Ihre Produktdaten hindern. Im Jahr 2026 ist dies für die generative Suche und KI-gestützte Übersichten von entscheidender Bedeutung, denn wenn Bots aufgrund technischer Blockaden die Produktverfügbarkeit und Preisgenauigkeit in Echtzeit nicht abrufen können, wird Ihr Shop in den KI-gestützten Shopping-Empfehlungen schlichtweg nicht angezeigt. Ich habe Unternehmenswebsites betreut, bei denen einfache 404-Fehler und falsch konfigurierte Canonical-Tags täglich Tausende von Euro Umsatz kosteten, weil die erfolgreichsten Produktseiten plötzlich aus dem Index entfernt wurden.
Hier kommt ClickRank ins Spiel: Als führende Automatisierungs-Engine und zentrale Datenquelle optimiert es Ihr Crawling-Budget selbstständig und behebt Fehler, bevor diese sich negativ auf Ihr Geschäftsergebnis auswirken. Sich allein auf die Insights der Search Console zu verlassen, reicht nicht mehr aus; Sie benötigen ein System, das Folgendes gewährleistet: Serverseitiges Rendering ClickRank ist fehlerfrei und Ihre XML-Sitemaps werden dynamisch aktualisiert. Erfahrungsgemäß scheitert selbst das beste Marketing ohne eine solide technische Grundlage. ClickRank stellt sicher, dass Ihre Website-Architektur jederzeit für Googlebot und moderne Landingpage-Management-Systeme (LLMs) sichtbar und zugänglich bleibt.
Sie können ein Produkt nicht verkaufen, wenn Google es nicht findet. Um Crawling-Fehler im E-Commerce zu beheben, müssen Sie zunächst verstehen, dass Ihr Online-Shop im Grunde eine riesige Karte ist, die der Googlebot täglich zu lesen versucht. Wenn die Karte unterbrochene Wege oder Sackgassen enthält, gibt der Bot auf und geht zur nächsten Website.
Als ich anfing, große Online-Shops zu verwalten, dachte ich, solange meine Website für die Nutzer gut aussah, wäre alles in Ordnung. Ich irrte mich. Ich erlebte einmal, wie eine Website 20 % ihres organischen Traffics verlor, weil ein simpler Fehler in der robots.txt-Datei den gesamten Bereich „Neuheiten“ blockierte. Google konnte die Artikel buchstäblich nicht mehr sehen.
In diesem Leitfaden zeige ich Ihnen, wie wir diese technischen Hürden meistern. Wir betrachten die relevanten Daten der Google Search Console und wie Sie Ihre XML-Sitemap optimieren, damit Sie Ihr Crawling-Budget nicht für Seiten verschwenden, die Ihnen kein Geld einbringen. Es geht nicht nur darum, Checklisten abzuarbeiten, sondern darum, sicherzustellen, dass Ihre Technisches SEO für E-Commerce Die Strategie ist solide genug, um Tausende von Artikeln problemlos zu bewältigen.
Die Auswirkungen von Crawling-Fehlern auf den E-Commerce-Umsatz verstehen
Crawling-Fehler sind im Grunde genommen stille Killer für Ihren Umsatz, da sie verhindern, dass Ihre Produkte in den Suchergebnissen erscheinen. Wenn der Googlebot auf Ihrer Website auf ein Problem stößt, stellt er die Indexierung Ihres Warenbestands ein, wodurch Kunden die gewünschten Produkte nicht finden können.
Ich habe schon oft erlebt, wie sich Ladenbesitzer ausschließlich auf ein auffälliges Design konzentrierten, während ihr Seitenindexierungsbericht voller Warnsignale war. Ich erinnere mich an die Zusammenarbeit mit einer kleinen Marke, die nicht herausfinden konnte, warum ihre Bestseller nicht in den Suchergebnissen auftauchten. Es stellte sich heraus, dass eine fehlerhafte DNS-Konfiguration die Ursache für die zeitweiligen Probleme war. 500 ServerfehlerGoogle hat einfach aufgehört, diese Seiten zu crawlen. Nachdem wir die Serverantwortzeit verbessert hatten, erholte sich ihre Sichtbarkeit innerhalb weniger Wochen. Im E-Commerce ist ein Crawling-Fehler nicht nur eine technische Panne; er bedeutet, dass Ihr Online-Shop geschlossen ist.
Warum Crawlbarkeit das Rückgrat des Online-Handels in Italien ist
Auf dem italienischen Markt, wo der Wettbewerb um hochwertige Lederwaren und Mode hart ist, ist eine gute Suchmaschinenoptimierung Ihr größter Wettbewerbsvorteil. Ist Ihre Website-Architektur unübersichtlich, überlassen Sie Ihren Mitbewerbern im Grunde genommen Marktanteile.
Mir ist aufgefallen, dass italienische Online-Shops oft mit komplexen, facettenreichen Navigationssystemen zu kämpfen haben. Als ich einem Mailänder Schuhhändler half, erzeugten dessen Filter Millionen von überflüssigen URLs. Der Googlebot verbrachte seine Zeit damit, Größen- und Farbkombinationen zu crawlen, anstatt die eigentlichen Produktseiten aufzurufen. Wir mussten daher eine strikte Noindex-Meta-Tag-Strategie für diese Filterseiten implementieren. Dadurch konzentrierte sich der Bot auf die Seiten, die tatsächlich zu Conversions führten. Wenn der Bot Ihre Website nicht problemlos navigieren kann, suchen sich Ihre italienischen Kunden einfach eine Marke, die leichter zu finden ist.
Die Beziehung zwischen Crawl-Budget und Produktindexierung
Ihr Crawling-Budget ist die begrenzte Anzahl an Seiten, die Google täglich auf Ihrer Website crawlt. Für Shops mit Tausenden von Artikeln (SKUs) entscheidet die Verwaltung dieses Budgets darüber, ob Ihre neue Kollektion indexiert wird oder monatelang unentdeckt bleibt.
Früher dachte ich, Google würde schon alles finden, wenn ich nur abwartete. Ich musste jedoch schmerzlich erfahren, dass eine aufgeblähte Website alles ruiniert. Wenn Sie beispielsweise alte, nicht mehr verfügbare Produkte in Ihrer XML-Sitemap verlinken, verschwenden Sie wertvolle Ressourcen. In einem Projekt im letzten Jahr haben wir 30 % der inhaltsarmen Seiten entfernt. Plötzlich zeigte der Crawl-Statistikbericht, dass Google unsere margenstarken Kategorieseiten doppelt so häufig besuchte. Effiziente Indexierung beginnt damit, Google genau das zu zeigen, was wirklich zählt – und nichts anderes.
Wie Googlebot Produktkataloge mit hohem Volumen priorisiert
Google nutzt Signale wie Website-Geschwindigkeit und interne Verlinkung, um zu entscheiden, welche Teile eines umfangreichen Katalogs zuerst besucht werden. Dabei folgt Google tendenziell den stärksten Pfaden, beginnend mit der Startseite und den wichtigsten Kategorieseiten.
Ich habe festgestellt, dass die direkte Verlinkung Ihrer Neuheiten von der Startseite aus sehr hilfreich ist. Auf einem großen Elektronik-Onlineshop, den ich betreut habe, fiel uns auf, dass Produkte, die erst nach vier Klicks angezeigt wurden, kaum gecrawlt wurden. Wir haben die Breadcrumb-Navigation aktualisiert und einen Bereich „Aktuelle Trends“ hinzugefügt. Durch die Verkürzung des Klickpfads erfasste der Googlebot neue Artikelnummern innerhalb von Stunden statt Tagen. Es geht darum, den Weg des geringsten Widerstands zu Ihren wichtigsten Produkten zu führen.
Die Kosten für „Kriechkellerabfälle“ auf großen italienischen Einzelhandelsstandorten
Crawling-Verschwendung entsteht, wenn Suchmaschinen Zeit auf Seiten verbringen, die keinen Suchwert haben, wie Anmeldeseiten oder redundante URL-Parameter. Auf großen italienischen Websites kann dies zu erheblichen Verzögerungen bei der Aktualisierung von Preisen oder Lagerbeständen in den Suchergebnissen führen.
Ich habe einmal eine italienische Lebensmittel-Online-Plattform geprüft, die aufgrund ihrer Suchfilter ein massives Problem mit doppeltem Inhalt hatte. 60 % ihrer Crawling-Besuche wurden für identische Seiten verschwendet. Das bedeutete, dass ihr Produkt-Schema-Markup nicht aktualisiert wurde und Kunden bei Google veraltete Preise sahen. Wir haben das Problem mithilfe des X-Robots-Tags behoben, um den Bots mitzuteilen, diese Parameter zu ignorieren. Verschwendung zu reduzieren ist oft effektiver, als zu versuchen, mehr Crawling-Budget zu erhalten; es geht darum, das Vorhandene sinnvoll zu nutzen.
Identifizierung von Crawling-Fehlern im E-Commerce mithilfe der Google Search Console
Die Google Search Console ist das zuverlässigste Tool zur Behebung von Crawling-Fehlern im E-Commerce, da sie Ihnen genau das anzeigt, was Google sieht. Sie müssen nicht raten; die Daten finden Sie direkt im Bereich „Indexierung“.
Ich prüfe den Crawl-Statistikbericht mindestens einmal pro Woche. Ich erinnere mich an einen Fall, bei dem die Firewall eines Kunden versehentlich die Zugriffsrate von Google-IP-Adressen beschränkte. Wir bemerkten das nur, weil die Anzahl der 403-Fehler (Zugriff verweigert) in der Konsole plötzlich sprunghaft anstieg. Ohne dieses Dashboard wären wir völlig im Dunkeln getappt, während unsere Rankings einbrachen. Es ist der erste Anlaufpunkt, den Sie überprüfen sollten, sobald Sie einen Rückgang des organischen Traffics oder der Verkäufe feststellen.
Navigation im Seitenindexierungsbericht für Online-Shops
Der Seitenindexierungsbericht analysiert, warum bestimmte URLs nicht im Google-Index erscheinen. Für einen Online-Shop ist dieser Bericht die wichtigste Checkliste für die Pflege einer funktionierenden Website.
Oftmals sieht man eine Mischung aus 404-Fehlern und ausgeschlossenen Seiten. Viele E-Commerce-Manager geraten in Panik, wenn sie eine hohe Anzahl ausgeschlossener Seiten sehen. Manchmal ist das aber ein gutes Zeichen – beispielsweise, wenn Sie den Canonical-Tag korrekt verwendet haben. Befinden sich Ihre wichtigsten Produktseiten jedoch in der Liste der ausgeschlossenen Seiten, haben Sie ein Problem. Ich suche immer nach Mustern; fehlt eine bestimmte Kategorie, deutet das meist auf ein Problem mit der internen Verlinkung oder einen Fehler in der robots.txt-Datei hin.
Entschlüsselung von „Gecrawlt – derzeit nicht indexiert“ für Produktseiten
Dieser Status bedeutet, dass Google die Seite besucht, aber entschieden hat, dass sie nicht in den Suchergebnissen erscheint. Erfahrungsgemäß liegt dies meist an zu wenig oder doppeltem Inhalt.
Ich habe an einer Website gearbeitet, auf der für 500 verschiedene Artikel dieselben Herstellerbeschreibungen verwendet wurden. Google hat zwar alle Artikel gecrawlt, aber nur zehn indexiert. Die restlichen Artikel wurden als überflüssige Duplikate eingestuft. Wir haben das Problem behoben, indem wir für jede Artikelnummer (SKU) individuelle Anleitungen und Kundenrezensionen hinzugefügt haben. Nachdem die Inhalte einen höheren Mehrwert boten, hat Google die Artikel von „Gecrawlt“ auf „Indexiert“ hochgestuft. Wenn Sie diese Fehlermeldung sehen, bedeutet das, dass Ihre Seite nutzerfreundlicher gestaltet werden muss.
Umgang mit dem Eintrag „Entdeckt – derzeit nicht indexiert“ in neuen Sammlungen
Das bedeutet, dass Google die URL zwar kennt, sie aber noch nicht gecrawlt hat. Dies liegt häufig an der Serverkapazität oder Budget crawlen Problem, bei dem Google Ihre Website nicht überlasten möchte.
Wenn ich dies bei einer neuen Sammlung sehe, überprüfe ich die Hostverfügbarkeit im Crawling-Bericht. Ist Ihr Server langsam, reduziert Google die Crawling-Frequenz. Für einen Kunden haben wir die Bilder auf ein CDN ausgelagert, um die Last auf dem Hauptserver zu verringern. Nachdem sich die Serverantwortzeit verbessert hatte, begann Google sofort mit dem Crawlen der gefundenen Seiten. Wenn Google Ihre Website nicht crawlt, liegt das oft daran, dass die Verarbeitung für Google momentan zu aufwendig ist.
Verwendung des URL-Prüftools zur Echtzeit-Fehlerbehebung
Das URL-Prüftool funktioniert wie ein Röntgenbild für eine einzelne Seite. Es zeigt an, ob die Seite indexiert ist, ob sie für Mobilgeräte optimiert ist und wie der Googlebot die JavaScript-Darstellung interpretiert.
Ich nutze dieses Tool jedes Mal, wenn ich eine wichtige Produktseite veröffentliche. Ich hatte einmal eine Seite, die für mich perfekt aussah, aber das Prüftool zeigte, dass eine Web Application Firewall (WAF) Google daran hinderte, die Produktbilder zu laden. Da ich das manuell überprüft hatte, konnte ich das Problem innerhalb von fünf Minuten beheben, anstatt wochenlang auf die Daten in einem Bericht zu warten. Es ist der schnellste Weg, um zu überprüfen, ob Ihre rel="canonical"-Attribute und strukturierten Daten wie gewünscht funktionieren.
Erweiterte Diagnose mit Serverprotokolldateianalyse
Die Analyse von Logdateien ist die professionelle Methode, um in Echtzeit genau zu sehen, was Bots auf Ihrem Server tun. Sie ist präziser als die Search Console, da sie jeden einzelnen Zugriff von AdsBot-Google oder dem standardmäßigen mobilen Crawler anzeigt.
Ich nutze Tools wie Screaming Frog, um diese Logs zu analysieren. Ich erinnere mich an eine riesige Weiterleitungskette, die die Website sowohl für Nutzer als auch für Bots verlangsamte. Die Search Console zeigte nicht die gesamte Kette an, aber die Server-Logs zeigten, dass der Bot vier verschiedene URLs ansteuerte, bevor er das Endprodukt erreichte. Durch die Bereinigung dieser Weiterleitungen konnten wir unsere Time to First Byte (TTFB) verbessern und das Crawling deutlich effizienter gestalten. Wenn Sie Crawling-Fehler im E-Commerce wirklich beheben wollen, müssen Sie letztendlich die Logs analysieren.
Identifizierung von Bot-Mustern und Spitzenwerten der Crawl-Frequenz
Anhand Ihrer Protokolle können Sie erkennen, ob Google Ihre Website häufiger oder seltener besucht. Ein plötzlicher Rückgang der Crawling-Frequenz ist in der Regel ein Warnsignal dafür, dass etwas mit Ihrer Website-Geschwindigkeit oder dem Serverzustand nicht stimmt.
Ich bemerkte einmal einen sprunghaften Anstieg der Crawl-Aufrufe auf der Seite „Allgemeine Geschäftsbedingungen“ eines Kunden. Das war merkwürdig. Es stellte sich heraus, dass wir versehentlich eine interne Linkschleife eingebaut hatten, die den Bot immer wieder dorthin zurückschickte. Nachdem wir den Link korrigiert hatten, crawlt Google wieder die Produktseiten. Die Überwachung solcher Muster hilft Ihnen sicherzustellen, dass Google seine Zeit auf die Seiten verwendet, die tatsächlich Umsatz generieren.
Erkennung von 5xx-Serverfehlern während saisonaler Verkaufsspitzen in Italien
Bei großen Rabattaktionen wie dem Black Friday oder saisonalen Schwankungen in Italien stößt der Server an seine Grenzen. Ein 500-Serverfehler signalisiert Google, dass Ihre Website nicht erreichbar ist, was dazu führen kann, dass Ihre Seiten genau dann aus dem Index entfernt werden, wenn Sie sie am dringendsten benötigen.
Ich empfehle immer, vor einem großen Launch die Serverkapazität zu überprüfen. Ich habe mit einem Einzelhändler zusammengearbeitet, der während eines Flash-Sales einen sprunghaften Anstieg von „500 Internal Server Error“-Fehlern verzeichnete. Wir analysierten die Logs und stellten fest, dass das Bestandsverwaltungs-Plugin die Datenbank überlastete. Wir optimierten den Code und erhöhten die Ratenbegrenzung für nicht unbedingt notwendige Bots. Dadurch blieb die Website während der umsatzstärksten Zeiten des Jahres sowohl für Google als auch für echte Kunden stabil.
Behebung häufiger HTTP-Statuscode-Fehler (4xx und 5xx)
HTTP-Fehler sind im Grunde die „Hindernisse“ des Internets. Wenn Googlebot auf einen 4xx- oder 5xx-Fehler stößt, ist das, als würde er gegen ein „Geschäft geschlossen“-Schild stoßen. Für einen Onlineshop schaden diese Fehler nicht nur dem Ranking, sondern beeinträchtigen auch die Nutzererfahrung massiv.
Meiner Erfahrung nach deuten 4xx-Fehler meist auf fehlende Inhalte hin, während 5xx-Fehler bedeuten, dass der Server überlastet ist. Ich habe einmal mit einer Website gearbeitet, die Hunderte von 404-Fehlern hatte, weil alte Saisonkategorien planlos gelöscht wurden. Der organische Traffic brach ein, da die alten Seiten noch wertvolle Backlinks enthielten, die nun ins Leere führten. Wir mussten diese alten URLs systematisch neuen, relevanten Kategorien zuordnen, um die verlorene Linkkraft wiederherzustellen.
Behebung von 404-Fehlern bei nicht mehr erhältlichen Produkten
Wenn ein Produkt dauerhaft nicht mehr verfügbar ist, signalisiert ein 404-Fehler Google, dass die Seite fehlt. 404-Fehler sind zwar ein natürlicher Bestandteil des Webs, doch Tausende davon auf einer E-Commerce-Website lassen den Shop vernachlässigt wirken und verschwenden Ihr Crawling-Budget.
Normalerweise rate ich meinen Kunden, sich die Traffic-Daten anzusehen, bevor sie entscheiden, was zu tun ist. Wenn ein eingestelltes Produkt noch über soziale Medien oder alte Newsletter aufgerufen wird, lasse ich es nicht einfach mit einem 404-Fehler zurück. Meiner Erfahrung nach ist es am besten, den Nutzer (und den Bot) zum nächstbesten Produkt zu führen. Als beispielsweise ein bestimmtes Laufschuhmodell auf einer von mir betreuten Website eingestellt wurde, stellten wir sicher, dass die alte URL nicht einfach nicht mehr funktionierte, sondern dem Kunden half, die neuere Version zu finden.
Implementierung von 301-Weiterleitungen im Vergleich zu 410-Fehlern bei nicht vorrätigen Artikeln
Dies ist eine klassische Debatte im Bereich der technischen Suchmaschinenoptimierung für E-Commerce. Eine 301-Weiterleitung ist eine dauerhafte Änderung, die die Ranking-Position auf eine neue Seite überträgt, während eine 410-Gone-Weiterleitung Google signalisiert, dass die Seite absichtlich entfernt wurde und schnellstmöglich aus dem Index gelöscht werden sollte.
Ich verwende 301-Weiterleitungen, wenn es einen direkten Ersatz gibt – beispielsweise beim Wechsel von einem Modell aus dem Jahr 2024 zu einem Modell aus dem Jahr 2025. 410-Weiterleitungen nutze ich hingegen für Artikel, die nie wieder erscheinen und für die es keinen logischen Ersatz gibt. In einem Projekt hatten wir Tausende von Vintage-Einzelstücken. Diese alle auf die Startseite umzuleiten, wirkte auf Google wie Spam, daher verwendeten wir 410-Weiterleitungen, um den Index zu bereinigen. Das ist eine elegantere Art, Google mitzuteilen: „Sucht nicht mehr danach, dieser Artikel ist nicht mehr verfügbar.“
Verwaltung interner Links zu nicht mehr existierenden Produkt-URLs
Das Aufspüren und Reparieren defekter interner Links ist eine der einfachsten Methoden, Crawling-Fehler im E-Commerce zu beheben. Wenn Ihre Website Nutzer weiterhin über die Navigation oder die Bereiche „Ähnliche Produkte“ auf 404-Fehlerseiten weiterleitet, verärgern Sie sowohl Kunden als auch Suchmaschinen-Bots.
Ich nutze immer einen Crawler wie Screaming Frog, um solche Fehler aufzuspüren. Ich erinnere mich an die Überprüfung einer Mode-Website, bei der der Link zur Größentabelle auf jeder einzelnen Produktseite aufgrund eines Tippfehlers in der URL defekt war. Das führte zu Tausenden von Sackgassen. Durch die Korrektur dieses einen Links in der Fußzeile konnten wir über Nacht einen Großteil der Crawling-Fehler beheben. Achten Sie darauf, dass Ihre interne Verlinkungsstruktur stets aktuell ist, wenn sich Ihr Warenbestand ändert.
Beseitigung von Soft-404-Fehlern auf leeren Kategorieseiten
Ein Soft 404 tritt auf, wenn eine Seite für einen Nutzer wie eine „Nicht gefunden“-Seite aussieht (z. B. die Meldung „Keine Produkte gefunden“), der Server aber trotzdem den Statuscode „200 OK“ sendet. Google mag das gar nicht, weil es verwirrend ist.
Das kommt im E-Commerce häufig vor, wenn eine Kategorie ausverkauft ist. Ich habe einmal mit einer Marke zusammengearbeitet, deren Kategorie „Sale“ eine Woche lang leer war. Google stufte sie daraufhin als Soft-404-Fehler ein. Anstatt sie leer zu lassen, fügten wir eine „Bald wieder verfügbar“-Meldung und Links zu ausgewählten Artikeln hinzu. So blieb die Seite nutzbar. Wenn eine Kategorie leer bleiben soll, ist es besser, ein Noindex-Meta-Tag zu verwenden oder sie vorübergehend weiterzuleiten, um die Suchmaschine nicht zu verwirren.
Behebung von 500 Internen Serverfehlern und 503 Dienst nicht verfügbar
Diese 5xx-Fehler sind schwerwiegend, da sie auf einen Serverausfall hinweisen. Ein 500 Internal Server Error ist eine allgemeine Fehlermeldung („Etwas ist schiefgelaufen“), während ein 503 Service Unavailable in der Regel bedeutet, dass der Server überlastet oder aufgrund von Wartungsarbeiten nicht erreichbar ist.
Ich habe schon erlebt, dass Websites aus dem Index entfernt wurden, weil sie zu lange im Status 503 verharrten. Bei der Migration einer Website für einen großen Einzelhändler kam der Server mit dem neuen Code nicht zurecht und gab ständig 500-Fehler aus. Wir mussten die DNS-Konfiguration und die Serverprotokolle überprüfen, um ein Speicherleck zu finden. Treten diese Fehler wiederholt auf, drosselt Google die Crawling-Frequenz, und die Wiederherstellung kann Wochen dauern.
Optimierung der Serverantwortzeiten für E-Commerce-Events mit hohem Datenverkehr
Wenn während eines Ausverkaufs Tausende von Besuchern Ihre Website aufrufen, kann die Serverantwortzeit sprunghaft ansteigen. Dauert die Antwort zu lange, kann Googlebot den Crawling-Vorgang abbrechen.
Ich empfehle stets den Einsatz eines CDN (Content Delivery Network), um Ihren Hauptserver zu entlasten. Bei einem großen italienischen Weihnachtsschlussverkauf, den ich beratend begleitet habe, haben wir alle Produktbilder und statischen Dateien zwischengespeichert. Dadurch konnte die Time to First Byte (TTFB) deutlich reduziert werden. Selbst bei massivem Traffic blieb der Server reaktionsschnell genug, damit Google weiterhin neue Angebote indexieren konnte. Es geht darum sicherzustellen, dass Ihre Infrastruktur den Ansturm eines Großereignisses bewältigen kann.
Verwaltung von Datenbankverbindungs-Timeouts während der Inventarsynchronisierung
Viele Online-Shops synchronisieren ihren Warenbestand mehrmals täglich mit einem ERP-System oder Google Merchant Center. Sind diese Synchronisierungen zu umfangreich, kann dies die Datenbank blockieren und zu 5xx-Serverfehlern für alle Besucher der Website führen – auch für Google.
Ich habe einmal mit einem Kunden zusammengearbeitet, dessen Bestandssynchronisierung stündlich stattfand und 10 Minuten dauerte. Während dieser 10 Minuten war die Website extrem langsam. Wir verlegten die umfangreichen Synchronisierungen auf die späten Abendstunden und optimierten die Produktdatenquellen, sodass nur geänderte Artikel aktualisiert wurden. Dadurch wurde ein Datenbank-Timeout verhindert und die Hostverfügbarkeit im Crawl-Statistikbericht blieb konstant hoch.
Technische Lösungen für Crawl-Blocker speziell für den E-Commerce
Der Umgang mit E-Commerce-Plattformen bedeutet meist einen Kampf gegen automatisch generierten Datenmüll. Plattformen wie Shopify oder Magento erstellen gerne Tausende von URLs für Suchfilter oder verschiedene Sortierreihenfolgen. Ohne technische Anpassungen verbringt der Googlebot den ganzen Tag damit, nach „Schuhen – Preis niedrig bis hoch“ zu suchen, anstatt Ihre eigentlichen Produkte anzuzeigen.
Ich habe einmal eine Woche damit verbracht, eine Website aufzuräumen, bei der der Entwickler versehentlich den gesamten Ordner „/products/“ in der robots.txt-Datei blockiert hatte, als er versuchte, eine Testumgebung auszublenden. Klingt nach einem Anfängerfehler, kommt aber häufiger vor, als man denkt. Uns fiel es auf, weil das URL-Prüftool ständig „Durch robots.txt blockiert“ anzeigte. Das Beheben dieser Blockaden ist der schnellste Weg, um eine sofortige Verbesserung der Sichtbarkeit Ihrer Seiten in den Suchergebnissen zu erzielen.
Optimierung der robots.txt-Datei für Suchmaschinen-Bots und KI-Crawler
Ihre robots.txt-Datei ist im Prinzip das „Zutritt verboten“-Schild für Ihre Website. In einem Online-Shop verwenden Sie sie, um Bots von Ihren Checkout-, Warenkorb- und Kontoseiten fernzuhalten, da diese für Suchmaschinen irrelevant sind.
Heutzutage muss ich auch KI-Crawler berücksichtigen. Mir ist aufgefallen, dass einige dieser neueren Bots recht aggressiv sein und die Serverkapazität stark beanspruchen können. Ich empfehle daher in der Regel eine schlanke robots.txt-Datei, die Bots klar anweist, die Verzeichnisse `/admin/` und `/search/` zu meiden. Ein Shop, mit dem ich kürzlich zusammengearbeitet habe, wurde von Scrapern massiv überlastet, die die gesamte Bandbreite verbrauchten. Durch die Verschärfung der Regeln in ihrer robots.txt-Datei konnten wir die Serverressourcen für die Bots freihalten, die tatsächlich beim Verkauf helfen – wie beispielsweise den Haupt-Google-Crawler.
Verhindern des Crawlings von Facettennavigation und Filtern
Die Facettennavigation – also die Filter für Größe, Farbe und Preis – ist die Hauptursache für die Verschwendung des Crawl-Budgets. Bei zehn Filtern können Millionen von Kombinationen entstehen, und Google versucht, sie alle zu crawlen.
Ich habe festgestellt, dass die beste Vorgehensweise darin besteht, diese spezifischen Parameter in Ihrer Konfiguration zu blockieren. Robots.txtIch füge beispielsweise eine Zeile wie `Disallow: /*?size=` hinzu, um zu verhindern, dass der Bot jede Schuhgrößenvariante erfasst. Ich erinnere mich an einen Schmuckshop, dessen URLs aufgrund von Filtern über 2 Millionen Mal indexiert wurden. Nachdem wir diese Pfade blockiert hatten, verschwendete Google keine Zeit mehr mit irrelevanten Inhalten und begann endlich, die neuen Kollektionen zu indexieren. Es ist eine einfache Lösung, die einen enormen Unterschied für die technische SEO Ihres E-Commerce-Shops ausmacht.
Sicherstellen, dass CSS- und JS-Dateien für das Rendering zugänglich sind.
Google muss Ihre Website genauso sehen wie ein Mensch, d. h. es muss Ihr CSS und JavaScript herunterladen. Wenn Ihre robots.txt-Datei diese Dateien blockiert, kann Google die Seite nicht korrekt darstellen, und Ihre Mobile-First-Indexierungs-Ergebnisse werden stark sinken.
Ich habe einmal eine Website gesehen, deren Core Web Vitals in der Search Console katastrophal aussahen, obwohl die Seite für mich schnell war. Es stellte sich heraus, dass der JavaScript-Ordner des Themes blockiert war. Googlebot konnte das Layout nicht erkennen und hielt die Seite daher für fehlerhaft und „nicht benutzerfreundlich“. Überprüfen Sie daher immer das URL-Prüftool, um den gerenderten Screenshot zu sehen. Wenn der Screenshot wie ein wirres Durcheinander von Text aussieht, blockieren Sie wahrscheinlich eine Datei, die der Bot benötigt, um Ihr Design zu verstehen.
Verwaltung der Facettennavigation und URL-Parameter
Selbst wenn Sie einige Filter in der robots.txt-Datei blockieren, werden manche URL-Parameter dennoch durchgelassen. Durch die korrekte Verwaltung dieser Parameter stellen Sie sicher, dass Google Ihre Website nicht als Ansammlung von doppeltem Inhalt einstuft.
Ich rate immer dazu, an die Suchintention zu denken. Muss ein Nutzer wirklich eine Seite mit „Blauen Hemden unter 20 Dollar“ bei Google finden? Normalerweise nicht. Ich habe festgestellt, dass die Verwendung von Canonical-Tags der sicherste Weg ist, Google zu signalisieren: „Hey, ich weiß, diese URL sieht anders aus, aber sie ist im Grunde nur eine Version dieser Hauptseite.“ So konzentriert sich Ihre Ranking-Power auf eine einzige, aussagekräftige URL, anstatt sie auf ein Dutzend gefilterter Versionen zu verteilen.
Verwendung von Canonical-Tags zur Vermeidung von Duplicate-Content-Schleifen
Das rel="canonical"-Tag gibt Google einen Hinweis darauf, welche Version einer Seite die „Master“-Version ist. Im E-Commerce, wo dasselbe Produkt in drei verschiedenen Kategorien geführt werden kann, ist dieses Tag unerlässlich.
Ich habe mit einem Geschäft zusammengearbeitet, das dasselbe Kleid unter „Sommermode“, „Neuheiten“ und „Abendkleider“ anbot. Google war sich unsicher, welches Produkt am besten gerankt werden sollte, und platzierte daher keines der Angebote gut. Wir fügten ein Canonical-Tag hinzu, das alle drei Links auf die Hauptprodukt-URL verwies. Innerhalb eines Monats schaffte es die Hauptseite auf die erste Seite der Suchergebnisse. Das ist eine hervorragende Methode, um Keyword-Kannibalisierung zu vermeiden und sicherzustellen, dass man in den Suchergebnissen nicht mit sich selbst konkurriert.
Konfigurieren von URL-Parametern in GSC zur Einsparung des Crawl-Budgets
Obwohl Google die Parameterverwaltung weitgehend automatisiert hat, können Sie in der Google Search Console weiterhin viel beitragen. Indem Sie Google mitteilen, welche Parameter den Seiteninhalt verändern und welche lediglich der Nachverfolgung dienen, erleichtern Sie dem Unternehmen die Arbeit erheblich.
Ich sehe häufig Websites mit „Session-IDs“ oder „Tracking-IDs“ in der URL. Diese ändern zwar nichts an der Darstellung für den Nutzer, erscheinen einem Bot aber als neue Seiten. Ich habe einmal einem Kunden geholfen, dessen „utm“-Tracking-Codes indexiert wurden. Wir haben die Einstellungen angepasst und Google angewiesen, diese Parameter zu ignorieren. Dadurch wurde der Crawling-Verbrauch sofort gestoppt. Wenn Sie verhindern können, dass der Bot 50 Versionen derselben Seite durchsucht, hat er mehr Zeit, Ihre neuen Produkte zu finden.
Prüfung von XML-Sitemaps auf Indexierungseffizienz
Ihre XML-Sitemap ist eine direkte Liste der Seiten, die Google indexieren soll. Wenn diese Liste fehlerhaft ist, verliert Google das Vertrauen in sie.
Ich überprüfe Sitemaps grundsätzlich mindestens einmal im Monat. Mir sind schon Websites aufgefallen, deren Sitemap 404-Fehlerseiten oder Seiten mit einem Noindex-Meta-Tag enthält. Das ist, als würde man jemandem eine Karte mit falschen Anweisungen geben. Bei einem Projekt für einen großen Elektronikhändler stellten wir fest, dass dessen Sitemap seit drei Monaten nicht aktualisiert worden war. Google versuchte, Tausende von Produkten zu crawlen, die längst nicht mehr verfügbar waren. Eine saubere Sitemap ist eine der einfachsten, aber effektivsten Methoden, um Crawling-Fehler im E-Commerce zu beheben.
Entfernen von URLs mit einem Status ungleich 200 aus dynamischen Sitemaps
Ihre Sitemap sollte ausschließlich URLs mit dem Statuscode „200 OK“ enthalten. Wenn Sie Weiterleitungen oder defekte Links einfügen, täuschen Sie Googlebot, und dieser wird Ihre Sitemap schließlich komplett ignorieren.
Ich habe einmal mit einem Entwickler zusammengearbeitet, der eine „dynamische“ Sitemap eingerichtet hatte, die nicht prüfte, ob ein Produkt tatsächlich auf Lager war. Das führte dazu, dass Google monatelang auf 301-Weiterleitungen landete. Wir haben das Skript so angepasst, dass es nur noch verfügbare Produkte enthielt. Das Ergebnis? Die Indexierungsrate im Seitenindexierungsbericht schnellte in die Höhe, da Google keine Sackgassen mehr fand. Eine Sitemap sollte eine übersichtliche, sorgfältig zusammengestellte Liste Ihrer besten Seiten sein, nicht eine Sammlung aller URLs, die Ihre Website jemals erstellt hat.
Nutzung von Bild-Sitemaps zur Verbesserung der Sichtbarkeit von Produktbildern in der Suche
Für Online-Shops ist die Bildoptimierung enorm wichtig, da viele Kunden über Google Bilder einkaufen. Eine Bild-Sitemap hilft Google, alle Produktfotos zu finden, insbesondere solche, die möglicherweise durch JavaScript oder Slider verdeckt werden.
Ich schlage immer vor, Folgendes hinzuzufügen: Sie können Tags in Ihre bestehende Sitemap einfügen oder eine separate Sitemap erstellen. Auf einem Möbel-Onlineshop, den ich betreut habe, stellten wir fest, dass Google die hochauflösenden Bildergalerien nicht erkannte, da diese erst nach dem Klicken eines Buttons geladen wurden. Wir fügten die Bild-URLs mit passenden Bildunterschriften zur Sitemap hinzu. Kurz darauf stieg der Traffic aus der Bildersuche um 15 %. Wenn Ihre Artikelnummer (SKU) hervorgehoben werden soll, stellen Sie sicher, dass Google jedes Foto davon finden kann.
Lösung internationaler SEO-Crawling-Probleme für italienische Märkte
Wenn Sie mit einem Onlineshop international expandieren – insbesondere auf dem italienischen Markt – wird es schnell kompliziert. Google muss herausfinden, welche Version Ihrer Website einem Kunden in Rom und welche einem in New York angezeigt werden soll. Ist Ihre technische Konfiguration unübersichtlich, kann der Googlebot in einer Endlosschleife hängen bleiben oder, schlimmer noch, nur eine Version indexieren und die anderen ignorieren.
Ich habe einmal für eine Luxusledermarke gearbeitet, die eine internationale Website und ein separates italienisches Geschäft betrieb. Aufgrund einer fehlerhaft konfigurierten Firewall blockierten sie versehentlich den italienischen Googlebot, sodass dieser ihre englische Website nicht erreichen konnte. Dadurch war ihre internationale Suchmaschinenoptimierung praktisch unmöglich. Wir mussten sicherstellen, dass die DNS-Konfiguration es Bots aus allen Regionen ermöglichte, alle Sprachversionen zu sehen. Wenn der Bot Ihre internationalen Seiten nicht crawlen kann, sind Sie für Ihre internationalen Kunden im Grunde unsichtbar.
Korrekte Implementierung von Hreflang-Tags für multiregionale Shops
Hreflang-Tags sind Signale, die Google mitteilen, für welche Sprache und Region eine bestimmte Seite bestimmt ist. Für einen Online-Shop ist dies die einzige Möglichkeit, doppelte Inhalte, beispielsweise zwischen einem „en-us“- und einem „en-gb“-Shop, zu vermeiden.
Ich habe schon so viele „professionelle“ Setups scheitern sehen, weil ein winziger Tippfehler in diesen Tags nicht funktionierte. Ich erinnere mich an einen Kunden, der „it-IT“ für seinen italienischen Shop nutzte, aber vergaß, von seinem britischen Shop zurückzuverlinken. Google war verwirrt und zeigte den Kunden in Mailand plötzlich die britischen Preise (in Pfund) an. Wir mussten die JSON-LD- und Header-Tags prüfen, um sicherzustellen, dass jede Seite korrekt auf die zugehörigen Seiten verwies. Das ist zwar viel manuelle Arbeit, aber nur so lässt sich verhindern, dass die technische SEO für E-Commerce weltweit zusammenbricht.
Behebung von Fehlern der Art "Hreflang no return tag".
Dies ist der häufigste Fehler bei internationalen Webcrawlern. Er tritt auf, wenn Seite A angibt: „Seite B ist meine italienische Version“, Seite B aber nicht angibt: „Seite A ist meine englische Version“. Es ist wie ein Händedruck, bei dem eine Person den Händedruck verweigert.
Ich sehe das ständig im Seitenindexierungsbericht. Ich habe mal an einer Website gearbeitet, auf der neue deutsche Seiten hinzugefügt wurden, aber vergessen wurde, die ursprünglichen italienischen Seiten entsprechend zu verlinken. Google hat daraufhin Tausende von Fehlern wegen fehlender Return-Tags gemeldet. Wir haben ein Tool wie Ahrefs verwendet, um die fehlenden Links zu ermitteln und sie im Backend-Template der Website zu korrigieren. Wenn der Return-Tag fehlt, ignoriert Google Ihre lokalisierten Seiten möglicherweise komplett.
Zuordnung der Sprachversionen für die Regionen IT, EN und EU
Die korrekte Zuordnung Ihrer Website erfordert die Entscheidung, ob Sie ein Unterverzeichnis (site.com/it/) oder eine Subdomain (https://www.google.com/search?q=it.site.com) benötigen. Für den italienischen Markt bevorzuge ich in der Regel Unterverzeichnisse, da diese die gleiche Autorität wie die Hauptdomain besitzen und vom Googlebot leichter in einem Durchgang gecrawlt werden können.
Als ich einem Modehändler bei der Expansion half, erstellten wir eine detaillierte URL-Struktur. Wir stellten sicher, dass jede Artikelnummer (SKU) ein eindeutiges Äquivalent in den Ordnern für Italien, England und Frankreich hatte. Zusätzlich verwendeten wir ein „x-default“-Tag für Nutzer, die keiner bestimmten Region zugeordnet werden konnten. Dadurch erhielt Google eine klare Übersicht. Ohne eine solche Struktur riskiert man Keyword-Kannibalisierung, wodurch die eigenen englischen Seiten in Italien die italienischen Seiten in den Suchergebnissen übertreffen könnten.
Umgang mit währungs- und regionsspezifischen Weiterleitungsschleifen
Automatische Weiterleitungen basierend auf der IP-Adresse eines Nutzers können für den Googlebot ein Albtraum sein. Wenn Ihre Website alle Nutzer in Italien automatisch zum italienischen Shop (/it/) weiterleitet, kann es passieren, dass der Google-Crawler (der häufig aus den USA crawlt) Ihre italienischen Inhalte nicht mehr sieht.
Ich habe schon erlebt, dass Websites deswegen in einer Endlosschleife feststecken. Ein Nutzer ruft die Seite auf, der Server versucht, die Währung zu ändern, leitet dann sprachbasiert weiter und wiederholt das Ganze. Einmal verlor eine Website sogar ihren gesamten mobilen Index, weil der Mobile-First-Indexing-Bot in so einer Schleife hängen blieb und aufgab. Mein Rat? Erzwingen Sie keine Weiterleitung. Verwenden Sie stattdessen ein Banner, um den richtigen Shop vorzuschlagen. Das ist viel schonender für Ihr Crawling-Budget und deutlich weniger frustrierend für den Bot.
Erweiterte Strategien zur Vermeidung zukünftiger Crawl-Fehler
Die beste Methode, Crawling-Fehler im E-Commerce zu beheben, ist, sie von vornherein zu verhindern. Sie benötigen ein System, das Ihre Bestandsänderungen automatisch verarbeitet, damit Sie nicht nach jedem Verkaufsende manuell defekte Links reparieren müssen.
Ich habe schon mit zu vielen Marken zusammengearbeitet, die ihre Website „aufräumen“, indem sie einfach alte Seiten löschen. Das führt unweigerlich zu Problemen. Ich habe einmal ein exklusives Einrichtungshaus beraten, das jedes Jahr im Januar seine gesamte „Weihnachtskollektion“ löschte. Im Februar war die Google Search Console dann voller roter Fehlermeldungen. Wir haben eine präventive Strategie implementiert, bei der die betroffenen URLs auf die Hauptkategorie umgeleitet wurden, noch bevor die Seiten gelöscht wurden. Es geht darum, proaktiv statt reaktiv zu handeln.
Einführung einer „dauerhaften Umleitungsrichtlinie“ für saisonale Waren
Saisonale Artikel – wie Sommerbademode oder Black-Friday-Angebote – sind vergänglich, doch ihre URLs enthalten oft wertvolle Backlinks. Wenn Sie diese Seiten einfach mit einem 404-Fehler nicht mehr erreichen, verschenken Sie wertvolle Autorität.
Ich empfehle stets eine gestaffelte Weiterleitungsstrategie. Ist ein bestimmtes Produkt nicht mehr verfügbar, wird der Nutzer zur relevantesten Unterkategorie weitergeleitet. Ist die gesamte Kategorie nicht mehr verfügbar, erfolgt die Weiterleitung zur übergeordneten Kategorie. Für ein italienisches Modehaus erstellten wir Archivseiten, die den SEO-Wert aufrechterhielten und gleichzeitig den Nutzern die entsprechenden Produkte der neuen Saison präsentierten. Dadurch blieb die technische SEO für den E-Commerce das ganze Jahr über stabil, ohne dass der Linkwert älterer Presseberichte verloren ging.
Automatisierung der Erkennung defekter Links im E-Commerce-Technologie-Stack
Bei 50,000 Artikeln ist es unmöglich, jeden Link manuell zu prüfen. Daher muss die Fehlererkennung direkt in Ihren Workflow integriert werden, um Probleme zu erkennen, bevor Googlebot sie entdeckt.
Ich richte gerne automatisierte Crawls mit Tools wie SE Ranking oder Ahrefs ein, die jeden Montagmorgen laufen. Ich erinnere mich an einen Fall, bei dem ein Plugin-Update versehentlich die URL-Struktur aller „Sale“-Artikel veränderte. Dank einer automatischen Benachrichtigung konnten wir die fehlerhaften 301-Weiterleitungen innerhalb weniger Stunden erkennen. Hätten wir auf den Monatsbericht gewartet, wären uns wochenlange Umsatzeinbußen entstanden. Die Automatisierung macht aus einem riesigen Problem eine einfache, zehnminütige Lösung einmal pro Woche.
Verbesserung der Website-Architektur und der internen Linktiefe
Die Website-Architektur beschreibt die Struktur Ihrer Seiten. Ist Ihre Website zu „tief verschachtelt“, erreicht Google möglicherweise nie Ihre weniger relevanten Produkte. Eine flache, breite Struktur ist für das Crawling fast immer besser.
Ich sehe oft Websites, auf denen der Bereich „Ausverkauf“ sechs Ebenen tief im Verzeichnis versteckt ist. Bei einem großen Sportartikelhändler stellten wir fest, dass die tiefsten Seiten nur alle 60 Tage gecrawlt wurden. Wir optimierten die interne Verlinkung, um diese Seiten besser sichtbar zu machen. Durch die Verwendung von Widgets für „Empfohlene Produkte“ und einer verbesserten Breadcrumb-Navigation erschienen diese Seiten fast sofort im Index.
Sicherstellen, dass alle Produkte innerhalb von drei Klicks von der Startseite aus erreichbar sind.
Die „Drei-Klick-Regel“ gilt nicht nur für Nutzer, sondern auch für Bots. Muss der Googlebot beispielsweise fünf verschiedene Kategorien durchklicken, um ein Produkt zu finden, könnte er entscheiden, dass sich der Crawling-Aufwand nicht lohnt.
Ich habe einem Elektronikgeschäft geholfen, seine Navigation durch die Einführung von „Mega-Menüs“ zu vereinfachen, die direkt zu Unterkategorien verlinken. Vor der Umstellung waren vier Klicks nötig, um zu einem bestimmten Laptop-Modell zu gelangen. Nach der Umstellung waren es nur noch zwei. Wir verzeichneten einen deutlichen Anstieg in den Crawl-Statistiken, da der Bot plötzlich das gesamte Sortiment viel schneller erfassen konnte. Wenn Ihre Produkte schwer zu finden sind, geht Google davon aus, dass sie nicht wichtig sind.
Entfernung von „verwaisten Seiten“ im Produktkatalog
Eine „verwaiste Seite“ ist eine Seite, die zwar auf Ihrem Server existiert, aber von keiner anderen Seite Ihrer Website verlinkt ist. Da keine Pfade zu ihr führen, hat Google oft Schwierigkeiten, sie zu finden, und selbst wenn sie gefunden wird (über eine Sitemap), wird sie in den Suchergebnissen nicht gut platziert.
Bei Screaming Frog-Audits stoße ich häufig auf solche Seiten. Meist handelt es sich um alte Produktseiten, die zwar aus Kategorien entfernt, aber nie endgültig gelöscht wurden. Für einen italienischen Weinhändler fanden wir über 200 „verwaiste“ Flaschen, die zwar noch online, aber für Kunden nicht sichtbar waren. Wir fügten sie entweder wieder zu den „Ähnlichen Produkten“ hinzu oder leiteten sie auf aktuelle Jahrgänge weiter. Durch das Entfernen verwaister Seiten stellen wir sicher, dass jede Seite, für deren Hosting Sie bezahlen, tatsächlich Umsatz generiert.
Überwachung und Validierung technischer Korrekturen
Nachdem Sie die Crawling-Fehler in Ihrem E-Commerce-Shop behoben haben, sollten Sie nicht einfach die Hände in den Schoß legen und auf das Beste hoffen. Sie müssen sicherstellen, dass Google die Änderungen auch tatsächlich erkennt. Wenn Sie Ihre Arbeit nicht validieren, können die vermeintlich behobenen Fehler monatelang in Ihren Berichten auftauchen, sodass Sie nicht erkennen können, ob neue Probleme auftreten.
Ich erinnere mich an einen Fall, als ich stundenlang Weiterleitungsketten für einen Kunden bereinigt habe, nur um zwei Wochen später festzustellen, dass ich eine einzige Template-Datei übersehen hatte. Da ich den Validierungsstatus nicht überwacht hatte, bemerkte ich den Fehler erst, als die Rankings des Kunden wieder sanken. Im E-Commerce, wo sich die URL-Struktur mit jedem Verkauf ständig ändert, ist die kontinuierliche Überwachung unerlässlich, um immer einen Schritt voraus zu sein.
Nutzung der Funktion „Fehlerbehebung überprüfen“ in der Google Search Console
Die Schaltfläche „Problembehebung bestätigen“ in der Google Search Console ist äußerst hilfreich. Wenn Sie Google mitteilen, dass Sie ein Problem behoben haben – beispielsweise mehrere 404-Fehler –, werden die betroffenen URLs schneller neu gecrawlt und aus der Kategorie „Fehler“ entfernt.
Ich sage meinem Team immer, sie sollen den Button sofort drücken, sobald die technischen Änderungen live sind. Bei einem kürzlich abgeschlossenen Projekt hatten wir einen massiven Anstieg von Soft-404-Fehlern aufgrund einer leeren Kategorie „Sommerschlussverkauf“. Nachdem wir die Produkte wieder hinzugefügt hatten, starteten wir den Validierungsprozess. Anstatt die üblichen 28 Tage auf einen natürlichen Crawling-Zyklus zu warten, behob Google die Fehler in weniger als einer Woche. Das ist eine hervorragende Methode, um vom Googlebot schnellstmöglich eine positive Rückmeldung zu erhalten.
Einrichten benutzerdefinierter Warnungen für Crawl-Fehlerspitzen
Sie sollten sich nicht jeden Morgen in Ihr Dashboard einloggen müssen, um zu prüfen, ob Ihre Website funktioniert. Durch das Einrichten benutzerdefinierter Benachrichtigungen – entweder über ein Tool wie SE Ranking oder mithilfe eigener Skripte – können Sie auf 5xx-Serverfehler reagieren, bevor diese Ihre täglichen Einnahmen beeinträchtigen.
Ich hatte mal für eine italienische Mode-Website eine Benachrichtigung eingerichtet, die ausgelöst wurde, sobald die Anzahl der 4xx-Fehler innerhalb eines Tages um mehr als 10 % anstieg. Zwei Tage später klingelte mein Handy ununterbrochen. Ein Entwickler hatte versehentlich eine robots.txt-Regel gelöscht, und Google hatte begonnen, die internen „Test“-Suchergebnisse zu indexieren. Wir haben den Fehler rechtzeitig bemerkt und die Änderung innerhalb einer Stunde rückgängig gemacht. Ohne diese Benachrichtigung hätten wir unser gesamtes Crawling-Budget wochenlang für irrelevante Seiten verschwendet.
Regelmäßige technische Audits mit automatisierten SEO-Crawlern
Für einen großen Onlineshop reicht eine manuelle Prüfung nicht aus. Sie sollten mindestens einmal im Monat einen vollständigen Website-Crawl mit einem automatisierten Tool wie Screaming Frog oder Ahrefs durchführen. So finden Sie versteckte Probleme wie doppelten Inhalt oder fehlerhafte interne Verlinkungen, die die Search Console möglicherweise nicht sofort anzeigt.
Ich persönlich plane jeden Sonntagabend einen gründlichen Crawl, wenn der Traffic geringer ist. Kürzlich habe ich eine Website mit 100,000 Artikeln geprüft und festgestellt, dass die Canonical Tags nach einer Migration auf die falsche Domain verwiesen. Es war ein winziger Fehler, der einem Menschen entgangen wäre. Durch die Automatisierung des Audits konnten wir den Fehler finden, die XML-Sitemap aktualisieren und die technische SEO-Performance für den E-Commerce vor dem Ansturm am Montagmorgen sichern.
Wie oft sollte ich meinen Shop auf Crawling-Fehler überprüfen?
Ich empfehle in der Regel, einmal pro Woche einen kurzen Blick in die Google Search Console zu werfen. Wenn Sie einen großen Ausverkauf planen oder eine neue Kollektion auf den Markt bringen, hilft Ihnen die tägliche Überprüfung, 5xx-Serverfehler zu erkennen, bevor diese Ihnen Umsatzeinbußen bescheren.
Werden zu viele 404-Fehler meine Platzierung im Ranking beeinträchtigen?
Ein paar defekte Links schaden Ihrer Website nicht, aber Hunderte signalisieren Google, dass Ihr Shop schlecht gepflegt ist. Das verschwendet Ihr Crawling-Budget und kann dazu führen, dass Google Ihre margenstarken Produktseiten seltener besucht.
Soll ich nicht vorrätige Produkte immer umleiten?
Nicht immer. Wenn der Artikel bald wieder verfügbar ist, lassen Sie die Seite online. Wenn er dauerhaft nicht mehr erhältlich ist, verwenden Sie eine 301-Weiterleitung zu einem ähnlichen Produkt. 410-Fehlercodes verwende ich nur, wenn das Produkt einzigartig ist und es keinen logischen Ersatz gibt.
Warum werden meine neuen Produkte zwar gefunden, aber nicht indexiert?
Dies geschieht häufig, weil Googlebot die Serverkapazität Ihres Servers sorgfältig prüft. Wenn Ihre Website langsam ist oder zu viele inhaltsarme Inhalte enthält, wartet Google möglicherweise mit der Indexierung neuer Artikelnummern, bis Ihre Website als zuverlässiger eingeschätzt wird.
Kann ich Probleme mit der Facettennavigation ohne Entwickler beheben?
Sie können mithilfe der robots.txt-Datei vieles selbst erledigen, indem Sie bestimmte URL-Parameter blockieren. Bei komplexeren Anpassungen wie kanonischen Schleifen oder fortgeschrittenem JavaScript-Rendering benötigen Sie jedoch möglicherweise technische Unterstützung, um sicherzustellen, dass keine Fehler auftreten.