Neu Sitemap wird bei Bing wird wegen fehler abgelehnt

deliman

Sehr aktives Mitglied
13. Februar 2016
961
116
Die Einstellung "Suchmaschinen-Indexierung von Merkmalwert-URLs: " bringt dabei wohl nur einen teilweisen Erfolgt bzw. Entlastung, oder? Soweit ich weis, gilt sowas eher als Wunsch an die Crawler und wird nicht immer beachtet.
 

MHillmann

Moderator
Mitarbeiter
11. Oktober 2018
1.322
454
Hallo,

eine Überarbeitung der Merkmalfilter ist im Gespräch, eine Idee ist bei der Facettenfilterung z.B. auf die Methodik der PRG-Patterns zurückgreifen und auf die "__" bei der Merkmalfilter-Logik in der URL zu verzichten. Solch ein Umbau ist allerdings ein sehr aufwändiger und tiefgehender Eingriff und damit eher eine langfristige Lösung.

Die Einstellung "Suchmaschinen-Indexierung von Merkmalwert-URLs:", setzt "nur" den meta robots tag auf noindex und würde damit u.a. zu spät greifen. Es ist des Weiteren auch anzuraten, bei Performanceproblemen mit Merkmalen, nicht die Einstellung "Trefferanzahl bei Merkmalfiltern anzeigen - Trefferanzahl auch bei möglicher Mehrfachauswahl anzeigen (performancelastig)" zu verwenden.
Unabhängig davon, dass es bisher unklar ist, ob das die Lage des Crawlings durch den Bingbot ausreichend verbesseren würde, ist es aber auch schwierig Einstellungen vorzuschreiben. Prinzipiell kann es schon teuer werden, wenn der Bingbot einen einzigen Shop im Shared Hosting besucht, der viel mit Merkmalen arbeitet. Wir sind daher auf der Suche nach anderen Wegen.

Viele Grüße
Michael
 

css-umsetzung

Offizieller Servicepartner
SPBanner
6. Juli 2011
6.708
1.615
Berlin
@MHillmann das was ich oben gepostet habe (Auszug aus dem Log), ist wie schon angesprochen ein Fall wie ich ihn des Öfteren erlebe, in dem Fall bei mir war es ja ein anderer Spider und der scherrt sich nen sche...s drum was ich ihm über die Robots mitteilen möchte.

Problematisch ist bei der Merkmalgeschichte eben, das ich wenn ich mir Mühe gebe, auch als normaler User, so jeden Server lahmlegen kann, ich muss einfach der Menge der Cores entsprechend solche Suchen ausführen, da diese dann sehr lange dauern, sind dann alle Cores mit den MySQL Instanzen beschäftigt.

Nur durch die Änderungen der Merkmale, das diese keine reinen Links mehr sind (was ja eigentlich nur etwas Fleißarbeit in Verbindung mit JS/CSS ) im Template erfordert, hätte man aber die Bots schon nicht mehr als großes Problem.
Dann hättet Ihr in Ruhe Zeit euch die Merkmalsuche mal genauer anzuschauen.

Für mich macht es auch keinen Sinn das eine Suchmaschine meinen Merkmalen folgt, da es zu 90% nichts anderes als ein Produktlisting ohne content ist (hab mich jetzt als nicht SEO mal weit aus dem Fenster gelehnt :) ).
 

MHillmann

Moderator
Mitarbeiter
11. Oktober 2018
1.322
454
Hallo,

unsere bisherigen Tests bzgl. der Reaktivierung des Bingbots im Shared Hosting sehen gut aus. Wir schließen nun, wie bereits erwähnt, für den Bingbot die Merkmalfilter vom Crawling per robots.txt aus (die entsprechenden Anweisungen werden zur existierenden robots.txt hinzugefügt). Zusätzlich hat der Bingbot einen Crawl-delay bekommen. Es sollte hier also im Laufe der Zeit eine normale Indexierung für Bing stattfinden.
Wir werden die Änderungen im Laufe der Woche auf allen Shared Hostings deployen und die Server weiterhin genauer beobachten.
Wir werden zusätzlich die Weiterentwicklung des Bingbots beobachten, vor allem in Bezug auf dessen aggressives Crawling.
Falls es erneut zu Serverabstürzen aufgrund des Bingbots kommt, werden wir das Crawling für die entsprechenden Server temporär wieder abschalten und nach anderen Möglichkeiten suchen. In diesem Fall werden wir alle betroffenen Kunden benachrichtigen.
Ansonsten wollen wir wie bereits schon erwähnt prüfen, wie wir die Merkmalfilter weiter optimieren können, um auch an dieser Stelle noch an Performance zu gewinnen.

Eine Standard robots.txt sieht dann wie folgt aus:
# BITTE NICHT LOESCHEN, SERVER-/CRAWLING-OPTIMIERUNG
User-agent: Bingbot
User-agent: AdIdxBot
User-agent: BingPreview
User-agent: MicrosoftPreview
Crawl-delay: 5
Disallow: /*__*
Disallow: /navi.php
Disallow: /druckansicht.php
Disallow: /suche.php
Disallow: /bestellabschluss.php
Disallow: /bestellvorgang.php
Disallow: /jtl.php
Disallow: /pass.php
Disallow: /registrieren.php
Disallow: /warenkorb.php
Disallow: /admin
Disallow: /admin/*
Disallow: /dbeS/*
Disallow: /jtl-store/__
Disallow: /extension-store/__
Allow: *

User-agent: *
Crawl-delay: 5
Disallow: /navi.php
Disallow: /druckansicht.php
Disallow: /suche.php
Disallow: /bestellabschluss.php
Disallow: /bestellvorgang.php
Disallow: /jtl.php
Disallow: /pass.php
Disallow: /registrieren.php
Disallow: /warenkorb.php
Disallow: /admin
Disallow: /admin/*
Disallow: /dbeS/*
Disallow: /jtl-store/__
Disallow: /extension-store/__
Allow: *

Viele Grüße
Michael
 

MHillmann

Moderator
Mitarbeiter
11. Oktober 2018
1.322
454
Nur durch die Änderungen der Merkmale, das diese keine reinen Links mehr sind (was ja eigentlich nur etwas Fleißarbeit in Verbindung mit JS/CSS ) im Template erfordert, hätte man aber die Bots schon nicht mehr als großes Problem.
@css-umsetzung Bots können heutzutage auch in einem gewissen Rahmen Javascript ausführen. Es besteht wahrscheinlich eine gewisse Chance, dass das funktioniert, wäre aber auch keine nachhaltige Lösung.

Zum generellen Nutzen der Indexierung von Filter-Seiten kann ich auch nicht viel sagen, das ist ggf. auch von Fall zu Fall unterschiedlich. Hier würde ich auf jeden Fall auch empfehlen einen SEO-Experten zu befragen.
 

css-umsetzung

Offizieller Servicepartner
SPBanner
6. Juli 2011
6.708
1.615
Berlin

en001

Sehr aktives Mitglied
15. März 2017
450
43
Fillterseiten sollten mit noindex antworten im Code oder einen canonical-Link zur Standardsortierung haben.
Google passt sich an die Servergeschwindigkeit an bei der Menge wie oft gecrawlt wird.
 

css-umsetzung

Offizieller Servicepartner
SPBanner
6. Juli 2011
6.708
1.615
Berlin
Wir drehen uns hier dann langsam im Kreis :)

noindex, nofollow und was da alles so geht ist ganz nett, die seriösen Spider interessiert das ja eventuell auch aber es ist eben wichtig das da draußen auch viele rumrennen, die das nicht interessiert und da muss man dann eben auch versuchen, das einzudämmen.
 

deliman

Sehr aktives Mitglied
13. Februar 2016
961
116
Bei unseren Shops im JTL Hosting bereits umgesetzt und gestern bei Bing Webmaster Tools nachgesehen bzw. die Sitemaps noch mal neu geladen und jetzt liest sie Bing problemlos ein. Mal sehen, wann die Anzahl der indizierten Seiten wieder nach oben geht.
 
  • Gefällt mir
Reaktionen: css-umsetzung

P0ttwal

Aktives Mitglied
13. Juli 2021
48
15
Hallo,

eine Überarbeitung der Merkmalfilter ist im Gespräch, eine Idee ist bei der Facettenfilterung z.B. auf die Methodik der PRG-Patterns zurückgreifen und auf die "__" bei der Merkmalfilter-Logik in der URL zu verzichten. Solch ein Umbau ist allerdings ein sehr aufwändiger und tiefgehender Eingriff und damit eher eine langfristige Lösung.

Die Einstellung "Suchmaschinen-Indexierung von Merkmalwert-URLs:", setzt "nur" den meta robots tag auf noindex und würde damit u.a. zu spät greifen. Es ist des Weiteren auch anzuraten, bei Performanceproblemen mit Merkmalen, nicht die Einstellung "Trefferanzahl bei Merkmalfiltern anzeigen - Trefferanzahl auch bei möglicher Mehrfachauswahl anzeigen (performancelastig)" zu verwenden.
Unabhängig davon, dass es bisher unklar ist, ob das die Lage des Crawlings durch den Bingbot ausreichend verbesseren würde, ist es aber auch schwierig Einstellungen vorzuschreiben. Prinzipiell kann es schon teuer werden, wenn der Bingbot einen einzigen Shop im Shared Hosting besucht, der viel mit Merkmalen arbeitet. Wir sind daher auf der Suche nach anderen Wegen.

Viele Grüße
Michael

Ich wäre euch sooooo dankbar, wenn endlich mal die PRG-Patterns kommen würden. Das wünsche ich mir schon seit Jahren.
Nur mal so erwähnt :)
 

P0ttwal

Aktives Mitglied
13. Juli 2021
48
15
Hallo,

unsere bisherigen Tests bzgl. der Reaktivierung des Bingbots im Shared Hosting sehen gut aus. Wir schließen nun, wie bereits erwähnt, für den Bingbot die Merkmalfilter vom Crawling per robots.txt aus (die entsprechenden Anweisungen werden zur existierenden robots.txt hinzugefügt). Zusätzlich hat der Bingbot einen Crawl-delay bekommen. Es sollte hier also im Laufe der Zeit eine normale Indexierung für Bing stattfinden.
Wir werden die Änderungen im Laufe der Woche auf allen Shared Hostings deployen und die Server weiterhin genauer beobachten.
Wir werden zusätzlich die Weiterentwicklung des Bingbots beobachten, vor allem in Bezug auf dessen aggressives Crawling.
Falls es erneut zu Serverabstürzen aufgrund des Bingbots kommt, werden wir das Crawling für die entsprechenden Server temporär wieder abschalten und nach anderen Möglichkeiten suchen. In diesem Fall werden wir alle betroffenen Kunden benachrichtigen.
Ansonsten wollen wir wie bereits schon erwähnt prüfen, wie wir die Merkmalfilter weiter optimieren können, um auch an dieser Stelle noch an Performance zu gewinnen.

Eine Standard robots.txt sieht dann wie folgt aus:


Viele Grüße
Michael
Super und danke dafür.
Ich bin mir nur nicht sicher, ob ich das gut finde für alle Bots das Delay auch so hoch zu setzen?
Bei einem Shop mit 30.000 Artikel dauert das Crawling ja dann ewig oder nicht?
 

MHillmann

Moderator
Mitarbeiter
11. Oktober 2018
1.322
454
Wir das auch allgemein für JTL Shop ausgerollt? Patch?
Die robots.txt liegt prinzipiell in der Hand des Shopbetreibers. Wir werden dort also keine allgemeine Veränderung vornehmen.
Wenn man keine Performance bzw. Cache-Probleme hat ist ja an sich alles gut.

Unser Ziel wird es wie gesagt sein die Merkmalfilter zu überarbeiten, sodass solche Probleme abgeschwächt werden bzw im Bestfall gar nicht erst auftreten.
 

IT-Elle.de

Aktives Mitglied
16. Juni 2019
11
3
88271 Wilhelmsdorf
Firma
IT-Elle.de
Die robots.txt liegt prinzipiell in der Hand des Shopbetreibers. Wir werden dort also keine allgemeine Veränderung vornehmen.
Wenn man keine Performance bzw. Cache-Probleme hat ist ja an sich alles gut.

Unser Ziel wird es wie gesagt sein die Merkmalfilter zu überarbeiten, sodass solche Probleme abgeschwächt werden bzw im Bestfall gar nicht erst auftreten.
Und woher soll der Shopbetreiber es wissen?
Schonmal drüber nachgedacht so wichtige Infos auch an alle Shopbetreiber zu senden?
 
  • Gefällt mir
Reaktionen: 2009Butch

deliman

Sehr aktives Mitglied
13. Februar 2016
961
116
Wenn ich mir die Zugriffszahlen in Bing Webmaster Tools für unsere 2 betroffenen Shops so ansehe, ist der Einbruch mit dem Aussperren der Bingbots deutlich ab Mitte/Ende Juni zu erkennen und die haben sich bislang noch nicht wieder erholt.
 
Ähnliche Themen
Titel Forum Antworten Datum
Neu Sitemap ist HTML - Sitemap kann gelesen werden, enthält aber Fehler / Google Web Master Tool Allgemeine Fragen zu JTL-Shop 6
Neu Variationskombinationen in der Sitemap Allgemeine Fragen zu JTL-Shop 5
Dropdown Variation wird nicht angezeigt JTL-Wawi 1.8 0
Neu Header Checkout, Topbar wird nicht ausgeblendet, Shop-Template 5.3, Neustes Child Theme GitLab Templates für JTL-Shop 2
Neu Passwort vergessen Mail wird nicht gesendet in 5.3.1 JTL-Shop - Fehler und Bugs 1
Neu JTL-WMS Mobile Artikelname wird nicht mehr vollständig angezeigt JTL-WMS / JTL-Packtisch+ - Fehler und Bugs 1
Neu Seitennavigation wird doppelt angezeigt Allgemeine Fragen zu JTL-Shop 0
Eigenes Feld wird nicht angezeigt JTL-Wawi 1.8 2
Bestellvorschläge - Lagerbsestand in "Bestand gesamt" wird nicht angezeigt JTL-Wawi 1.8 0
Neu Auftragszahlung über Kasse, Auftrag wird nicht als "Verpackt und Versendet" markiert JTL-POS - Fehler und Bugs 1
Neu Artikel im Warenkorb wird von 1 auf null runtergesetzt. Anstatt es zu entfernen wird es automatisch wieder auf 1 gesetzt Allgemeine Fragen zu JTL-Shop 6
Selbstabholer wird zu DHL national geändert. JTL-Wawi 1.8 3
Neu JTL POS wird nicht an WaWi angebunden Einrichtung / Updates von JTL-POS 2
Globaler Mindestbestand bei neuen Artikeln wird trotz Nullbestand nicht in den Bestellvorschlägen berücksichtigt JTL-Wawi 1.6 1
Neu Neues 5.3 Feature Versandklassen-Assistent wird nicht angezeigt Gelöste Themen in diesem Bereich 5
Neu Bankverbindung wird nicht in Aufträgen/Rechnungen aus Abonnements aktualisiert User helfen Usern - Fragen zu JTL-Wawi 0
Wird jetzt das Widerrufsrecht aufgehoben? Gelöste Themen in diesem Bereich 3
Rechnungsentwurf wird nicht zur Rechnung bei Auslieferung JTL-Wawi 1.8 8
Bestand von Kinderartikeln wird im Vaterartikel zusammenaddiert JTL-Wawi 1.8 1
Neu Rechnungsdatum ist gleich Lieferdatum wird nicht erkannt User helfen Usern - Fragen zu JTL-Wawi 1
Neu PrestaShop Connector für Prestashop 8 mit PHP 8.2 wird nicht unterstützt PrestaShop-Connector 3
Neu Auftrag mit Freiposition Menge 0 läßt sich nicht ausliefern + wird nicht auf Lieferschein angezeigt User helfen Usern - Fragen zu JTL-Wawi 1
Neu Merkmalübersetzung wird im Shop nicht angezeigt JTL-Shop - Fehler und Bugs 2
Neu JTL zu Shopify Bestand wird nicht aktualisiert Shopify-Connector 0
Neu Wo kann ich einstellen, welche Rechnungsvorlage "gezogen" wird Druck-/ E-Mail-/ Exportvorlagen in JTL-Wawi 13
Neu FBA Lager wird nicht angelegt Amazon-Anbindung - Fehler und Bugs 14
Neu Rechnung wird nicht auf englisch gespeichert Druck-/ E-Mail-/ Exportvorlagen in JTL-Wawi 3
In Diskussion Wareneingang Packtisch 1.8.12.0: Seriennumer wird abgeschnitten. JTL-WMS / JTL-Packtisch+ - Fehler und Bugs 1
Neu Fehler: Sonderpreis falsch formatiert, wird nicht importiert; obwohl importiert genau wie exportiert User helfen Usern - Fragen zu JTL-Wawi 0
Neu Versandmail / Versandbenachrichtigung wird nicht gesendet JTL-Wawi - Fehler und Bugs 1
Neu Menüleiste wird plötzlich in der Mitte von der Seite angezeigt Allgemeine Fragen zu JTL-Shop 0
In Diskussion JTL POS Kundennummer wird nicht an JTL Wawi übertragen JTL-POS - Fehler und Bugs 2
Neu SEO URL der Kategorien wird nicht an Shopware 6 übertragen Shopware-Connector 0
Kann ich eine email an die Wawi senden durch die dann ein neuer Auftrag generiert wird? (Daten müssen händisch vervollständigt werden...) JTL-Wawi 1.8 2
Issue angelegt [WAWI-75449] Artikel duplizieren - ASIN wird nicht mit dupliziert. JTL-Wawi - Fehler und Bugs 1
Neu Ware auf Retoureplatz wird als "verfügbar" betrachtet JTL-Wawi - Fehler und Bugs 2
Gelöst Packtisch+ 1.8.112 : Rechnung wird bei Teillieferung erzeugt, obwohl als Ausführungsbedingung "Nur bei der letzten Teillieferung" ausgewählt ist. JTL-WMS / JTL-Packtisch+ - Fehler und Bugs 2
Neu Funktionsattribut unverkäuflich wird nicht an den Shop übertragen Allgemeine Fragen zu JTL-Shop 1
Neu Title Tag wird auf Loginseite nicht übernommen Betrieb / Pflege von JTL-Shop 1
Neu Erstinstallation JTL WaWi 1.8.12 - heruntergeladen wird SQL Express 2017 _statt_ der empfohlenen 2022 Version Installation von JTL-Wawi 8
Neu Kurzbeschreibung von einem "Stücklisten-Artikel" wird in der Rechnungskorrektur Vorlage nicht angezeigt. Druck-/ E-Mail-/ Exportvorlagen in JTL-Wawi 1
Neu Shop wird nicht verbunden Onlineshop-Anbindung 2
Neu Guthaben reduziert nicht den Auftragswert sondern wird als Zahlung angerechnet User helfen Usern - Fragen zu JTL-Wawi 2
Neu Sortiernummer Merkmalwert wird nicht richtig übernommen (Ameise) JTL-Wawi - Fehler und Bugs 3
Lieferanten EK wird nicht auf Artikelebene kopiert? EK ist überall 0 beim Artikel. JTL-Wawi 1.8 8
Neu Versandkosten Berechnung im Warenkorb wird nicht aktualisiert JTL-Shop - Fehler und Bugs 1
Neu Mailvorlagen - Footer - Email wird nicht angezeigt? Allgemeine Fragen zu JTL-Shop 0
Verwiesen an Support TSE Modul wird nicht mehr erkannt, kann auch nicht wieder aktiviert werden, diverse Fehlermeldungen JTL-POS - Fehler und Bugs 1
[JTL-WAWI API] Gewicht (ItemWeight) wird nicht gespeichert JTL-Wawi 1.8 2
Bug? Worker 2.0 - Shop Abgleich "Quicksync" ist kein Quicksync mehr - Paketgröße wird ignoriert JTL-Wawi 1.8 10

Ähnliche Themen