Neu Sitemap wird bei Bing wird wegen fehler abgelehnt

deliman

Sehr aktives Mitglied
13. Februar 2016
1.025
131
Die Einstellung "Suchmaschinen-Indexierung von Merkmalwert-URLs: " bringt dabei wohl nur einen teilweisen Erfolgt bzw. Entlastung, oder? Soweit ich weis, gilt sowas eher als Wunsch an die Crawler und wird nicht immer beachtet.
 

MHillmann

Moderator
Mitarbeiter
11. Oktober 2018
1.351
510
Hallo,

eine Überarbeitung der Merkmalfilter ist im Gespräch, eine Idee ist bei der Facettenfilterung z.B. auf die Methodik der PRG-Patterns zurückgreifen und auf die "__" bei der Merkmalfilter-Logik in der URL zu verzichten. Solch ein Umbau ist allerdings ein sehr aufwändiger und tiefgehender Eingriff und damit eher eine langfristige Lösung.

Die Einstellung "Suchmaschinen-Indexierung von Merkmalwert-URLs:", setzt "nur" den meta robots tag auf noindex und würde damit u.a. zu spät greifen. Es ist des Weiteren auch anzuraten, bei Performanceproblemen mit Merkmalen, nicht die Einstellung "Trefferanzahl bei Merkmalfiltern anzeigen - Trefferanzahl auch bei möglicher Mehrfachauswahl anzeigen (performancelastig)" zu verwenden.
Unabhängig davon, dass es bisher unklar ist, ob das die Lage des Crawlings durch den Bingbot ausreichend verbesseren würde, ist es aber auch schwierig Einstellungen vorzuschreiben. Prinzipiell kann es schon teuer werden, wenn der Bingbot einen einzigen Shop im Shared Hosting besucht, der viel mit Merkmalen arbeitet. Wir sind daher auf der Suche nach anderen Wegen.

Viele Grüße
Michael
 

css-umsetzung

Offizieller Servicepartner
SPBanner
6. Juli 2011
8.281
2.479
Berlin
Firma
css-umsetzung
@MHillmann das was ich oben gepostet habe (Auszug aus dem Log), ist wie schon angesprochen ein Fall wie ich ihn des Öfteren erlebe, in dem Fall bei mir war es ja ein anderer Spider und der scherrt sich nen sche...s drum was ich ihm über die Robots mitteilen möchte.

Problematisch ist bei der Merkmalgeschichte eben, das ich wenn ich mir Mühe gebe, auch als normaler User, so jeden Server lahmlegen kann, ich muss einfach der Menge der Cores entsprechend solche Suchen ausführen, da diese dann sehr lange dauern, sind dann alle Cores mit den MySQL Instanzen beschäftigt.

Nur durch die Änderungen der Merkmale, das diese keine reinen Links mehr sind (was ja eigentlich nur etwas Fleißarbeit in Verbindung mit JS/CSS ) im Template erfordert, hätte man aber die Bots schon nicht mehr als großes Problem.
Dann hättet Ihr in Ruhe Zeit euch die Merkmalsuche mal genauer anzuschauen.

Für mich macht es auch keinen Sinn das eine Suchmaschine meinen Merkmalen folgt, da es zu 90% nichts anderes als ein Produktlisting ohne content ist (hab mich jetzt als nicht SEO mal weit aus dem Fenster gelehnt :) ).
 

MHillmann

Moderator
Mitarbeiter
11. Oktober 2018
1.351
510
Hallo,

unsere bisherigen Tests bzgl. der Reaktivierung des Bingbots im Shared Hosting sehen gut aus. Wir schließen nun, wie bereits erwähnt, für den Bingbot die Merkmalfilter vom Crawling per robots.txt aus (die entsprechenden Anweisungen werden zur existierenden robots.txt hinzugefügt). Zusätzlich hat der Bingbot einen Crawl-delay bekommen. Es sollte hier also im Laufe der Zeit eine normale Indexierung für Bing stattfinden.
Wir werden die Änderungen im Laufe der Woche auf allen Shared Hostings deployen und die Server weiterhin genauer beobachten.
Wir werden zusätzlich die Weiterentwicklung des Bingbots beobachten, vor allem in Bezug auf dessen aggressives Crawling.
Falls es erneut zu Serverabstürzen aufgrund des Bingbots kommt, werden wir das Crawling für die entsprechenden Server temporär wieder abschalten und nach anderen Möglichkeiten suchen. In diesem Fall werden wir alle betroffenen Kunden benachrichtigen.
Ansonsten wollen wir wie bereits schon erwähnt prüfen, wie wir die Merkmalfilter weiter optimieren können, um auch an dieser Stelle noch an Performance zu gewinnen.

Eine Standard robots.txt sieht dann wie folgt aus:
# BITTE NICHT LOESCHEN, SERVER-/CRAWLING-OPTIMIERUNG
User-agent: Bingbot
User-agent: AdIdxBot
User-agent: BingPreview
User-agent: MicrosoftPreview
Crawl-delay: 5
Disallow: /*__*
Disallow: /navi.php
Disallow: /druckansicht.php
Disallow: /suche.php
Disallow: /bestellabschluss.php
Disallow: /bestellvorgang.php
Disallow: /jtl.php
Disallow: /pass.php
Disallow: /registrieren.php
Disallow: /warenkorb.php
Disallow: /admin
Disallow: /admin/*
Disallow: /dbeS/*
Disallow: /jtl-store/__
Disallow: /extension-store/__
Allow: *

User-agent: *
Crawl-delay: 5
Disallow: /navi.php
Disallow: /druckansicht.php
Disallow: /suche.php
Disallow: /bestellabschluss.php
Disallow: /bestellvorgang.php
Disallow: /jtl.php
Disallow: /pass.php
Disallow: /registrieren.php
Disallow: /warenkorb.php
Disallow: /admin
Disallow: /admin/*
Disallow: /dbeS/*
Disallow: /jtl-store/__
Disallow: /extension-store/__
Allow: *

Viele Grüße
Michael
 

MHillmann

Moderator
Mitarbeiter
11. Oktober 2018
1.351
510
Nur durch die Änderungen der Merkmale, das diese keine reinen Links mehr sind (was ja eigentlich nur etwas Fleißarbeit in Verbindung mit JS/CSS ) im Template erfordert, hätte man aber die Bots schon nicht mehr als großes Problem.
@css-umsetzung Bots können heutzutage auch in einem gewissen Rahmen Javascript ausführen. Es besteht wahrscheinlich eine gewisse Chance, dass das funktioniert, wäre aber auch keine nachhaltige Lösung.

Zum generellen Nutzen der Indexierung von Filter-Seiten kann ich auch nicht viel sagen, das ist ggf. auch von Fall zu Fall unterschiedlich. Hier würde ich auf jeden Fall auch empfehlen einen SEO-Experten zu befragen.
 

css-umsetzung

Offizieller Servicepartner
SPBanner
6. Juli 2011
8.281
2.479
Berlin
Firma
css-umsetzung

en001

Sehr aktives Mitglied
15. März 2017
578
64
Fillterseiten sollten mit noindex antworten im Code oder einen canonical-Link zur Standardsortierung haben.
Google passt sich an die Servergeschwindigkeit an bei der Menge wie oft gecrawlt wird.
 

css-umsetzung

Offizieller Servicepartner
SPBanner
6. Juli 2011
8.281
2.479
Berlin
Firma
css-umsetzung
Wir drehen uns hier dann langsam im Kreis :)

noindex, nofollow und was da alles so geht ist ganz nett, die seriösen Spider interessiert das ja eventuell auch aber es ist eben wichtig das da draußen auch viele rumrennen, die das nicht interessiert und da muss man dann eben auch versuchen, das einzudämmen.
 

deliman

Sehr aktives Mitglied
13. Februar 2016
1.025
131
Bei unseren Shops im JTL Hosting bereits umgesetzt und gestern bei Bing Webmaster Tools nachgesehen bzw. die Sitemaps noch mal neu geladen und jetzt liest sie Bing problemlos ein. Mal sehen, wann die Anzahl der indizierten Seiten wieder nach oben geht.
 
  • Gefällt mir
Reaktionen: css-umsetzung

css-umsetzung

Offizieller Servicepartner
SPBanner
6. Juli 2011
8.281
2.479
Berlin
Firma
css-umsetzung
Ich hab hier gerade eine Seite, da verhält sich der Amazonbot wie Bing :(
Den sollte man also vermutlich auch mit aufnehmen in der Robots
 

P0ttwal

Sehr aktives Mitglied
13. Juli 2021
131
33
Hallo,

eine Überarbeitung der Merkmalfilter ist im Gespräch, eine Idee ist bei der Facettenfilterung z.B. auf die Methodik der PRG-Patterns zurückgreifen und auf die "__" bei der Merkmalfilter-Logik in der URL zu verzichten. Solch ein Umbau ist allerdings ein sehr aufwändiger und tiefgehender Eingriff und damit eher eine langfristige Lösung.

Die Einstellung "Suchmaschinen-Indexierung von Merkmalwert-URLs:", setzt "nur" den meta robots tag auf noindex und würde damit u.a. zu spät greifen. Es ist des Weiteren auch anzuraten, bei Performanceproblemen mit Merkmalen, nicht die Einstellung "Trefferanzahl bei Merkmalfiltern anzeigen - Trefferanzahl auch bei möglicher Mehrfachauswahl anzeigen (performancelastig)" zu verwenden.
Unabhängig davon, dass es bisher unklar ist, ob das die Lage des Crawlings durch den Bingbot ausreichend verbesseren würde, ist es aber auch schwierig Einstellungen vorzuschreiben. Prinzipiell kann es schon teuer werden, wenn der Bingbot einen einzigen Shop im Shared Hosting besucht, der viel mit Merkmalen arbeitet. Wir sind daher auf der Suche nach anderen Wegen.

Viele Grüße
Michael

Ich wäre euch sooooo dankbar, wenn endlich mal die PRG-Patterns kommen würden. Das wünsche ich mir schon seit Jahren.
Nur mal so erwähnt :)
 

P0ttwal

Sehr aktives Mitglied
13. Juli 2021
131
33
Hallo,

unsere bisherigen Tests bzgl. der Reaktivierung des Bingbots im Shared Hosting sehen gut aus. Wir schließen nun, wie bereits erwähnt, für den Bingbot die Merkmalfilter vom Crawling per robots.txt aus (die entsprechenden Anweisungen werden zur existierenden robots.txt hinzugefügt). Zusätzlich hat der Bingbot einen Crawl-delay bekommen. Es sollte hier also im Laufe der Zeit eine normale Indexierung für Bing stattfinden.
Wir werden die Änderungen im Laufe der Woche auf allen Shared Hostings deployen und die Server weiterhin genauer beobachten.
Wir werden zusätzlich die Weiterentwicklung des Bingbots beobachten, vor allem in Bezug auf dessen aggressives Crawling.
Falls es erneut zu Serverabstürzen aufgrund des Bingbots kommt, werden wir das Crawling für die entsprechenden Server temporär wieder abschalten und nach anderen Möglichkeiten suchen. In diesem Fall werden wir alle betroffenen Kunden benachrichtigen.
Ansonsten wollen wir wie bereits schon erwähnt prüfen, wie wir die Merkmalfilter weiter optimieren können, um auch an dieser Stelle noch an Performance zu gewinnen.

Eine Standard robots.txt sieht dann wie folgt aus:


Viele Grüße
Michael
Super und danke dafür.
Ich bin mir nur nicht sicher, ob ich das gut finde für alle Bots das Delay auch so hoch zu setzen?
Bei einem Shop mit 30.000 Artikel dauert das Crawling ja dann ewig oder nicht?
 

MHillmann

Moderator
Mitarbeiter
11. Oktober 2018
1.351
510
Wir das auch allgemein für JTL Shop ausgerollt? Patch?
Die robots.txt liegt prinzipiell in der Hand des Shopbetreibers. Wir werden dort also keine allgemeine Veränderung vornehmen.
Wenn man keine Performance bzw. Cache-Probleme hat ist ja an sich alles gut.

Unser Ziel wird es wie gesagt sein die Merkmalfilter zu überarbeiten, sodass solche Probleme abgeschwächt werden bzw im Bestfall gar nicht erst auftreten.
 

IT-Elle.de

Aktives Mitglied
16. Juni 2019
11
3
88271 Wilhelmsdorf
Firma
IT-Elle.de
Die robots.txt liegt prinzipiell in der Hand des Shopbetreibers. Wir werden dort also keine allgemeine Veränderung vornehmen.
Wenn man keine Performance bzw. Cache-Probleme hat ist ja an sich alles gut.

Unser Ziel wird es wie gesagt sein die Merkmalfilter zu überarbeiten, sodass solche Probleme abgeschwächt werden bzw im Bestfall gar nicht erst auftreten.
Und woher soll der Shopbetreiber es wissen?
Schonmal drüber nachgedacht so wichtige Infos auch an alle Shopbetreiber zu senden?
 
  • Gefällt mir
Reaktionen: 2009Butch

deliman

Sehr aktives Mitglied
13. Februar 2016
1.025
131
Wenn ich mir die Zugriffszahlen in Bing Webmaster Tools für unsere 2 betroffenen Shops so ansehe, ist der Einbruch mit dem Aussperren der Bingbots deutlich ab Mitte/Ende Juni zu erkennen und die haben sich bislang noch nicht wieder erholt.
 
Ähnliche Themen
Titel Forum Antworten Datum
Neu Sitemap per cronjob und nicht mit Wawi Abgleich Allgemeine Fragen zu JTL-Shop 3
Neu Anzeigen der Zahlungsart, die bei der Zahlung gesetzt wird Eigene Übersichten in der JTL-Wawi 10
Neu Die verwendete Version von JTL-Wawi wird nicht mehr unterstützt. Bitte nutzen Sie die Version 2.0.0.0 User helfen Usern - Fragen zu JTL-Wawi 1
Neu Pickliste wird auf Packtisch und in Wawi unter Picklisten nicht angezeigt. JTL-WMS / JTL-Packtisch+ - Fehler und Bugs 1
Neu DHL Wunschzustellung wird bescheiden dargstellt - keine Shopzustellung auswählbar Plugins für JTL-Shop 0
Neu GLS WebAPI wird abgeschaltet (31.12.2026) JTL-ShippingLabels - Ideen, Lob und Kritik 2
Neu FBA-Streckenlager wird nicht mehr automatisch ausgebucht Einrichtung und Installation von JTL-eazyAuction 0
Unter-Unterkategorie Pfeil wird nicht angezeigt! Einrichtung JTL-Shop5 4
Unter-Unterkategorie Pfeil wird nicht angezeigt! Upgrade JTL-Shop4 auf JTL-Shop5 0
Kundennummer wird in E-Mail-Bestellung nicht angezeigt JTL-Wawi 1.10 0
Neu User-Agent ohne Kennung wird blockiert Onlineshop-Anbindung 4
OTTO: Keine Retourennummer (Hermes HSI) – Versandstatus wird nicht aktualisiert JTL-Wawi 1.11 1
Artikel erkennbar machen wenn nur als Dropshippimg zur Verfügung gestellt wird JTL-Wawi 1.10 5
Neu Rechnung wird zusätzlich auf Labeldrucker ausgegeben JTL-WMS / JTL-Packtisch+ - Fehler und Bugs 1
Neu Varkombis Import Fehler "#VARKOMBI WIRD NICHT ANGELEGT#" JTL-Ameise - Fehler und Bugs 4
Neu Neue Box im Footer erstellt, Inhalt wird nicht korrekt angezeigt Betrieb / Pflege von JTL-Shop 1
Neu Der Auftrag wird nicht ausgeliefert. Der Auftrag befindet sich bereits auf einer anderen Pickliste. User helfen Usern - Fragen zu JTL-Wawi 1
Neu JTL WAWI V1.11.6.0 Stornorechnung, Stornotext wird nicht gespeichert und ist nicht abrufbar JTL-Wawi - Fehler und Bugs 0
Verkaufseinheit wird nicht auf Angebot/Auftrag/Rechnung/Lieferschein ausgegeben JTL-Wawi 1.11 3
Skonto bei Barzahlung wird angezeigt, aber nicht vom Rechnungsbetrag abgezogen JTL-Wawi 1.9 11
Neu Falsches Vorschaubild wird angezeigt, obwohl das richtige Bild in JTL hinterlegt ist User helfen Usern - Fragen zu JTL-Wawi 0
Inaktive Zahlungsart wird bei Eingangsrechnungen angezeigt JTL-Wawi 1.11 0
Neu Ameise: Kinderartikel (Variationskombinationen) aktualisieren – URL-Pfad/SEO-Slug wird nicht übernommen (Testlauf ok, Ergebnis bleibt leer) User helfen Usern - Fragen zu JTL-Wawi 5
Neu Rabatt auf Zahlungsart wird bei Lieferung ins EU-Ausland mit falscher MwSt berechnet? Betrieb / Pflege von JTL-Shop 0
Neu Eingabefeld der PayPal Kreditkartenzahlung wird bei eingeloggten Kundenkonto nicht angezeigt JTL-Shop - Fehler und Bugs 1
Neu Lieferschein Nummer wird auf der Rechnung wird komisch angezeigt Druck-/ E-Mail-/ Exportvorlagen in JTL-Wawi 2
Neu Artikelfilter: CACHING_GROUP_FILTER – wo wird der Cache invalidiert? JTL-Shop - Fehler und Bugs 0
Neu Wie wird die Seite "suche nach:" erzeugt? Allgemeine Fragen zu JTL-Shop 4
Neu Druckerzuordnung wird ignoriert WMS JTL-WMS / JTL-Packtisch+ - Fehler und Bugs 1
Neu PayPal lehnt Zahlung ab, weil PLZ angeblich nicht beliefert wird User helfen Usern 2
Neu Konfigurator-Produkt wird mit 0 € in den Warenkorb gelegt JTL-Shop - Fehler und Bugs 2
Neu Abgelaufene MHD (Mindesthaltbarkeitsdatum) wird im Shop nicht angezeigt. JTL-Shop - Fehler und Bugs 2
Neu Bestellung aus JTL-Shop wird nicht in die Wawi übernommen Allgemeine Fragen zu JTL-Shop 1
Neu Druckvorschau wird doppelt aufgerufen JTL-Wawi - Fehler und Bugs 6
Versandkosten bei gemischten Steuersätzen JTL-Wawi 2.0 6
Gelöst Bekannte Störung: Fehler "Der Inhaltstyp text/html stimmt nicht mit text/xml überein" bei der Labelerstellung JTL-ShippingLabels - Fehler und Bugs 1
Neu Synchronisation funktioniert nur bei manchen Produkten Shopify-Connector 7
Neu Problem bei Varianten-Upload mit Amazon Lister 2.0 (Attribut-Mapping Farbe/Größe) Onlineshop-Anbindung 1
Neu Reihenfolge der Länder (bei der Versandkostenberechnung) Betrieb / Pflege von JTL-Shop 2
Neu Workflow Ereignis "Position hinzufügen" bei Angebote User helfen Usern - Fragen zu JTL-Wawi 0
Neu Kundenrabatte bei Auftragsimport JTL-Ameise - Fehler und Bugs 0
Neu Rückverfolgung des Verkaufskanal bei Angeboten aus dem Shop User helfen Usern - Fragen zu JTL-Wawi 3
Neu Rückverfolgung des Verkaufskanal bei Angeboten aus dem Shop Eigene Übersichten in der JTL-Wawi 0
Neu welche Sync Benutzer Daten in Shop und WAWI bei neu-Hosting über JTL Allgemeine Fragen zu JTL-Shop 0
welche Sync Benutzer Daten in Shop und WAWI bei neu-Hosting über JTL JTL-Wawi 1.11 0
Neu Gelangensbestätigungen bei innergemeinschaftlichen Lieferungen? User helfen Usern - Fragen zu JTL-Wawi 1
Neu SaaS Connector – product.push Performance-Problem bei Shopware 6.6 Shopware-Connector 1
Neu Ständig neue Angebote von JTL und Fallen bei Unaufmerksamkeit Smalltalk 26
Export Zahlungen Amazon marketplace bei Kombi OSS und FBA erfolgt nach JTL2DATEV unvollständig JTL-Wawi 1.9 0
Neu Massive 504 Timeouts bei Bot-Crawl (JTL-Hosting) – PHP-Worker-Pool als Flaschenhals? JTL-Shop - Fehler und Bugs 2

Ähnliche Themen