natZONE
Aktives Mitglied
Habe im Shopbackend eine Sitemap generiert, die zunächst mal ganz friedlich unter /export/sitemap_index.xml liegt. Wegen der Vielzahl der Links in meinem Shop wurden dabei gleichzeitig zwei gezippte XML-Dateien sitemap_0.xml.gz und sitemap_1.xml.gz abgelegt. Die sitemap_index.xml verweist ordnungsgemäß auf diese gezippte XML-Dateien, auch die Syntax ist korrekt.
Google Webmasters Tools meldet nun einen Fehler: die Sitemap könne nicht gefunden werden (s. Screenshot). Was ebenfalls sehr merkwürdig ist: wenn ich die gezippten XML-Dateien mit dem Browser auf meine Festplatte herunterlade und die Dateien dann entpacke, kommt erst mal nicht die erwartete XML-Datei zum Vorschein, sondern wieder eine Binärdatei. Erst wenn ich diese Binärdatei dann ein zweites Mal entpacke, erhalte ich die eigentliche XML-Sitemap-Datei. Das bedeutet, die Dateien sitemap_0.xml.gz und sitemap_1.xml.gz sind tatsächlich zweimal hintereinander gezippt (gepackt) und müssen zum Erfassen des XML-Inhaltes dann auch wieder zweimal hintereinander entpackt werden.
Wenn ich die Dateien jedoch mit dem Kommandozeiltool CURL herunterlade (etwa mit curl -O http://www.domain.tld/export/sitemap_1.xml.gz), braucht die gezippte Datei nur einmal entpackt zu werden, wie es auch der Fall seien sollte, und die XML-Datei kann normal gelesen werde.
Weiß jemand einen Lösungsansatz?
Google Webmasters Tools meldet nun einen Fehler: die Sitemap könne nicht gefunden werden (s. Screenshot). Was ebenfalls sehr merkwürdig ist: wenn ich die gezippten XML-Dateien mit dem Browser auf meine Festplatte herunterlade und die Dateien dann entpacke, kommt erst mal nicht die erwartete XML-Datei zum Vorschein, sondern wieder eine Binärdatei. Erst wenn ich diese Binärdatei dann ein zweites Mal entpacke, erhalte ich die eigentliche XML-Sitemap-Datei. Das bedeutet, die Dateien sitemap_0.xml.gz und sitemap_1.xml.gz sind tatsächlich zweimal hintereinander gezippt (gepackt) und müssen zum Erfassen des XML-Inhaltes dann auch wieder zweimal hintereinander entpackt werden.
Wenn ich die Dateien jedoch mit dem Kommandozeiltool CURL herunterlade (etwa mit curl -O http://www.domain.tld/export/sitemap_1.xml.gz), braucht die gezippte Datei nur einmal entpackt zu werden, wie es auch der Fall seien sollte, und die XML-Datei kann normal gelesen werde.
Weiß jemand einen Lösungsansatz?