Seo-urls und redirects

Hallo und guten Tag,
bitte verschieben, wenn das hier die falsch Ecke ist.

Oxid ist für mich relativ neu.

Gegenwärtig arbeite ich an der Aufgabe, zu lange Seo-URLs zu verschlanken, da das wohl nach googles webmaster-Empfehlungen nicht über 120 Zeichen gehen sollte. Dies kollidiert natürlich schnell mit dem grundlegenden OXID-Konzept kraft dessen die SEO-URL die Kategorien mit einbezieht. Einige der Tutorials zum Thema habe ich mir bereits angesehen.

Basis ist ein shop mit ca 1000 Artikeln, die es in je ca 10-20 Versionen gibt (Farben, Größen etc). oxseo und oxarticles enthalten je knapp 20000 Einträge. Bei ca 1000 Artikeln in oxarticles ist oxparentid leer, das sind die selbst nicht bestellbaren Grundartikel, für die die Details noch bestimmt werden müssen. Im Admin Bereich lässt sich nur für diese Artikel eine SEO-URL anhand der Kategorien oder fix definieren. Wenn ich hier die Kategorie mit dem drop-down Menü ändere, erhält die dazugehörige aktuelle URL in oxseo.expired den Wert null, die übrigen den Wert 1.

Darüberhinaus enthält oxseo auch für alle übrigen Variationen eigene unique URLs und das macht ja aus user-experience-Sicht auch Sinn. Wenn ich das bisher richtig verstanden habe, werden diese Variationen über die oxparentid dem Hauptartikel zugeordnet.

  1. Mit welcher Methode werden diese SEO-URLs generiert?
    1)b) Wird bei Änderungen an der SEO-URL des Hauptartikels auch die SEO-URL für alle Varianten neu zugewiesen?

Oft ist ein Artikel in mehreren Kategorien gelistet. Dann droht der Duplicate content Filter. Irgendwo las ich, das würde über das canonical-tag geregelt. Ich habe aber noch nicht herausfinden können, wie das genau unterschieden wird. Hat das auch was mit dem expire-flag zu tun?

Von fast 20000 einträgen in oxseo sind nur ca 100 mit expired=0. Ich habe den shop nicht selber aufgesetzt und den Verdacht, dass hier irgendjemand heumgepfuscht hat: Praktisch alle Einträge in oxseo.oxparams, die nicht leer sind, enthalten zweistellige Zahlen statt md5-hash-strings. Dasselbe gilt für die oxobjectid in oxobject2seodata. Sehr viele der in oxseo gelisteten seo-urls landen mit einem redirect auf der Startseite. Und die seo-urls der nicht bestellbaren Grundartikel landen auf einer Seite mit dem Preis null. Das ist alles sehr merkwürdig.

Soryy, wenn das alles noch etwas wirr klingt. Es geht darum, etwas mehr Kontrolle darüber zu bekommen, dass google auch die richtigen landingpages indiziert. Zunächst einmal keine zu langen. Na, und dass die links dann auch funktionieren natürlich.:frowning:

lol, in meinem Lieblings-Film “Brazil” sagt Jonathan Price an einer Stelle, er sei ja mit dem Formularkram etwas pedantisch.

Inzwischen habe ich den grundlegenden Aufbau etwas besser verstanden: Das Expired Flag wird bei bestimten Gelegenheiten auf 1 gesetzt um klarzustellen, dass nach Änderungen im Admin-Interface die SEO-URL neu berechnet werden soll, was beim nächsten user-Aufruf der landing-page geschieht. In objektorientierter Programmierung sind solche performance-aufwändigen Operationen über den gesamten Datenbestand nicht machbar und auch nicht nötig.

Die user gelangen über alle möglichen URLs auf die Seite, auch über ältere, die dann in seohistory mit md5 abgespeichert sind. Das canonical Tag wird für alle Varianten pauschal über die parent-ID des selbst nicht bestellbaren Eltern-Artikels bestimmt und über oxobject2category einer einzigen Hauptkategorie zugewiesen, sofern nicht im Admin-Interface über fixed eine frei gewählte URL zugewiesen wurde.

So weit so gut.

Als die Sache mit dem canonical Tag vor ca 10 Jahren mit dem big-daddy-update aufkam, war ich ziemlich eng dran. Wenn ich das richtig in Erinnerung habe, ging es google damals darum, sicherzustellen, dass nicht inhaltlich absolut identische, aber von der URI her unterschiedliche URLs wie

http://mydomain.com
http://www.mydomain.com
http://www.mydomain.com/Index.html

etc über den duplicate content filter aus dem Index fliegen.

Was mich deshalb wundert ist, wieso OXID nicht nur diese URLs über canonical einer unique URI zuweist, sondern gleich die ganze Artikelgruppe mit allen Varianten auf die Hauptkategorie des Elternelements als canonical verweist…

Wenn ein Käufer nach einem blauen Nachttopf mit 40 cm Durchmesser oder einem Motörhead Stück mit 140 BPM sucht, dann will er das ja auch präsentiert bekommen, und nicht beim Seitenaufruf extra noch Farbe, Größe, Musik-Geschmack oder BPM-Zahl auswählen müssen.

Insofern gibt es keinen Grund, warum nicht auch für alle einzelnen Artikel in allen Varianten mindestens eine URL dezidiert als kanonisch bestimmt werden dürfte?

Falls das hier irgendwann mal diskutiert wurde, wäre ich für einen Link sehr dankbar.

Als nächstes steht nämlich die Erstellung einer sitemap an und nach meinen Recherchen gehen die Meinungen auseinander, ob es Sinn macht, auch non-canonical URLs in die sitemap mit aufzunehmen.