Mir ist gerade aufgefallen, dass ich keine robots.txt habe. Ist die in heutigen Zeiten noch relevant oder verzichtbar? Wie würde die im Idealfall für einen Oxid CE 4.2 aussehen? Gibt es Bereiche, die möglichst nicht durchsucht werden sollten?
Ich habe eine robots.txt gefunden, wo ich nur meine URL eintragen müsste. Habe ich mal angehängt. Wäre die gut?
in dieser robots.txt wird eigentlich nur einer Reihe von User-Agents (Bots) empfohlen das die Seite nicht gecrawled werden soll. Ob diese Bots sich daran halten ist eine andere Geschichte.
Als Schutzmaßnahme ist eine robots.txt ungeeignet, sicherer ist da die Verwendung von .htaccess für die betreffenden Verzeichnisse.
Die wirklich wichtigen Bots wie google, yahoo, bing halten sich an die robots.txt. Allerdings bieten robots.txt auch jedem anderen der danach sucht evtl. Anhaltspunkte wie die “interessanten” Verzeichnisse benannt sind und wo diese zu finden sind.
OK. Meine Bedenken sind ob ich es richtig mache mit dieser Datei. Der Sinn soll ja eigentlich sein, dass der Shop gecrawled werden soll. Die Datei bewirkt also das Gegenteil oder wie?
In den Metatags habe ich bereits drin stehen: “index, follow”. Reicht das aus oder empfiehlt sich zusätzliche eine robots.txt.
Wie müsste die ideale Datei aussehen, damit alle robots den Shop durchsuchen bzw. welche Bereich sollten bei Oxid CE 4.2 möglichst nicht durchsucht werden?
Schau dir doch einfach die robots.txt aus dem Demo-Shop an. Da werden eine ganze Menge Sachen für Suchmaschinen gesperrt. Vor allem Inhalte die für Suchmaschinen auch keinen Sinn machen.
Hi,
sowas gehört meiner Meinung nach nicht in die robots.txt - die Verzeichnisse mittels .htaccess schützen, und somit auch für Bots unzugänglich machen, ist glaube der bessere weg, man muss ja nicht potentielle Angreifer direkt mit der Nase auf die interessanten Verzeichnisse stoßen.
Ein potentieller Angreifer, der ein wenig Ahnung hat, schaut sich vorher einfach das eingesetzte Shopsystem an und stimmt seinen Angriff darauf ab. Egal ob htaccess oder nicht.
Die robots.txt ist ja keine Security-Tool, sondern solll ja eigentlich nur verhindern, das Dinge in den Suchmaschinen auftauchen die dort keinen Sinn machen.