kann man die robots.txt datei löschen sonst googlesuchmaschienen roborter die datei nicht gern mag oder sie verhindert bei der suche was
kann man die robots.txt datei löschen sonst googlesuchmaschienen roborter die datei nicht gern mag oder sie verhindert bei der suche was
www.web-consultant.at
Sorry, kein Support über die "Private Nachrichten"-Funktion.
ich verwende die robots.txt auch. Gibt es hier empfehlungen in bezug auf Joomla, welche Verzeichnisse/Dateien man sperren sollte. Oder ist das jedem selbst überlassen.
Kennt jemand eine Möglichkeit Beiträge etc. welche ja in SQL abgelegt sind, mit der robots zu sperren? Metadaten werden ja wohl nicht so wahrgenommen von den Spidern.
In der Datei stehen schon die "Empfehlungen" drin ....
Die robots.txt hat nichts mit der SQL Datenbank zu tun. Mit dieser Datei wird den Spider gesagt welche Verzeichniss sie von der Suche ausschließen sollen. Das hat zunächst nichts mit den Artikel auf der Webseite zu tun, da diese ja erst beim Aufruf generiert werden, also physisch nicht in der Verzeichnisstruktur abgelegt werden. Die Spider greifen im übrigen auch nicht direkt auf die Datenbank zu.
Dementsprechend kannst du auch keine Artikel in der robots.txt angeben, welche die Spider überspringen sollen. Warum auch? Wenn du einen Artikel von der Suche ausschließen willst, dann gebe ihn nur für registrierte User frei und mache ihn einfach nihct öffentlich.
Ich hätte aber das Problem, dass genau eine einzelne Seite nicht durch Google indexiert werden soll. Denn dort stehen die Mitarbeiter der Firma drinnen, die sollen zwar öffentlich angezeigt werden, aber nicht unbedingt durch Google gefunden werden. Dazu existiert ja wohl auch bei jedem Beitrag unter "Metaoptionen" das Feld "robots". Aber egal, was ich eintrage, es scheint sich nichts zu ändern...?
Was tun?
Gute Theorie! Aber was veröffentlich ist, wird unweigerlich irgendwann von irgendeiner Suchmaschine gefunden. Irgendwo hab ich mal den Spruch hier gelesen: "Das Internet findet alles und behält auch alles"
Edit:
Gerade noch das hier gefunden
"Metadaten -> Robots: noindex, nofollow": Ein 100%iger Ausschluss kann dadurch allerdings nicht gewährleistet werden. Einige besonders "gierige" Suchmaschinen Bots "überlesen" diese Angaben und indexieren die Seite trotzdem.
Geändert von Arni (03.05.2011 um 20:55 Uhr)
Das sollten Suchmaschinen berücksichtigen und entsprechend auslesen.Da muss ich dir sagen, dass man die Suchmaschinen ganz gut durch eine robots.txt sperren kann.
Eine Suchmaschine MUSS sich aber (leider) nicht daran halten.
Also ist die Aussage von Arni leider richtig.
Andreas
- Das Joomla Nachschlagewerk ( FAQ )
- Flottes Liste ( wenn man gehacked wurde )
- Kein Support per PN!
Ja, is mir klar, dass das alles so ist. Aber, ich hab versprochen, dass ich mal zusehe, ob man da was machen kann. Also, in der robots.txt scheint man nichts ausrichten zu können, da kann man nur ganze Verzeichnisse sperren, nicht aber einzelne Seiten - denn die gibt es ja gar nicht in einem dynamischen System. Soweit richtig? Dazu existiert meines Wissens nach ebend das Feld robots und eigentlich sollte der Eintrag "noindex, nofollow" dann im Quelltext erscheinen und seinen Zweck erfüllen. Siehe: http://tinyurl.com/3tqqmpn.
Nur - bei mir passiert gar nichts. Funktioniert irgendwie gar nicht. Warum?
Lesezeichen