+ Antworten
Ergebnis 1 bis 8 von 8

Thema: Joomla erweitert ungewollt URL-Struktur

  1. #1
    img
    img ist offline
    War schon öfter hier
    Registriert seit
    13.05.2008
    Beiträge
    170
    Bedankte sich
    9
    Erhielt 3 Danksagungen
    in 3 Beiträgen

    Standard Joomla erweitert ungewollt URL-Struktur

    Hallo miteinander,

    habe ein seltsames Problem und würde gerne wissen, ob ich es unterbingen kann.

    Ich verwende sprechende URLs, sagen wir meine Navigation hat 10 Seiten:

    domain.de/Startseite (1. Link in der Navi von links nach rechts)
    /kontakt (2. Link)
    /anfahrt (3. Link)
    /produkte (4. Link)
    etc...

    Ich habe nun das Problem, dass es möglich ist hinter den jeweiligen Pfad in der URL manuell Nummern zu schreiben und die Seiten werden trotzdem aufgerufen, quasi so:
    domain.de/kontakt/3

    gebe ich das ein, komme ich auf "/Anfahrt", gebe ich domain.de/kontakt/4 ein, komme ich auf Produkte. Das gleiche funktioniert auch mit jedem anderen Menüpunkt: /produkte/1 komme ich zur Startseite etc.

    Woran liegt das? Mich würde es nicht stören, jedoch indexiert der Google-Bot diese Domains und die werden wiederum in den SERPs, zusätzlich zu den "richtigen" URLs angezeigt.

    Wäre für ien paar Tips sehr dankbar.
    Grüße img

  2. #2
    Wohnt hier Avatar von Joomla-Hilfe
    Registriert seit
    12.08.2010
    Beiträge
    3.668
    Bedankte sich
    78
    Erhielt 1.094 Danksagungen
    in 874 Beiträgen

    Standard

    Die Frage ist doch weniger, weshalb solche URLs funktionieren, sondern eher, wo der Bot solche URLs findet. Normalerweise sind die einzigen URLs, der Bot "erfindet", die URLs zu Ordnern, in denen (bei SEO angeblich) die ausgelieferten Dateien liegen. Sinnigerweise meckert er in den Webmaster Tools auch noch rum, wenn ihm das verboten ist und er statt eines Verzeichnislistings einen 403 bekommt.

    Ansonsten reagiert der Bot nur auf Links, die er irgendwo findet. Wo also gibt es diese merkwürdigen URLs? Joomla selbst erzeugt die nirgends und mit keiner Einstellung.
    Danke?

    Keine Macht den Facebutts!
    "Dinner for one ist jeden Tag" oder "Und täglich grüßt das Murmeltier"

  3. #3
    img
    img ist offline
    War schon öfter hier
    Registriert seit
    13.05.2008
    Beiträge
    170
    Bedankte sich
    9
    Erhielt 3 Danksagungen
    in 3 Beiträgen

    Standard

    Zitat Zitat von Joomla-Hilfe Beitrag anzeigen
    Die Frage ist doch weniger, weshalb solche URLs funktionieren, sondern eher, wo der Bot solche URLs findet. Normalerweise sind die einzigen URLs, der Bot "erfindet", die URLs zu Ordnern, in denen (bei SEO angeblich) die ausgelieferten Dateien liegen. Sinnigerweise meckert er in den Webmaster Tools auch noch rum, wenn ihm das verboten ist und er statt eines Verzeichnislistings einen 403 bekommt.

    Ansonsten reagiert der Bot nur auf Links, die er irgendwo findet. Wo also gibt es diese merkwürdigen URLs? Joomla selbst erzeugt die nirgends und mit keiner Einstellung.
    Naja mich interessiert nicht nur warum das funktioniert, sondern warum das überhaupt möglich ist, wo ist da die Logik?

    Es handelt sich um dieses Projekt: http://tinyurl.com/2f9l8cx

    Gib auf einer Unterseite einfach mal am ende der URL ein /2 ein, oder /4 etc.
    Dann siehst du was ich meine, das Menü bleibt auf dem alten Menüpunkt stehen (aktiver Zustand), der Inhalt wird jedoch zur entsprechenden URL geladen, wie in Posting #1 beschrieben.

    Wie der Bot auf die anderen URLs schließt weiß ich nicht, verlinkt sind sie auf keiner Seite?!
    Manuell erzeugt habe ich sie (hoffentlich) nicht, ich will die Teile loshaben

    Verwendete Erweiterungen:
    Komponenten: CKforms, JCE, xMap
    Plugins: Content CKforms form display, system-sef,
    Module: breadcrumps

    Mehr nicht...
    Geändert von img (29.11.2010 um 14:43 Uhr)

  4. #4
    Wohnt hier Avatar von Joomla-Hilfe
    Registriert seit
    12.08.2010
    Beiträge
    3.668
    Bedankte sich
    78
    Erhielt 1.094 Danksagungen
    in 874 Beiträgen

    Standard

    Zitat Zitat von img Beitrag anzeigen
    Naja mich interessiert nicht nur warum das funktioniert, sondern warum das überhaupt möglich ist, wo ist da die Logik?
    Die Logik steckt noch in Mambo und Joomla 1.0, wo die SEF URLs, die ohne zusätzliche Hilfe erzeugt wurden, einfach so aussahen: /<component>/<catid>/<id>

    Da die 1.5 kompatibel zur 1.0 bleiben sollte, mußten solche Sachen auch weiter funktionieren.

    Manuell erzeugt habe ich sie (hoffentlich) nicht, ich will die Teile loshaben
    Dann leite die betroffenen URLs mit Status 301 weiter auf die gewünschten URLs. Zumindest der Google Bot "vergißt" dann den alten URL sofort und indexiert den neuen. Der Yahoo Slurp und der MSN Bot bzw. deren Programmierer sind allerdings dumm wie Brot und ignorieren solche Informationen völlig stur entgegen allen Konventionen und Regeln. Da aber zumindest der Yahoo Bot direkt in die Mülltonne crawlt und die meisten Seiten auch nach dem 100. Besuch (der verdammt schnell zusammen ist, weil der Bot viel öfter kommt als Besucher über Yahoo) nicht im Index landen, kann man den auch ohne negative Konsequenzen einfach komplett aussperren.
    Danke?

    Keine Macht den Facebutts!
    "Dinner for one ist jeden Tag" oder "Und täglich grüßt das Murmeltier"

  5. Erhielt Danksagungen von:

    img

  6. #5
    img
    img ist offline
    War schon öfter hier
    Registriert seit
    13.05.2008
    Beiträge
    170
    Bedankte sich
    9
    Erhielt 3 Danksagungen
    in 3 Beiträgen

    Standard

    Zitat Zitat von Joomla-Hilfe Beitrag anzeigen
    Die Logik steckt noch in Mambo und Joomla 1.0, wo die SEF URLs, die ohne zusätzliche Hilfe erzeugt wurden, einfach so aussahen: /<component>/<catid>/<id>

    Da die 1.5 kompatibel zur 1.0 bleiben sollte, mußten solche Sachen auch weiter funktionieren.


    Dann leite die betroffenen URLs mit Status 301 weiter auf die gewünschten URLs. Zumindest der Google Bot "vergißt" dann den alten URL sofort und indexiert den neuen. Der Yahoo Slurp und der MSN Bot bzw. deren Programmierer sind allerdings dumm wie Brot und ignorieren solche Informationen völlig stur entgegen allen Konventionen und Regeln. Da aber zumindest der Yahoo Bot direkt in die Mülltonne crawlt und die meisten Seiten auch nach dem 100. Besuch (der verdammt schnell zusammen ist, weil der Bot viel öfter kommt als Besucher über Yahoo) nicht im Index landen, kann man den auch ohne negative Konsequenzen einfach komplett aussperren.
    Dann ist das also kein Fehler seitens Joomla, dass man die URLs so umschreiben kann sondern der G*-Bot ist einfach zu neugierig?

    OK dann werden die entsprechenden URLs einfach via permanent 301 redirected. Danke für deine Antwort.

    Grüße img

  7. #6
    Wohnt hier Avatar von Joomla-Hilfe
    Registriert seit
    12.08.2010
    Beiträge
    3.668
    Bedankte sich
    78
    Erhielt 1.094 Danksagungen
    in 874 Beiträgen

    Standard

    Zitat Zitat von img Beitrag anzeigen
    Dann ist das also kein Fehler seitens Joomla, dass man die URLs so umschreiben kann sondern der G*-Bot ist einfach zu neugierig?
    Wie oben geschrieben: Ich bezweifle, daß der Bot selbst solche URLs konstruiert. Die kommen aus irgendeiner Extension, die sowas macht. Ich habe ihn oft bei seinem Crawlen beobachtet, und die Zugriffsversuche auf das Listing oder die Index in (virtuellen) Ordnern sind das Einzige, wo er Kreativität zeigt. Ansonsten besucht er nur Seiten oder Dateien, deren Link er irgendwo im Web gefunden hat.
    Danke?

    Keine Macht den Facebutts!
    "Dinner for one ist jeden Tag" oder "Und täglich grüßt das Murmeltier"

  8. #7
    img
    img ist offline
    War schon öfter hier
    Registriert seit
    13.05.2008
    Beiträge
    170
    Bedankte sich
    9
    Erhielt 3 Danksagungen
    in 3 Beiträgen

    Standard

    Zitat Zitat von Joomla-Hilfe Beitrag anzeigen
    Wie oben geschrieben: Ich bezweifle, daß der Bot selbst solche URLs konstruiert. Die kommen aus irgendeiner Extension, die sowas macht. Ich habe ihn oft bei seinem Crawlen beobachtet, und die Zugriffsversuche auf das Listing oder die Index in (virtuellen) Ordnern sind das Einzige, wo er Kreativität zeigt. Ansonsten besucht er nur Seiten oder Dateien, deren Link er irgendwo im Web gefunden hat.
    Kann ich mir nicht erklären, die Seite ist brandneu und erst ganz frisch im Index gelistet... denke von den oben aufgeführten Komponenten wird daran auch keine Schuld haben... ich weiß nicht woran es liegt Aber dann wirds eben mit den 301 "gelöst".
    Geändert von img (29.11.2010 um 15:51 Uhr)

  9. #8
    img
    img ist offline
    War schon öfter hier
    Registriert seit
    13.05.2008
    Beiträge
    170
    Bedankte sich
    9
    Erhielt 3 Danksagungen
    in 3 Beiträgen

    Standard

    mir ist gerade noch eine andere Idee eingefallen: Was wenn ich einfach alle SEF-URLs über die robots.txt sperre

    www.domain.de/kontakt ist die tatsächliche Adresse
    In der Robots dann wie folgt: Disallow: /kontakt/

    Wäre das auch möglich und korrekt?
    Grüße img

    EDIT
    Möglich wäre es, jedoch wären die URLs generlel für den Benutzer dennoch zugänglich... mich ärgert es noch immer das diese Überhaupt gelistet werden.

    EDIT2
    So, habe jetzt alle möglichen Konstellationen /1 /2 /3 für jede SEF-URL auf die entsprechende Site 301 redirected. Jetzt is tmeine robots.txt zwar größer, aber immerhin kann keiner mehr auf die "falschen" URLs zugreifen
    Geändert von img (30.11.2010 um 13:19 Uhr)

+ Antworten

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein