+ Antworten
Ergebnis 1 bis 6 von 6

Thema: Google bei bestimmten seiten ein 404 präsentieren

  1. #1
    Neu an Board
    Registriert seit
    25.11.2006
    Beiträge
    9
    Bedankte sich
    4
    Erhielt 0 Danksagungen
    in 0 Beiträgen

    Unglücklich Google bei bestimmten seiten ein 404 präsentieren

    ich möchte Google bei aufruf von seiten mit einem bestimmten parameter eine 404 meldung/seite präsentieren, damit google diese seiten aus seinem index nimmt.

    Hintergrund: habe das eventlist modul mod_eventlistcal15q im einsatz, ein kalender der seitenparametr wie "el_mcal_month=" in die url übergibt. dies führt zu unendlich vielen seiten auf meiner domain, wenn man auf den nächsten oder vorherigen monat klickt (google hat sich schon bis ins jahr 2025 vorgeklickt und zurück existieren urls bis 1966). google meint da schon 12300 seiten gefunden zu haben.
    ich hab google mittlerweile über eine robots.txt klargemacht dass er sie nicht mehr zu indizieren braucht, solange aber google keine 404 bekommt streicht er sie nicht aus dem index.
    müsste doch machbar sein wenn der googlebot erkannt wird UND er eine bestimmte url mit "el_mcal_month" i n der url aufrufen will ihm eine bestimmte seite zu übergeben. die dann evtl nicht existiert und somit ein 404 erzeugt.
    die seite: www.metropole-marketing.de
    für jede lösung dankbar
    gruss

  2. #2
    War schon öfter hier Avatar von HosHi0815
    Registriert seit
    25.05.2008
    Ort
    Sachsen-Anhalt
    Alter
    40
    Beiträge
    123
    Bedankte sich
    22
    Erhielt 27 Danksagungen
    in 22 Beiträgen

    Standard

    Ich würde es mal so testen...

    Hinweis: Ungetestet!

    mit Standard 404 Fehler
    Code:
    ########## Anfang - Aufruf "el_mcal_month=" unterbinden #########
    RewriteEngine On
    RewriteCond %{HTTP_USER_AGENT} ^google.* [OR]
    RewriteCond %{HTTP_USER_AGENT} ^googlebot
    RewriteCond %{QUERY_STRING} el_mcal_month=(.*)
    RewriteRule ^(.*) [F]
    ########## Ende - Aufruf "el_mcal_month=" unterbinden #########
    oder

    mit definierter Fehlerseite
    Code:
    ########## Anfang - Aufruf "el_mcal_month=" unterbinden #########
    RewriteEngine On
    RewriteCond %{HTTP_USER_AGENT} ^google.* [OR]
    RewriteCond %{HTTP_USER_AGENT} ^googlebot
    RewriteCond %{QUERY_STRING} el_mcal_month=(.*)
    RewriteRule ^(.*)$ errorpages/404.php [F,L]
    ########## Ende - Aufruf "el_mcal_month=" unterbinden #########

  3. Erhielt Danksagungen von:


  4. #3
    Wohnt hier Avatar von DietmarH
    Registriert seit
    07.01.2006
    Ort
    Essen
    Beiträge
    4.697
    Bedankte sich
    66
    Erhielt 1.041 Danksagungen
    in 923 Beiträgen

    Standard

    Ich hab's früh genug gemerkt, ein Override für das Modul angelegt und allen Links (auch denen zu Terminen, die sind schließlich innerhalb der EL normal verlinkt) ein rel="noindex, nofollow" verpaßt. Nach 3 Monaten hatte Google die 300 schon indizierten Seiten wieder aus dem Index geworfen. Bei dir dürfte es ein wenig länger dauern, aber das klappt auch mit über 12.000 Links.

  5. Erhielt Danksagungen von:


  6. #4
    Neu an Board
    Registriert seit
    25.11.2006
    Beiträge
    9
    Bedankte sich
    4
    Erhielt 0 Danksagungen
    in 0 Beiträgen

    Standard

    danke euch beiden, hab jetzt mal die obere rule im einsatz, mal schaun was passiert
    httrack der sich als googlebot ausgibt lässt sich davon allerdings nicht beeindrucken, bzw. der server schiebt ihm fleissig rüber...
    Geändert von mybusiness (26.03.2010 um 19:13 Uhr)

  7. #5
    Neu an Board
    Registriert seit
    25.11.2006
    Beiträge
    9
    Bedankte sich
    4
    Erhielt 0 Danksagungen
    in 0 Beiträgen

    Standard

    hab jetzt mal mit einem googlebotsimulator getestet
    obiger code sorgt nur dafür dass bilder der site mit einem 404 gesegnet werden, text wird weiter gesendet.
    was könnte man am code ändern?

  8. #6
    Neu an Board
    Registriert seit
    26.02.2005
    Beiträge
    15
    Bedankte sich
    3
    Erhielt 0 Danksagungen
    in 0 Beiträgen

    Standard

    Zitat Zitat von mybusiness
    ich hab google mittlerweile über eine robots.txt klargemacht dass er sie nicht mehr zu indizieren braucht, solange aber google keine 404 bekommt streicht er sie nicht aus dem index.
    Nix 404, das muss ein 410er sein.

    Lutz

+ Antworten

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein