+ Antworten
Ergebnis 1 bis 4 von 4

Thema: Wissensfrage Google vs PDF

  1. #1
    Neu an Board
    Registriert seit
    20.11.2006
    Beiträge
    57
    Bedankte sich
    10
    Erhielt 0 Danksagungen
    in 0 Beiträgen

    Standard Wissensfrage Google vs PDF

    mich quält da gerade was, auf das ich zufällig gestossen bin.
    Und vielleicht hat ja einer die passende Antwort dafür, das ich mir nicht weiter den Kopf darüber zerbrechen muss.
    Man hat ja das Standard PDF in Joomla, wo man jeden Content in PDF erzeugen lassen kann. An und für sich praktisch, wenns mal gut funktionieren würde. Aber auf das will ich jetzt gar ned raus.
    Ich hab heute mal nach einer vor wenigen Wochen neu erstellten Joomlaseite von mir gegoogelt.
    Und jetzt kommt eigentlich das Ei des Kolumbus, was mich interessiert.
    Da taucht doch tatsächlich in Google ein Eintrag der Seite in PDF auf.
    Jetzt gehe ich doch mal vom normal logischen Gedanken aus. Das PDF wird ja erst generiert. Wie kommt dann Google dazu?
    Man könnte vielleicht einen Schritt in die Richtung gehen und meinen, gut, da hat jemand mal ein PDF auf der Seite generiert und das wird temporär in einem Ordner gespeichert, was dann natürlich auch der Robot wieder finden würde.

    Es mögen mich jetzt manche vielleicht verrückt halten, aber mich interessiert halt nun mal der Hintergrund, wie und was da genau abläuft.
    Also weiß zufällig jemand zufällig die Lösung oder einen Gedankengang, oder bin ich der einzige, der sich über sowas Gedanken macht

  2. #2
    Kommt häufiger vorbei
    Registriert seit
    04.11.2006
    Beiträge
    358
    Bedankte sich
    11
    Erhielt 82 Danksagungen
    in 81 Beiträgen

    Standard

    Das ist ganz einfach:
    Deine Seiten werden ja auch erst generiert wenn der Benutzer sie sich anschaut.
    Ob du nun cachest oder nicht, die Seiten werden egal wie erst generiert - woher nun die Infos kommen ist egal.

    Mit dem PDF ist das genauso.

    Ob das nun erst generiert wird, wenn jemand drauf geht (und google ist jetzt auch einfach mal jemand) spielt keine Rolle - derjenige bekommt es angezeigt, nachdem er einem Link gefolgt ist - und genau das tut google - es folgt links (und pdf-links sind nunmal auch links, vor allem kann google das erst unterscheiden, nachdem es die Seite geladen hat, weil das pdf ja mit nem php script generiert wird.

    Google scannt also nicht deinen Server sondern hangelt sich anhand von links über die seite. wenn du einen link zu nem pdf (ob statisch oder dynamisch) setzt dann wird google eben auch diesem link folgen.
    Xel
    Wenn ich helfen konnte klick >>Danke<< ..::||::.. wenn dein Problem gelöst wurde markiere den Thread

  3. Erhielt Danksagungen von:


  4. #3
    Neu an Board
    Registriert seit
    20.11.2006
    Beiträge
    57
    Bedankte sich
    10
    Erhielt 0 Danksagungen
    in 0 Beiträgen

    Standard

    stimmt, oh Gott, manchmal sieht man den Wald vor lauter Bäumen nicht.
    Wieso bin ich da ned selber drauf gekommen. Danke

  5. #4
    Moderator Avatar von holmi
    Registriert seit
    30.08.2004
    Ort
    Harz
    Beiträge
    6.502
    Bedankte sich
    92
    Erhielt 1.234 Danksagungen
    in 1.133 Beiträgen

    Standard

    Schreib mal das hier in die robots.txt
    Code:
    Disallow: /index2
    Das sollte schon helfen das google die PDFs nicht mehr indiziert.

    Björn
    Problem gelöst? Dann markiere den Thread mit [GELÖST]

+ Antworten

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein