Hallo!
Ich betreibe drei Websites, die vor dem Update einwandfrei funktioniert hatten. Allen drei ist gemeinsam, dass ich ACE-SEF (basic = kostenlos) und Phoca-PDF verwende und auf den JYAML-Template aufgebaut sind. (Der Fehler tritt auch
Bei der Untersuchung des auf allen drei Sites in gleicher Weise auftretenden Problems fiel mir auch folgende Gemeinsamkeit auf:
Obwohl der Cache der Sites (für die Fehlersuche) deaktiviert war, führt das Löschen des Cache mittels CacheCleaner von NoNumber immer zu der Anzeige, dass etwas aus dem Cache gelöscht wird, also dass etwas drin steht!
Bei ACE-SEF das Gleiche: Auch dort gibt es einen Cache für die URLs und diverses andere. Ich hatte im Rahmen meiner Fehlersuche auch hier alle Caches deaktiviert. Dennoch wird mir angezeigt, dass Cache-Daten gelöscht werden, wenn ich die Funktion Cache-Löschen aufrufe.

Und nun zum Fehler:
Nach damals vielen Versuchen, Phoca-PDF ans Laufen zu bekommen (PDFs unter Joomla sind eh ein Thema für sich), funktionierte es über 2 Jahre hinweg einwandfrei, wenn ich unter ACE-SEF manuell die SEF URLs, die zur PDF-Generierung angezeigt wurden von z.B. www.site.xy/superinhalt.pdf änderte in www.site.xy/superinhalt.html?format=phocapdf während die Originalseite www.site.xy/superinhalt.html hieß.

Seit dem Joomla-Update zeigt die PDF-Erzeugung ein böses Verhalten:
1.) Wenn der Joomla-Cache geleert ist und man auf das PDF-Icon in einem Beitrag klickt, öffnet sich ein PopUp, in dem zunächst in der URL-Zeile "about:blank" steht und dann nach kurzer Zeit die URL zum PDF angezeigt wird. Danach erscheint nach mehreren Sekunden das ordnungsgemäß mit PhocaPDF erzeugte PDF.
2.) Schließt man das PopUp und klickt erneut das PDF-Icon, erscheint sofort in der URL-Anzeige des PopUp die PDF-URL. Dann aber wird recht schnell nur noch Binär-Müll angezeigt, wobei der Anfang der Zeichen eigentlich die typische Einleitung für eine PDF-Datei ist.
3.) Manche Bots versuchten offenbar daraufhin, solch eine PDF-Datei immer wieder aufzurufen, wodurch eine extrem hohe Serverlast erzeugt wurde. Daraufhin meldete sich mein Provider per eMail bei mir und teilte mir die Notabschaltung meiner Site mit, weil andere auf dem gleichen Server zu wenig Bandbreite bekamen.

Dieses Verhalten, egal ob mit Phoca-PDF oder Joomla-eigenem PDF ist jederzeit und auf allen drei Sites reproduzierbar!!!

Zunächst verdächtigte ich PhocaPDF, deinstallierte es und änderte die PDF-URLs in ACE-SEF auf das o.g. Beispiel: www.site.xy/superinhalt.pdf worauf nun die Joomla-eigene PDF-Erzeugung verwendet wird.
Zu meiner großen Überraschung zeigte sich der Fehler genau so weiterhin, nur dass in dem Anfang des fehlerhaft angezeigten Binärcode eine ältere PDF-Version angezeigt wurde , nämlich PDF 1.5.3 - Bei Phoca-PDF ist es PDF 1.7
Also hat der Fehler nichts mit der Art der PDF-Erzeugung und somit auch nicht mit Phoca-PDF zu tun!

Bei der weiteren Fehlersuche entdeckte ich dann die oben beschriebenen Zusammenhänge mit dem Cache.


Meine Sites enthalten viele, auch längere Textbeiträge, die offensichtlich gerne von Besuchern als PDF gespeichert werden.

Das Print-Icon ist keine Lösung für mich: Das Print-Icon von Joomla führte bei allen drei Sites immer dazu, dass in einem PopUp-Window nur die ganze mittlere Spalte der Website mit dem Beitrag also angezeigt wird einschließlich des Print-Icon selbst und einschließlich einer Seiten-Navigation unten, wenn der Textbeitrag zu einem Blogbereich mit mehreren Beiträgen gehört. Beim folgenden Druckvorgang schafft das Probleme, weshalb ich die Druck-Funktion von Joomla seither immer deaktiviert habe. Dieser Fehler tritt bei allen meinen Sites schon direkt nach der Installation von Joomla auf.

Das PDF-Icon war wegen dieser Probleme mit der Druckfunktion immer schon meine Rettung gewesen. Und jetzt ist auch dies nachhaltig gestört und zwar bei hoher Abfrage-Häufigkeit von PDFs bis zur Server-Überlastung!!!


Die vom Provider wegen der Überlastung mitgeteilte Meldung lautete:
Vermutlich gibt es Störungen bei der Abarbeitung von SQL-Befehlen, weil es viele lange aktive SQL-Prozesse gibt. Üblicherweise sind SQL-Prozesse in Millisekunden bis einigen Sekunden abgearbeitet. In der Überlastungszeit waren Bots von http://www.80legs.com/webcrawler.html aktiv und haben viele Seiten aufgerufen. ....
Diese PDF-Seite zeigte sich beispielsweise eine fehlerhafte Ausgabe zum Überlastungszeitpunkt. Bei einem späteren Test funktionierte sie allerdings. Was die genau Ursache der Überlastungen ist, ist somit aus unserer Sicht nicht eindeutig klar. Ich nehme jedoch mit hoher Sicherheit an, die die PDF-Erzeugung das Problem ist. Und wenn Crawler diese Links besuchen, gibt es massenhaft solche Aufrufe. Eine Deaktivierung des PDF-Buttons wäre eine erste Maßnahme. Eine Beobachtung der Serverprozesse zeigt zudem, das diese Links bis zu 100% CPU-Last erzeugen.

Ich schreibe deshalb so ausführlich, damit dieses komplexere Problem von Anfang an ohne unnötig viele Rückfragen diskutiert und geklärt werden kann. Und ich meine, dass sicher noch mehr Site-Betreiber davon betroffen sind und es vielleicht noch nicht bemerkt hatten!

Tja und nun bin ich ziemlich ratlos, wie ich den Fehler beseitigen kann und freue mich auf Hinweise und Anregungen.

Beste Grüße
Clemens