+ Antworten
Ergebnis 1 bis 6 von 6

Thema: Joomla von utf-8_bin auf utf-8_unicode_ci umstellen?

  1. #1
    Neu an Board
    Registriert seit
    09.08.2007
    Beiträge
    36
    Bedankte sich
    7
    1 Danksagung in 1 Beitrag

    Frage Joomla von utf-8_bin auf utf-8_unicode_ci umstellen?

    Hi!

    Ich habe bei der Installation von Joomla 1.0.13 "utf-8_bin" als Zeichensatz für die Datenbank verwendet. Soweit hat damit auch erst mal alles funktioniert. Nun habe ich schon in verschiedenen Bereich gemerkt, dass "utf-8_unicode_ci" die bessere Wahl ist (u.a. was die Kollation bzw. Sortierung von Begriffen mit deutschen Umlauten angeht).

    Deshalb habe ich 2 Fragen:

    1.) Wie kann ich die Struktur "utf-8_bin" auf "utf-8_unicode_ci" ändern? Kann man das nur mit Datenbank-Tools machen und muss man dann für jede Tabelle und jede Spalte den Zeichensatz manuell ändern?

    OK, diese Frage hat nicht direkt mit Joomal zu tun, aber die Auswirkungen würden Joomla betreffen und deshalb auch meine weitere Frage


    2.) Muss nach der Umstellung auf "utf-8_unicode_ci" noch etwas in Joomla geändert werden?

    Es gibt zwar verschiedene Dateien, wie z.B. die Sprachdateien, die für utf-8 vorbereitet bzw. konfiguriert werden müssen, jedoch habe ich bisher noch nirgends Einträge speziell für "utf-8_unicode_ci" gesehen. Heißt das, dass es ausreichend ist, wenn man generell "utf-8" aktiviert hat?


    Würde mich über eine Antwort bzw. Lösung freuen, wie das auf einfache Weise realisiert werden kann.

    Grüße
    Cocoloco

  2. Erhielt Danksagungen von:


  3. #2
    Neu an Board
    Registriert seit
    12.12.2006
    Beiträge
    20
    Bedankte sich
    4
    1 Danksagung in 1 Beitrag

    Standard

    Gute Frage! Interessiert mich auch.

  4. #3
    Neu an Board
    Registriert seit
    09.08.2007
    Beiträge
    36
    Bedankte sich
    7
    1 Danksagung in 1 Beitrag

    Frage

    Den Punkt 1.) konnte ich nun selber lösen. Entweder macht man das wirklich per Datenbank-Tool (z.B. phpMyAdmin) und ändert die Kollation (je Tabelle und Spalte) oder eben zuerst die Datenbank extrahieren und dann in der Datenbank ändern und zurückspielen.

    Zu Punkt 2.) gehe ich davon aus, dass UTF-8 allgemeingültig ist für alle Kollationen (egal ob nun UTF-8_BIN oder UTF-8_UNICODE_CI). D.h. hier muss man (anscheinend) keine Änderungen vornehmen.


    Ich stehe nun jedoch noch vor einem ganz anderen Grundproblem:

    Ich habe bei der Joomla-Installation als Kollation "UTF-8_BIN" angegeben und wollte nun eben auf "UTF-8_UNICODE_CI" umstellen.

    Mein Fehler bei der Installation: Ich habe ganz vergessen in der "german.php" (im "language"-Ordner") die Zeile zu aktivieren "DEFINE('_ISO','charset=utf-8');".

    Was jedoch trotzdem funktioniert hat: die deutschen Umlaute sind gleich geblieben. War ja schließlich vorher schon auf UTF-8.

    Das Problem ist jedoch: Nun werden bei mir in verschiedenen Sprachdateien von Komponenten (z.B. Community Builder), in denen die Umlaute (äüöß, ÄÜÖß) angegeben sind, diese als Fragezeichen (?) angezeigt werden. Wenn ich diese Umlaute jedoch manuell codiere, z.B. aus "ü" ein "ü" mache, dann werden diese wieder korrekt im Browser dargestellt. Ich habe hierzu bereits diesen Artikel "http://www.joomlaportal.de/beta-howt...igurieren.html" durchgeackert, bin jetzt aber mehr als verwirrt.


    Deshalb würde ich mich freuen, wenn mir mal jemand die folgende Grundsatzfrage zu UTF-8 & Joomla beantworten könnte:

    Ist es richtig, dass wenn ich in den Joomla-Konfigurationen (sowohl in den Einstellungen, als auch in der Datenbank) den Zeichensatz auf UTF-8 gestellt habe, dass dann die Inhalte in den Tabellen bzw. Spalten unkodiert (d.h. äüöß) gespeichert werden, dafür aber die zugehörigen Sprachdateien kodiert werden müssen (z.B. ü )?

    Und wieso muss eine Sprachdatei im UTF-8-Format gespeichert werden? Wenn ich im Notepad++ als Kodierung UTF-8 angebe, dann werden alle Umlaute durch ein Kästchen ersetzt. Man kann doch einfach die Umlaute durch "suchen & ersetzen" z.B. von ü nach ü ersetzen... Kann es sein, dass nur Umlaute, die sich innerhalb von HTML-Inhalten befinden, kodiert werden müssen? Oder bringe ich da was durcheinander?


    So scheint es zwar bei mir zu funktionieren, aber ich dachte der oben genannte Artikel beschreibt dies genau anders herum, sodass die Umlaute in den Sprachdateien ersichtlich sind und deshalb z.B. von ü nach ü umgewandelt werden müssen. Was stimmt nun?

    Gruß
    Cocoloco

  5. #4
    Neu an Board
    Registriert seit
    09.08.2007
    Beiträge
    36
    Bedankte sich
    7
    1 Danksagung in 1 Beitrag

    Standard

    Hat noch niemand Joomla mit dem Zeichensatz utf-8 eingesetzt?

  6. #5
    cps
    cps ist offline
    War schon öfter hier
    Registriert seit
    20.08.2005
    Beiträge
    208
    Bedankte sich
    3
    Erhielt 13 Danksagungen
    in 13 Beiträgen

    Standard

    Zitat Zitat von Cocoloco Beitrag anzeigen
    Ist es richtig, dass wenn ich in den Joomla-Konfigurationen (sowohl in den Einstellungen, als auch in der Datenbank) den Zeichensatz auf UTF-8 gestellt habe, dass dann die Inhalte in den Tabellen bzw. Spalten unkodiert (d.h. äüöß) gespeichert werden, dafür aber die zugehörigen Sprachdateien kodiert werden müssen (z.B. ü )?
    Ja, es müssen alle verwendeten Sprachdateien nach utf-8 umgewandelt werden. Wobei Entities unter utf-8 nicht mehr gebraucht werden, da diese Zeichen bereits im Zeichensatz enthalten sind.

  7. #6
    cps
    cps ist offline
    War schon öfter hier
    Registriert seit
    20.08.2005
    Beiträge
    208
    Bedankte sich
    3
    Erhielt 13 Danksagungen
    in 13 Beiträgen

    Standard

    Zitat Zitat von Cocoloco Beitrag anzeigen
    Und wieso muss eine Sprachdatei im UTF-8-Format gespeichert werden? Wenn ich im Notepad++ als Kodierung UTF-8 angebe, dann werden alle Umlaute durch ein Kästchen ersetzt. Man kann doch einfach die Umlaute durch "suchen & ersetzen" z.B. von ü nach ü ersetzen... Kann es sein, dass nur Umlaute, die sich innerhalb von HTML-Inhalten befinden, kodiert werden müssen? Oder bringe ich da was durcheinander?
    Wenn sich die Änderung auf utf-8 nur auf die Ansicht bezieht, und nichts umgewandelt wurden, dann sind die Umlaute für die Darstellung in utf-8 falsch kodiert - die stehen dann noch als iso im Dokument - und werden nicht richtig erkannt.
    Die Datei muss so geöffnet werden, dass die Umlaute richtig - lesbar - angezeigt werden, in der Regel als iso und dann als utf-8 gespeichert werden. Entities sollte man vorher umwandeln.

  8. Erhielt Danksagungen von:


+ Antworten

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein