Kann mit UTF-8 Degrade Performance in einigen Sprachen?

  • joebert
  • Weathered
  • Genius
  • Benutzeravatar
  • Registriert: Feb 10, 2004
  • Beiträge: 11883
  • Loc: Clearwater, FL
  • Status: Offline

Beitrag Oktober 9th, 2009, 10:59 pm

Ive been reading ein bisschen mehr auf UTF-8 in letzter Zeit und einer der Nachteile, stieß ich auf UTF-8 wurde mit 2 und in einigen Fällen 3-mal so viel Platz, um Daten wie die Muttersprachen der Codierung für die Sprache verwenden würden, zu vertreten.

Quote:
UTF-8 kodierten Text ist größer als das entsprechende Single-Byte-Codierung mit Ausnahme von ASCII-Zeichen. Im Falle von Sprachen, die 8-Bit-Zeichensätze mit nicht-lateinische Alphabete in der oberen Hälfte kodiert (z. B. die meisten kyrillischen und griechischen Alphabets Code-Seiten), Buchstaben in UTF-8 wird doppelt so groß werden. Für einige Sprachen wie Hindus Devanagari und Thai werden die Briefe werden dreifache Größe (dies verursacht hat Einwände in Indien und anderen Ländern).


Mein erster Gedanke war große Sache, Speicherplatz ist ziemlich billig. Aber dann dachte ich über die RAM es muss installiert sein, um dieser Arbeit UTF-8 kodierten Daten in einer Anwendung. Wenn Sie mit 2 und 3 mal so viel Speicher, um mit den gleichen Daten arbeiten, wie Sie verwenden würden, wenn Sie die nativen Codierung verwendet für die Sprache, das ist eine große Sache, wenn man darüber nachdenkt. Es bedeutet, die Anwendung ist nur 50% so effizient, wie es wäre, indem Sie einfach mit der Codierung für die Sprache, oder im Falle der Sprachen in diesem Angebot, 33% so effizient gestaltet werden erwähnt.

Grundsätzlich Durchsetzung von UTF-8 in einer Anwendung in einem Versuch, ein mehrsprachiges Verkaufsargument für diese Anwendung haben, werden Sie in einigen Fällen, die der Käufer für 2-3x so viel Hardware verwenden, um die gleiche Leistung wie alle anderen mit dem genau die gleiche Software. Welches ist wohl die genaue oppisite der ein Verkaufsargument. Die wahrscheinlich genug, um den Zweck der Sie entscheiden, auf UTF-8 in erster Linie nutzen zu besiegen.

Bin ich verrückt?
Habe ich gelesen zu viele globale Erwärmung und grüne Energie Schlagzeilen in den Nachrichten?
Why yes, yes I am.
  • Anonymous
  • Bot
  • No Avatar
  • Registriert: 25 Feb 2008
  • Beiträge: ?
  • Loc: Ozzuland
  • Status: Online

Beitrag Oktober 9th, 2009, 10:59 pm

  • mk27
  • Proficient
  • Proficient
  • Benutzeravatar
  • Registriert: Jun 09, 2009
  • Beiträge: 278
  • Status: Offline

Beitrag Oktober 10th, 2009, 7:20 am

joebert hat geschrieben:
Es bedeutet, die Anwendung ist nur 50% so effizient, wie es wäre, indem Sie einfach mit der Codierung für die Sprache, oder im Falle der Sprachen in diesem Angebot, 33% so effizient gestaltet werden erwähnt.


Ich glaube nicht, dass die Folgen wird, summiert sich auf diese Weise buchstäblich, entweder für den RAM oder das Programm Effizienz, weil Sie mit UTF-8 Werte , Aber es ist wahr, Sie werden sich mit doppelt so viel Platz mit Dateien auf der Festplatte.

Ziemlich interessant. Byte-Zeichen sind Schmerzen der Rückseite der Regel IMO.
Bild
  • joebert
  • Weathered
  • Genius
  • Benutzeravatar
  • Registriert: Feb 10, 2004
  • Beiträge: 11883
  • Loc: Clearwater, FL
  • Status: Offline

Beitrag Oktober 10th, 2009, 11:09 am

Quote:
Ich glaube nicht, dass die Folgen wird, summiert sich auf diese Weise buchstäblich, entweder für den RAM oder das Programm Effizienz, weil Sie mit UTF-8 Werte , Aber es ist wahr, Sie werden sich mit doppelt so viel Platz mit Dateien auf der Festplatte.


Schlagen Sie vor, es dauert weniger RAM zu speichern Multi-Byte-Zeichen als Speicherplatz benötigt?

Warum würde es weniger Platz, um den Charakter im RAM als würde es auf Festplatte speichern?
Why yes, yes I am.
  • mk27
  • Proficient
  • Proficient
  • Benutzeravatar
  • Registriert: Jun 09, 2009
  • Beiträge: 278
  • Status: Offline

Beitrag Oktober 10th, 2009, 12:12 pm

joebert hat geschrieben:
Schlagen Sie vor, es dauert weniger RAM zu speichern Multi-Byte-Zeichen als Speicherplatz benötigt?

Warum würde es weniger Platz, um den Charakter im RAM als würde es auf Festplatte speichern?


Nein, vorgeschlagen Im großen und ganzen die meisten Anwendungen einen Betrag von Menschen lesbaren Text, der relativ zu den anderen Komponenten im RAM gehalten, ist sehr gering. ZB die durchschnittliche Web-Seite enthält eine Menge an Text, die nur berücksichtigt würde, für ein paar Prozent (oder weniger) des Speichers durch die Prozesse an beiden Enden - also statt, in einfachen Worten dem Server und dem Browser zu besetzen vieles mehr Speicher als die triviale Textmenge sie zu präsentieren.
Bild

Buchung Informationen

  • Beiträge in diesem Thema: 4 Beiträge
  • Mitglieder in diesem Forum: 0 Mitglieder und 304 Gäste
  • Du darfst keine neuen Themen in diesem Forum erstellen.
  • Du darfst keine Antworten zu Themen in diesem Forum erstellen.
  • Du darfst deine Beiträge in diesem Forum nicht ändern.
  • Du darfst deine Beiträge in diesem Forum nicht löschen.
  • Du darfst keine Dateianhänge in diesem Forum erstellen.
 
 

© Unmelted Enterprises 1998-2009. Angetrieben durch phpBB © 2001-2009 phpBB Group.