Peut Utiliser l'UTF-8 Performance Degrade dans certaines langues?

  • joebert
  • Weathered
  • Genius
  • Avatar de l’utilisateur
  • Inscription: Fév 10, 2004
  • Messages: 11874
  • Loc: Clearwater, FL
  • Status: Offline

Message Octobre 9th, 2009, 10:59 pm

Ive lecture un peu plus sur UTF-8 ces derniers temps et l'un des inconvénients je suis tombé sur le UTF-8 en utilisant 2 et, dans certains cas 3 fois plus d'espace pour représenter des données comme encodage natif de la langue va l'utiliser.

Quote:
UTF-8 texte codé est plus grande que celle de ses encodage sur un seul octet à l'exception des caractères ASCII. Dans le cas des langues qui utilise des jeux de caractères 8-bits avec des alphabets non latins codés dans la moitié supérieure (comme la plupart cyrillique et grec pages de code alphabétique), les lettres en UTF-8 sera le double de la taille. Pour certaines langues, comme hindous Devanagari et thaï, des lettres, va tripler la taille (ce qui a provoqué des objections de l'Inde et autres pays).


Ma première pensée a big deal, l'espace de stockage est assez bon marché de nos jours. Mais ensuite j'ai pensé à la RAM il faut utiliser pour travailler avec ce format UTF-8 les données encodées dans une application. Si vous utilisez 2 et 3 fois plus de mémoire pour fonctionner avec les mêmes données que vous pouvez utiliser si vous avez utilisé le codage natif de la langue, thats a big deal quand on y pense. Cela signifie que la demande est à seulement 50% plus efficace que ce serait simplement en utilisant le codage conçus pour la langue, ou dans le cas des langues mentionnées dans cette citation, 33% aussi efficace.

Essentiellement par l'application de l'UTF-8 dans une application dans une tentative d'avoir un point de vente multi-lingual pour cette application, vous êtes dans certains cas nécessitant l'acheteur d'utiliser le 2-3X autant de matériel pour obtenir les mêmes performances que n'importe qui d'autre en utilisant les Exact Software même. Qui est probablement le oppisite exacte d'un point de vente. C'est probablement suffisant pour vaincre le but de vous décider d'utiliser l'UTF-8, en premier lieu.

Suis-je fou?
Ai-je lu trop de réchauffement planétaire et les grands titres de l'énergie verte dans les nouvelles?
Why yes, yes I am.
  • Anonymous
  • Bot
  • No Avatar
  • Inscription: 25 Feb 2008
  • Messages: ?
  • Loc: Ozzuland
  • Status: Online

Message Octobre 9th, 2009, 10:59 pm

  • mk27
  • Proficient
  • Proficient
  • Avatar de l’utilisateur
  • Inscription: Juin 09, 2009
  • Messages: 278
  • Status: Offline

Message Octobre 10th, 2009, 7:20 am

joebert a écrit:
Cela signifie que la demande est à seulement 50% plus efficace que ce serait simplement en utilisant le codage conçus pour la langue, ou dans le cas des langues mentionnées dans cette citation, 33% aussi efficace.


Je ne pense pas que les conséquences seront d'additionner cette façon, littéralement, que ce soit pour la mémoire vive ou l'efficacité du programme, parce que vous travaillez avec UTF-8 valeurs , Mais il est vrai que vous aurez affaire à deux fois autant d'espace avec des fichiers sur le disque.

Très intéressant. Caractères multi-octets sont une douleur du dos en général de l'OMI.
Image
  • joebert
  • Weathered
  • Genius
  • Avatar de l’utilisateur
  • Inscription: Fév 10, 2004
  • Messages: 11874
  • Loc: Clearwater, FL
  • Status: Offline

Message Octobre 10th, 2009, 11:09 am

Quote:
Je ne pense pas que les conséquences seront d'additionner cette façon, littéralement, que ce soit pour la mémoire vive ou l'efficacité du programme, parce que vous travaillez avec UTF-8 valeurs , Mais il est vrai que vous aurez affaire à deux fois autant d'espace avec des fichiers sur le disque.


Voulez-vous dire cela prend moins de mémoire vive pour stocker les caractères multi-octets d'espace disque il ne?

Pourquoi serait-il prendre toute moins d'espace pour stocker les caractères dans la mémoire vive que celle qu'il aurait sur le disque?
Why yes, yes I am.
  • mk27
  • Proficient
  • Proficient
  • Avatar de l’utilisateur
  • Inscription: Juin 09, 2009
  • Messages: 278
  • Status: Offline

Message Octobre 10th, 2009, 12:12 pm

joebert a écrit:
Voulez-vous dire cela prend moins de mémoire vive pour stocker les caractères multi-octets d'espace disque il ne?

Pourquoi serait-il prendre toute moins d'espace pour stocker les caractères dans la mémoire vive que celle qu'il aurait sur le disque?


Non, Im suggérant dans l'ensemble, la plupart des applications utilisent une quantité de texte lisible par l'homme qui, par rapport aux autres composantes maintenu dans la RAM, est très minime. Par exemple, la page web moyen contient une quantité de texte qui ne représentent que quelques pour cent (ou moins) de la mémoire détenue par les procédés à chaque extrémité - c'est à dire, en termes simples le serveur et le navigateur occupe la mémoire de beaucoup beaucoup plus que le montant minime de texte qu'ils présentent.
Image

Afficher de l'information

  • Total des messages de ce sujet: 4 messages
  • Utilisateurs parcourant ce forum: Bogey, meisam, SpooF et 119 invités
  • Vous ne pouvez pas poster de nouveaux sujets
  • Vous ne pouvez pas répondre aux sujets
  • Vous ne pouvez pas éditer vos messages
  • Vous ne pouvez pas supprimer vos messages
  • Vous ne pouvez pas joindre des fichiers
 
 

© Unmelted Enterprises 1998-2009. Poussé par phpBB © 2001-2009 phpBB Group.