¿Puede Usando UTF-8 degradan el rendimiento en algunos idiomas?

  • joebert
  • Sledgehammer
  • Genius
  • No Avatar
  • Registrado: Feb 10, 2004
  • Mensajes: 13458
  • Loc: Florida
  • Status: Offline

Nota Octubre 9th, 2009, 10:59 pm

Ive estado leyendo un poco más en UTF-8 últimamente y uno de los inconvenientes que me encontré fue UTF-8 utilizando 2 y, en algunos casos 3 veces más espacio para representar los datos como la codificación de la lengua nativa usaría.

Quote:
UTF-8 encoded text es mayor que la adecuada codificación de un solo byte a excepción de caracteres de ASCII plano. En el caso de las lenguas que utilizan juegos de caracteres de 8-bits con alfabetos no latinos codificados en la mitad superior (como la mayoría cirílico y griego páginas de código alfabético), cartas en UTF-8 será el doble del tamaño. Para algunos idiomas como el Hindis devanagari y Tailandia, las letras serán el triple del tamaño (lo que ha provocado las objeciones de la India y otros países).


Mi primer pensamiento fue gran cosa, el espacio de almacenamiento es bastante barato en estos días. Pero luego pensé en la memoria RAM se debe usar para trabajar con este UTF-8 datos codificados en una aplicación. Si está utilizando 2 y 3 veces más memoria para trabajar con los mismos datos que usted usaría si utiliza la codificación nativa de la lengua, eso es una gran cosa cuando lo piensas. Significa que la solicitud es sólo el 50% lo más eficiente sería simplemente utilizando la codificación diseñado para el idioma o en el caso de las lenguas mencionadas en esa cita, el 33% de eficiente.

Básicamente mediante la aplicación de UTF-8 en una aplicación en un intento de tener un punto de venta de varios idiomas para que la aplicación, en algunos casos que requieren que el comprador utilice 2-3X como hardware mucho para conseguir el mismo rendimiento que cualquier otra persona usando la mismo software. Que es probablemente la oppisite exacta de un punto de venta. Es probablemente lo suficiente para derrotar el propósito de que la decisión de utilizar UTF-8 en el primer lugar.

¿Estoy loco?
¿He estado leyendo demasiadas Calentamiento Global y los titulares de Energía Verde en las noticias?
Strong with this one, the sudo is.
  • Anonymous
  • Bot
  • No Avatar
  • Registrado: 25 Feb 2008
  • Mensajes: ?
  • Loc: Ozzuland
  • Status: Online

Nota Octubre 9th, 2009, 10:59 pm

  • mk27
  • Proficient
  • Proficient
  • Avatar de Usuario
  • Registrado: Jun 09, 2009
  • Mensajes: 334
  • Status: Offline

Nota Octubre 10th, 2009, 7:20 am

joebert escribió:
Significa que la solicitud es sólo el 50% lo más eficiente sería simplemente utilizando la codificación diseñado para el idioma o en el caso de las lenguas mencionadas en esa cita, el 33% de eficiente.


No creo que las consecuencias se suman de esa manera, literalmente, ya sea para la memoria RAM o la eficiencia del programa, porque se trabaja con UTF-8 valores , Pero es cierto que tendrá que lidiar con el doble de espacio con los archivos de disco.

Muy interesante. Los caracteres multibyte son un dolor de espalda en general de la OMI.
Imagen
  • joebert
  • Sledgehammer
  • Genius
  • No Avatar
  • Registrado: Feb 10, 2004
  • Mensajes: 13458
  • Loc: Florida
  • Status: Offline

Nota Octubre 10th, 2009, 11:09 am

Quote:
No creo que las consecuencias se suman de esa manera, literalmente, ya sea para la memoria RAM o la eficiencia del programa, porque se trabaja con UTF-8 valores , Pero es cierto que tendrá que lidiar con el doble de espacio con los archivos de disco.


¿Estás sugiriendo que se necesita menos memoria RAM para almacenar caracteres multi-byte de espacio en disco que hace?

¿Por qué se necesita menos espacio para almacenar el carácter en la memoria RAM de lo que sería en el disco?
Strong with this one, the sudo is.
  • mk27
  • Proficient
  • Proficient
  • Avatar de Usuario
  • Registrado: Jun 09, 2009
  • Mensajes: 334
  • Status: Offline

Nota Octubre 10th, 2009, 12:12 pm

joebert escribió:
¿Estás sugiriendo que se necesita menos memoria RAM para almacenar caracteres multi-byte de espacio en disco que hace?

¿Por qué se necesita menos espacio para almacenar el carácter en la memoria RAM de lo que sería en el disco?


No, soy lo que sugiere, en general, la mayoría de aplicaciones utilizar una cantidad de texto legible por humanos que, en relación con los otros componentes mantienen en la memoria RAM, es muy menor. Por ejemplo, la página web contiene un promedio de cantidad de texto que sólo representan un pequeño porcentaje (o menos) de la memoria en manos de los procesos en los extremos - es decir, en términos simples, el servidor y el navegador ocupan memoria mucho más que la cantidad trivial de texto que presentan.
Imagen

Publicar Información

  • Total de mensajes en este tema: 4 mensajes
  • Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 115 invitados
  • No puede abrir nuevos temas en este Foro
  • No puede responder a temas en este Foro
  • No puede editar sus mensajes en este Foro
  • No puede borrar sus mensajes en este Foro
  • No puede enviar adjuntos en este Foro
 
 

© 2011 Unmelted, LLC. Ozzu® es una marca registrada de Unmelted, LLC