Ive estado leyendo un poco más en
UTF-8 últimamente y uno de los inconvenientes que me encontré fue UTF-8 utilizando 2 y, en algunos casos 3 veces más espacio para representar los datos como la codificación de la lengua nativa usaría.
UTF-8 encoded text es mayor que la adecuada codificación de un solo byte a excepción de caracteres de ASCII plano. En el caso de las lenguas que utilizan juegos de caracteres de 8-bits con alfabetos no latinos codificados en la mitad superior (como la mayoría cirílico y griego páginas de código alfabético), cartas en UTF-8 será el doble del tamaño. Para algunos idiomas como el Hindis devanagari y Tailandia, las letras serán el triple del tamaño (lo que ha provocado las objeciones de la India y otros países).
Mi primer pensamiento fue gran cosa, el espacio de almacenamiento es bastante barato en estos días. Pero luego pensé en la memoria RAM se debe usar para trabajar con este UTF-8 datos codificados en una aplicación. Si está utilizando 2 y 3 veces más memoria para trabajar con los mismos datos que usted usaría si utiliza la codificación nativa de la lengua, eso es una gran cosa cuando lo piensas. Significa que la solicitud es sólo el 50% lo más eficiente sería simplemente utilizando la codificación diseñado para el idioma o en el caso de las lenguas mencionadas en esa cita, el 33% de eficiente.
Básicamente mediante la aplicación de UTF-8 en una aplicación en un intento de tener un punto de venta de varios idiomas para que la aplicación, en algunos casos que requieren que el comprador utilice 2-3X como hardware mucho para conseguir el mismo rendimiento que cualquier otra persona usando la mismo software. Que es probablemente la oppisite exacta de un punto de venta. Es probablemente lo suficiente para derrotar el propósito de que la decisión de utilizar UTF-8 en el primer lugar.
¿Estoy loco?
¿He estado leyendo demasiadas Calentamiento Global y los titulares de Energía Verde en las noticias?
Strong with this one, the sudo is.