This is an old revision of the document!
Table of Contents
Estándares
Charsets
Los nombres de los charsets según la IANA:
http://www.iana.org/assignments/character-sets
Incluyo aquí la lista completa por si acaso no estuviera disponible (mira que si falla la página de la IANA, jeje…)
Códigos de caracteres
El de españa es el ISO-8859-1 o ISO-8859-15.
El de turquía es el ISO-8859-3.
Recodificando un fichero en turco a UTF-8
Si ha sido editado en Windows:
recode windows-1254..utf-8 applicationResources.properties.tr.txt
Si ha sido editado en Linux o con la ventana de comandos:
recode -f iso-8859-3..utf-8 nombre_del_fichero.txt
OJO!!!! Es importante esta distinción, ya que en turco sí que hay diferencias entre una página de códigos y la otra. Haciendolo mal nos saldrán mensajes de error.
Idiomas y de paises
La lista completa de idiomas está indicada en el protocolo HTTP[1] por el rfc 1766[2]. Está basada en el ISO6399[4] y en la lista de paises (ISO3166[5]).
Por otro lado los idiomas soportados por el “Locale” de java[3] están basados en los mismos fundamentos[4,5].
[1] http://www.rfc-editor.org/rfc/rfc2616.txt
[2] http://www.rfc-editor.org/rfc/rfc1766.txt
[3] Esta lista puede obtenerse a través del tutorial de java:
http://java.sun.com/docs/books/tutorial/i18n/locale/create.html
[4] En concreto el ISO639:
http://ftp.ics.uci.edu/pub/ietf/http/related/iso639.txt
http://en.wikipedia.org/wiki/ISO639
http://en.wikipedia.org/wiki/ISO_639-1
[5] http://ftp.ics.uci.edu/pub/ietf/http/related/iso3166.txt
Formatos de fecha
Esta página me ha encantado: contiene una lista de documentos PDF donde se especifica el formato de fecha para 454 países del mundo. Además especifica en formato Java y POSIX cual debe ser la especificación de formato para ese país en concreto.
Para España viene incluso cuales son los nombres del mes para el idioma Catalán.