Estoy buscando una lista de caracteres "por sets". Es decir, todos los de Latin - 1, los rusos, etc. De hecho los asiáticos no me interesan mucho ahora pero no estaría de más tenerlo. Lo ideal sería un TXT codificado en UTF-8 con todos los caracteres, uno en cada línea, de todas las lenguas europeas.
Algo como
la lista de caracteres de Latin - 1 de Unicode.org pero en versión texto en vez de PDF. Además esa creo que no lleva ruso.
Por cierto, si sabeis de cualquier artículo interesante sobre localización de software (
a parte del clásico de Joel Spolsky), también estaría bien.
Ampliando el mercado ¿he? ;)
Te recomiendo que te leas de gamasutra:
The Video Game Translator Wishlist
http://www.gamasutra.com/features/20050615...monton_01.shtmlEs una lectura rapida y aunque no esta orientado a programacion, si que da ideas y te hace reflexionar sobre como montarte el sistema.
Luego si quieres pasarte un rato leyendo:
http://www.amazon.com/gp/product/158450343...glance&n=283155te lo puedes comprar en amazon o hacerte una copia privada, que en España es
legal :-)
Otros libros:
http://www.amazon.com/gp/product/076454625...glance&n=283155http://www.amazon.com/gp/product/073561583...glance&n=283155Seguro que ya estas asustado asi que:
http://www.cl.cam.ac.uk/~mgk25/unicode.htmlAqui tienes tambien algo de info, supongo que lo que se encuentra a partir de:
http://www.macchiato.com/unicode/Unicode_t...scriptions.htmlTe puede servir para fabricar esas tablas y ya me callo.
en python hay unos métodos muy interesantes para codificar y descodificar(encode, decode) utfs, latins, unicodes, etc. y te ahorras todo el tema de codificaciones a pelo. No se cómo se hace en otro lenguaje, pero seguro que hay alguna forma sencilla. :huh: