Problema con charsets en los archivos

K

Bueno, mi hermano está teniendo unos problemillas con los sets (No recuerdo la palabra en español) de caracteres en Ubuntu (Breezy) lo relato tal y como el lo cuenta. Ya hemos buscado mucho en Google y hemos probado de todo, y no logramos solucionarlo:

Resulta que hace poco se ha dado cuenta de que en el portátil los nombres de los ficheros están con un set de caracteres y el PC de sobremesa con otro. Curiosamente, los contenidos de estos archivos son todos UTF-8 (Lo ve con "file fichero.txt").

Ha hecho pruebas con el programa 'convn' (No sé qué es ni me apetece buscarlo, pero vamos, es lo que él me ha dicho) y dice que parece que el de sobremesa los crea en UTF-8 y el portátil como ISO Latin-1.

No hemos visto qué pueden tener de diferente ambos PCs. Lo único es que el servidor (El de sobremesa) está instalado directamente desde Kubuntu 5.10, mientras que el portátil viene de 5.04, pero este no debería ser problema ya que mi PC viene de 5.04 también y no he tenido problemas con los charset.

Hemos comprobado los locales (con 'locale'):

LANG=es_ES.UTF-8
LC_CTYPE="es_ES.UTF-8"
LC_NUMERIC="es_ES.UTF-8"
LC_TIME="es_ES.UTF-8"
LC_COLLATE="es_ES.UTF-8"
LC_MONETARY="es_ES.UTF-8"
LC_MESSAGES="es_ES.UTF-8"
LC_PAPER="es_ES.UTF-8"
LC_NAME="es_ES.UTF-8"
LC_ADDRESS="es_ES.UTF-8"
LC_TELEPHONE="es_ES.UTF-8"
LC_MEASUREMENT="es_ES.UTF-8"
LC_IDENTIFICATION="es_ES.UTF-8"
LC_ALL=

Exactamente igual en ambos PCs.

También hemos comprobado que ambos entornos son iguales ('cat /etc/environment/'):

LANGUAGE="es_ES:es:en_GB:en"

LANG=es_ES.UTF-8

E incluso comprobamos que todos los parámetros que generan los locales estaban iguales ('dpkg-reconfigure locales' como root).

Todo idéntico. Ya no se nos ocurre nada más, pero es que lo más gracioso es que el contenido de los ficheros es en ambos casos UTF-8; el problema es EL NOMBRE de los ficheros, que si que se ve y se crea distinto en uno y en otro.

Se dio cuenta al copiar unos ficheros desde Windows, que viene en Latin-1 y en el portátil se ven bien (De ahí que crea que el portátil guarda los ficheros con ISO Latin-1), pero en el servidor tienen caracteres extraños. A partir de ahí creamos ficheros desde un sistema en el otro y me di cuenta de que se veían distinto con caracteres raros como tildes y tal.

Por si era cosa del KDE hemos probado a hacerlo por consola, y nada, los ficheros también los crea con los nombres en Latin-1.

Por ahí ha leido que la configuración de los nombres de ficheros va por otro lado (ni por environment ni por locale), y que en principio iría en el menu.lst del grub o en el fstab, y parece lógico (Los nombres de archivo son cosa del filesystem, no del SO en sí), pero hemos comprobado y no hemos visto ninguna diferencia ni mención a los charsets ni en un fichero ni en otro.

¿Alguna idea?

Y

si, lang=es_ES@euro

haced dpkg-reconfigure locales y seleccionar SOLAMENTE todos aquellos que sean es_ESalgo

yo solo tengo seleccionado es_ES ISO-8859-1 es_ES.UTF-8 UTF-8 y es_ES@EURO ISO-8859-15 (el nuestro es ISO-8859-15)

Y por defecto tengo seleccionado es_ES@EURO

El locale me devuelve:

LANG=es_ES@euro
LC_CTYPE="es_ES@euro"
LC_NUMERIC="es_ES@euro"
LC_TIME="es_ES@euro"
LC_COLLATE="es_ES@euro"
LC_MONETARY="es_ES@euro"
LC_MESSAGES="es_ES@euro"
LC_PAPER="es_ES@euro"
LC_NAME="es_ES@euro"
LC_ADDRESS="es_ES@euro"
LC_TELEPHONE="es_ES@euro"
LC_MEASUREMENT="es_ES@euro"
LC_IDENTIFICATION="es_ES@euro"
LC_ALL=

K

El problema no creo que sea ese, porque entonces en ambos PCs la codificación del nombre de los archivos estaría mal (O bien) ya que tienen los locales idénticos.

Y

por probar tampoco pierdes nada

K

Bueno, por si interesa, pongo cómo se ha solucionado. Despues de muchas pruebas nos dimos cuenta de que el problema era sólo al crear archivo con Konqueror (Vía sftp/fish) en el otro PC. Siempre, fuera en e l PC que fuera, lo creaba con el charset contrario (El que iba con UTF-8 los creaba con ISO, y al revés.) Sé que es difícil de explicar, pero bueno xD Al grano:

  • Conecté via fish, sftp o lo que sea al otro servidor
  • Herramientas > Seleccionar juego de caracteres remoto

Voilà!

Es un PUÑETERO PLUGIN (Preferencias > Configurar Extensiones >
Herramientas) que además no está documentado en la ayuda.

Lo encontró mi hermano porque había una entrada muy vieja de un bug en la gestión de caracteres remotos en KDE 3.1 o así y decían que iban a crear un plugin donde eligieras el idioma.

¿Por qué no es automático y símplemente chequea de alguna forma la codificación del sitio remoto?

Presupongo también que en un Konqueror sin el plugin compilado no hay ni opción de hacer esto ni nada.

Parece que "predeterminado" en el plugin significa ISO-8859-1. Esto es lo que menos me gusta. El predeterminado debería ser el que marque el sistema local, digo yo.

En fin, es lo que hay.

Usuarios habituales