ubuntu能使用智能ABC吗?

ubuntu中文化指南

前言:下面的文字只是针对采用zh_CN.GBxxx作为locale的untuntu系统进行的设置指南。
发现最近几天又有人问这个问题了,下面的方法我查了半天的资料,花了很多功夫,总算是有了这个方法,因为我个人对utf8确实没什么好感(这一点就不要争论了,个人印象如此,改不了了),所以和大家分享一下(其实我很懒,打了这么多字,不容易啊),这个帖子前几天发的,可能有人没看到,编辑一下再顶起来,希望需要的人可以看到,说实在的,网上关于linux设置中文locale的方法,都比较笼统,用起来总有这样那样的问题,希望这篇文章可以对你有帮助。

注:linux文件系统的一些概念,linux的文件系统的文件名是基于字节流的,也就是说文件名的编码以byte为单位读取的,所以文件名可以是多字节编码方案,比如gb18030, utf8,不能是宽字节编码,比如如windows使用的utf16。所以只要是多字编码方案的文件名,linux都是可以读取的。

1)为glib的国际化支持产生国标编码支持,ubuntu系统默认状态下是没有GB18030和GBK的本地locale的,所以为了设置locale为zh_CN.GB18030,我们需要先为glib产生GB18030和GBK编码的支持。
1、首先设置sudo vi /var/lib/locales/supported.d/local

添加一行 zh_CN.GBK GBK和zh_CN.GB18030 GB18030

2、sudo locale-gen
3、重启之后,在登录窗口的选项里面就可以选择中文(GB18030)了。
4、进入系统后,终端的默认编码已经是GB18030了,可以在终端中创建中文文件名的文件试试看,比如touch 中文,再ls显示看看。

2)作为ubuntu重要组成部分的gnome是基于glib库的,在glib的函数里,默认读写文件名的编码选项是utf8,所以使用gtk或是gnome程序创建的中文文件名仍然是uft8编码的,可以通过下面的方法验证,在nautilus中进入/home/用户文件夹,右键创建文件夹,取一个中文名字,在终端中ls显示,会发现这个文件夹是乱码,将终端的编码切换为uft8,发现至少可以部分正常显示,说明文件夹的编码是uft8。其实glib提供了两个宏,只要正确的设置,就可以告诉gnome程序,用户要读取的文件名的编码是哪一种多字编码方案,那么文件函数完全可以采用gb18030的编码。

使用gdm启动Gnome的写入用户主目录的.profile文件,当gnome启动后,会读取这个文件里面的设置。
添加以下内容:
export G_FILENAME_ENCODING=GB18030
export G_BROKEN_FILENAMES=1
这是告诉使用了glibc的程序,系统文件名的默认编码是gb18030,重启后,再用上面的方法实验,会发现终端里面和nautilus中显示的文件名已经是一致的了。

经过上面两步的设置,系统的工作环境就是gb18030了,可以很好的用中文工作,哪怕是编写脚本,只要保存编码改成gb18030就没问题,哪怕是grep之类的命令,gb18030都可以很好的支持,使用中文的正则表达式除外。

3)fat32分区的挂载,将locale改成zh_CN.GB18030之后,会发现挂载的分区中文文件都显示乱码,这是因为ubuntu自动挂载分区时采用的参数是uft8,所以要重新修改挂载的参数。
sudo gedit /etc/fstab
比如c盘的挂载参数是类似于这样
UUID=466A-E277 /media/sda1 vfat defaults,utf8,umask=007,gid=46 0 1
将utf8用codepage=936,iocharset=cp936代替,变成
UUID=466A-E277 /media/sda1 vfat defaults,codepage=936,iocharset=cp936,umask=007,gid=46 0 1
参数的含义可以用man mount查看(懒得打字了)其他fat32分区的挂载参数也同样修改。
重启之后发现分区显示也正常了。
因为我没用ntfs分区,所以nfts分区的挂载方法请用man mount自己查看。

gb18030环境下有问题的程序和解决方法。
其实如果是基于规范的glibc函数编程的话,gb18030应该不会有什么问题。
1. mplayer
安装版的mplayer的打开文件的功能是看不见windows挂载分区上的中文文件的,不过可以在浏览器里面直接双击打开,算是不是问题的问题吧。如果要编译源文件的话,根据有的说明要暂时将locale改成utf8,编译后再改回来就可以了。

2.ubuntu自带的归档管理器和7zip软件在gb18030的环境下,读写中文文件名的文件是有问题的,解决方法是安装rar,它是基于命令行的方式,对zh_cn.gb18030支持很好,如果嫌麻烦的话,好象可以编写nautilus的脚本的,可以向windows中一样右键解压或是压缩,不过俺不会,有人会的话可不可以提供个脚本?

其它的暂时没有什么发现,有什么补充的话可以告诉我,我再修改帖子。

最后由 wizardyhnr 编辑于 2007-08-31 11:56,总共编辑了 2 次

作者: wizardyhnr   发布时间: 2007-08-02

gnome-control-center就可以了

作者: qsgh   发布时间: 2007-08-02

utf8才是趋势~~

作者: hualang0929   发布时间: 2007-08-02

好办法~

locale=zh_CN.GB18030

作者: nihui   发布时间: 2007-08-02

还是用utf8吧
不过还是篇好文章啊
不少启发
哈哈~~~

作者: skychen1900   发布时间: 2007-12-29

请问楼主,我不想把现在的语言环境都改为18030,只想这个ubuntu能够正确读出u盘上的使用18030保存的文件的文件名,该怎么做?现在,u盘上的文件名若为汉字必是乱码,文件倒是能正常显示。

作者: yw3008   发布时间: 2008-01-06

3、重启之后,在登录窗口的选项里面就可以选择中文(GB18030)了。 ???
这个登录窗口的选项在那?我用的是KDE3.5怎么也找不着~~~

作者: zdp5528   发布时间: 2008-03-01

我用的是Ubuntu8.04 server版,当时装的是英文版,现在装了LAMP,想要在网页里输入中文,全是乱码。我已经安装了GB字库,但还是不行。请问有什么办法解决呢?
PS:server版重启后如何选择默认语言?

作者: sunny_tony   发布时间: 2009-06-22

好文,讲的透彻.ubuntu现在仍然没法自动侦探字符集

作者: bestgoogle   发布时间: 2010-08-29