Python3.0处理中文的方法


                刚开始学习python编程,既然3.0版出来了,虽然听说与以前的版本不太兼容,反正是新学的,没有过去的影响,所以就使用它了。正好要写个程序处理数据文件,就用它边学边用了。
但是一用就发现个大问题,它居然不能自动处理GBK中文。
在网络上搜索加上阅读它的手册里howto-unicode部分,总结出两点:
1.程序里有GBK中文的,需要在程序前两行内(下面仔细说)标明使用GBK编码。
所谓前两行,就是如果你的第一行是#!/usr/bin/python这种语句(这个不用仔细说明了吧),那就是在第二行;如果没有前面所说的脚本处理程序标记,那就在第一行注明:
#coding=gbk
2.如果要处理的文档里有中文的,那在打开文件时要注明编码。例如
f=open(filename, encoding='gbk')
另外,python3.0缺省处理的编码是utf-8,如果文件编码是这个就不用麻烦了
老实说,我本人对文字编码格式至今也没搞清楚,凑巧,要处理的文件要使用gbk编码,这才了解了下,能工作就行了。如有高手发现有错,请指出,先谢谢了。