且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

Python编码错误处理

更新时间:2021-07-12 01:36:37

   如题,我用python 解析文件(文件中含有中文),并写入其他文件时报错:

   UnicodeEncodeError: 'ascii' codec can't encode characters

   经过google大神的指导,确定以下解决方式:

   #coding:utf-8       import sys      reload(sys)       sys.setdefaultencoding('utf-8') 

   疑问:为什么需要reload呢?

   grep -r -i 'setdefaultencoding' /usr/lib/python2.7    输出结果为:
   /usr/lib/python2.7/site.py:        sys.setdefaultencoding(encoding) # Needs Python Unicode build !
   /usr/lib/python2.7/site.py:    # Remove sys.setdefaultencoding() so that users cannot change the
   /usr/lib/python2.7/site.py:    if hasattr(sys, "setdefaultencoding"):
   /usr/lib/python2.7/site.py:        del sys.setdefaultencoding
   Binary file /usr/lib/python2.7/site.pyc matches

   把del sys.setdefaultencoding 防止用户在改变defaultencoding ,这个原因暂时真不知。。

   对于windows平台,上面的办法真不行,对于python 2.x中,总是存在这个问题,在Python 3.x的时候这真不是个事,

  对于windows 平台,

 文件开头声明为 #coding=utf-8,

 写入字符串时,转换编码为GBK

file.write(str.encode('gbk'))

  还要注意的是:open(....) 不能有任何运算,一次 只能写入一行,所以要用 + 来连成一行






本文转自 位鹏飞 51CTO博客,原文链接:http://blog.51cto.com/weipengfei/1030862,如需转载请自行联系原作者