更新时间:2022-10-04 14:30:10
1、根据文件头。
1
2
3
4
5
6
|
#是否为带BOM头的UTF8文件 def IsUtf8BomFile(pathfile):
if b '\xef\xbb\xbf' = = open (pathfile, mode = 'rb' ).read( 3 )):
return True
return False
|
2、用cchardet库。
1
2
3
|
>>> import cchardet
>>> cchardet.detect( open (pathfile, 'rb' ).read())
{ 'encoding' : 'UTF-8' , 'confidence' : 0.9900000095367432 }
|
相关阅读:
1、u'\ufeff' in Python string (里面有几种文本的头信息)
*** walker ***
本文转自walker snapshot博客51CTO博客,原文链接http://blog.51cto.com/walkerqt/1757899如需转载请自行联系原作者
RQSLT