新聞中心
這里有您想知道的互聯(lián)網營銷解決方案
創(chuàng)新互聯(lián)Python教程:python怎么識別文件格式
python通過第三方庫chardet以字節(jié)方式讀進字節(jié)流對象,然后通過detect函數(shù)識別進而獲取文件的格式。
創(chuàng)新互聯(lián)于2013年創(chuàng)立,是專業(yè)互聯(lián)網技術服務公司,擁有項目做網站、網站建設網站策劃,項目實施與項目整合能力。我們以讓每一個夢想脫穎而出為使命,1280元瀘溪做網站,已為上家服務,為瀘溪各地企業(yè)和個人服務,聯(lián)系電話:028-86922220
"""
自動識別 文本編碼格式
"""
import chardet
def detectCode(path):
with open(path, 'rb') as file:
data = file.read(20000)
dicts = chardet.detect(data)
return dicts["encoding"]
def print_data_1(path):
"""
這種編碼通過命令行 file -i 文件名獲取編碼格式,
通過測試,使用file 命令獲取的編碼格式不能獲取正確的編碼數(shù)據(jù)
:param path:
:return:
"""
with open(path, "r", encoding="iso-8859-1") as f:
i = 0
for line in f:
print(line)
i += 1
if i == 5:
break
f.close()
def print_data_2(path):
print("-------------------------------")
with open(path, "r", encoding="{0}".format(detectCode(path))) as f:
i = 0
for line in f:
b_line = line.encode("utf-8") # 將文件內容轉化為utf-8格式
print(chardet.detect(b_line)['encoding']) # 輸出轉化為內容格式
i += 1
if i == 5:
break
f.close()
if __name__ == '__main__':
path = "test.txt"
print(detectCode(path))
# print_data_1(path)
print_data_2(path)
推薦課程:Python進階視頻教程
網頁題目:創(chuàng)新互聯(lián)Python教程:python怎么識別文件格式
分享URL:http://www.dlmjj.cn/article/cooidch.html


咨詢
建站咨詢

