新聞中心
word文件看起來(lái)很復(fù)雜,不方便結(jié)構(gòu)化。事實(shí)上,word文檔中大概有幾種內(nèi)容:paragraph(段落)、table(表格)、character(字符)。我現(xiàn)在要分析的word文檔基本都是段落和表格。本文主要講述從word中分析表格,并將表格信息結(jié)構(gòu)化的方法。

十余年專注成都網(wǎng)站制作,成都企業(yè)網(wǎng)站定制,個(gè)人網(wǎng)站制作服務(wù),為大家分享網(wǎng)站制作知識(shí)、方案,網(wǎng)站設(shè)計(jì)流程、步驟,成功服務(wù)上千家企業(yè)。為您提供網(wǎng)站建設(shè),網(wǎng)站制作,網(wǎng)頁(yè)設(shè)計(jì)及定制高端網(wǎng)站建設(shè)服務(wù),專注于成都企業(yè)網(wǎng)站定制,高端網(wǎng)頁(yè)制作,對(duì)三輪攪拌車等多個(gè)方面,擁有多年的網(wǎng)站設(shè)計(jì)經(jīng)驗(yàn)。
1、為了使用python解析word文件,可以使用包docx,首先需要在python中安裝它。
pip install python-docx
2、安裝后,就可以讀取word文件。
importdocx fn= r'D:\長(zhǎng)恨歌.docx'doc=docx.Document(fn)#按段落讀取全部數(shù)據(jù) for paragraph indoc.paragraphs:print(paragraph.text)#按表格讀取全部數(shù)據(jù) for table indoc.tables:for row intable.rows:for cell inrow.cells:print(cell.text) table_num=len(doc.tables)#獲取文檔的表格個(gè)數(shù) print(table_num) table_0=doc.tables[0]#選取第一個(gè)表 table_rows =len(table_0.rows)#獲取第一個(gè)表的行數(shù) print(table_rows) tab=doc.tables[0].rows[0].cells[0]#獲取第一張表第一行第一列數(shù)據(jù) print(tab.text) par= doc.paragraphs[2]#讀取第三段數(shù)據(jù) print(par.text)
以上就是python在word中讀取表格內(nèi)容的方法,希望對(duì)大家有所幫助。更多Python學(xué)習(xí)指路:創(chuàng)新互聯(lián)Python教程
本文教程操作環(huán)境:windows7系統(tǒng)、Python 3.9.1,DELL G3電腦。
當(dāng)前標(biāo)題:創(chuàng)新互聯(lián)Python教程:python如何在word中讀取表格內(nèi)容
本文地址:http://www.dlmjj.cn/article/dhigods.html


咨詢
建站咨詢
