日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
創(chuàng)新互聯(lián)Python教程:如何使用python實現(xiàn)文本數(shù)據(jù)挖掘?

剛拿到這個問題,大部分小伙伴一定會感覺到無所下手,數(shù)據(jù)挖掘內(nèi)容那么多,要從哪個位置開始入手,于是小編,也去試了試,先給自己定了個大的框架,于是一步一步把這個過程走出來,接著就幫大家呈現(xiàn)以下內(nèi)容,不知道的小伙伴可以來了解下啦`

常見的文本挖掘有以下方式:

1、讀取txt數(shù)據(jù)

In [1]: import pandas as pd
In [2]: mydata_txt = pd.read_csv('C:\\test_code.txt',sep = '\t',encoding = 'utf-8')

2、讀取csv數(shù)據(jù)

csv文本文件是非常常用的一種數(shù)據(jù)存儲格式,而且其存儲量要比Excel電子表格大很多,下面我們就來看看如何利用Python讀取csv格式的數(shù)據(jù)文件:

In [5]: mydata_csv = pd.read_csv('C:\\test.csv',sep = ',',encoding = 'utf-8')
In [6]: mydata_csv

3、讀取電子表格文件

這里所說的電子表格就是Excel表格,可以是xls的電子表格,也可以是xlsx的電子表格。在日常工作中,很多數(shù)據(jù)都是存放在Excel電子表格中的,如果我們需要使用Python對其進行分析或處理的話,第一步就是如何讀取Excel數(shù)據(jù)。下面我們來看看如果讀取Excel數(shù)據(jù)集:

In [7]: mydata_excel = pd.read_excel('C:\\test.xlsx',sep = '\t',encoding = 'utf-8')
In [8]: mydata_excel

4、讀取數(shù)據(jù)庫數(shù)據(jù)

MySQLdb模塊是一個連接Python與MySQL的中間橋梁,但目前只能在Python2.x中運行,但不意味著Python3就無法連接MySQL數(shù)據(jù)庫。這里向大家介紹一個非常靈活而強大的模塊,那就是pymysql模塊。我比較喜歡他的原因是,該模塊可以偽裝成MySQLdb模塊,具體看下面的例子:

In [1]: import pymysql
In [2]: pymysql.install_as_MySQLdb()    #偽裝為MySQLdb模塊
In [3]: import MySQLdb使用Connection函數(shù)聯(lián)通Python與MySQL
In [4]: conn = MySQLdb.Connection(   ...:        host = 'localhost',   ...:        user = 'root',   ...:        password = 'snake',   ...:        port = 3306,   ...:        database = 'test',   ...:        charset='gbk')使用conn的游標方法(cursor),目的是為接下來的數(shù)據(jù)庫操作做鋪墊。
In [5]: cursor = conn.cursor()
In [6]: sql = 'select * from memberinfo'執(zhí)行SQL語句
In [7]: cursor.execute(sql)Out[7]: 4
In [8]: data = cursor.fetchall()
In [9]: data

好啦,以上就是常見的文本挖掘方式啦,大家可以試試哈~


分享標題:創(chuàng)新互聯(lián)Python教程:如何使用python實現(xiàn)文本數(shù)據(jù)挖掘?
URL網(wǎng)址:http://www.dlmjj.cn/article/cooehpo.html