新聞中心
在Python中,pandas庫(kù)(簡(jiǎn)稱pd)用于數(shù)據(jù)處理和分析,支持?jǐn)?shù)據(jù)結(jié)構(gòu)如DataFrame和Series。
創(chuàng)新互聯(lián)公司執(zhí)著的堅(jiān)持網(wǎng)站建設(shè),小程序設(shè)計(jì);我們不會(huì)轉(zhuǎn)行,已經(jīng)持續(xù)穩(wěn)定運(yùn)營(yíng)十余年。專業(yè)的技術(shù),豐富的成功經(jīng)驗(yàn)和創(chuàng)作思維,提供一站式互聯(lián)網(wǎng)解決方案,以客戶的口碑塑造品牌,攜手廣大客戶,共同發(fā)展進(jìn)步。
Python中的pandas(簡(jiǎn)稱pd)是一個(gè)功能強(qiáng)大的數(shù)據(jù)處理庫(kù),它提供了大量用于數(shù)據(jù)清洗、轉(zhuǎn)換、分析和可視化的方法,本文將詳細(xì)介紹pd的基本用法,包括數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)讀取、數(shù)據(jù)篩選、數(shù)據(jù)統(tǒng)計(jì)和數(shù)據(jù)可視化等方面的內(nèi)容。
數(shù)據(jù)結(jié)構(gòu)
1、DataFrame
DataFrame是pd中最常用的數(shù)據(jù)結(jié)構(gòu),它是一個(gè)二維表格型數(shù)據(jù)結(jié)構(gòu),類似于Excel表格或SQL表,DataFrame可以存儲(chǔ)多種類型的數(shù)據(jù),如數(shù)值、字符串等,并且具有很多方便的數(shù)據(jù)操作方法。
創(chuàng)建一個(gè)DataFrame:
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
print(df)
2、Series
Series是pd中的另一種數(shù)據(jù)結(jié)構(gòu),它是一個(gè)一維數(shù)組,類似于NumPy的數(shù)組,Series可以存儲(chǔ)單一類型的數(shù)據(jù),如數(shù)值或字符串。
創(chuàng)建一個(gè)Series:
import pandas as pd data = [1, 2, 3, 4, 5] s = pd.Series(data) print(s)
數(shù)據(jù)讀取
1、讀取CSV文件
使用pd.read_csv()方法可以讀取CSV文件,并將其轉(zhuǎn)換為DataFrame。
import pandas as pd
df = pd.read_csv('file.csv')
print(df)
2、讀取Excel文件
使用pd.read_excel()方法可以讀取Excel文件,并將其轉(zhuǎn)換為DataFrame。
import pandas as pd
df = pd.read_excel('file.xlsx')
print(df)
3、讀取SQL數(shù)據(jù)庫(kù)
使用pd.read_sql()方法可以讀取SQL數(shù)據(jù)庫(kù)中的數(shù)據(jù),并將其轉(zhuǎn)換為DataFrame。
import pandas as pd
import sqlite3
conn = sqlite3.connect('database.db')
query = 'SELECT * FROM table_name'
df = pd.read_sql(query, conn)
print(df)
數(shù)據(jù)篩選
1、選擇某一列
使用df[‘column_name’]可以選擇DataFrame中的某一列。
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
print(df['A'])
2、選擇多列
使用df[[‘column1’, ‘column2’]]可以選擇DataFrame中的多列。
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
print(df[['A', 'C']])
3、根據(jù)條件篩選數(shù)據(jù)
使用df[df[‘column_name’] > value]可以根據(jù)條件篩選數(shù)據(jù)。
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
print(df[df['A'] > 1])
數(shù)據(jù)統(tǒng)計(jì)
1、計(jì)算平均值
使用df[‘column_name’].mean()可以計(jì)算某一列的平均值。
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
print(df['A'].mean())
2、計(jì)算總和
使用df[‘column_name’].sum()可以計(jì)算某一列的總和。
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
print(df['A'].sum())
3、計(jì)算唯一值個(gè)數(shù)
使用df[‘column_name’].nunique()可以計(jì)算某一列的唯一值個(gè)數(shù)。
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
print(df['A'].nunique())
數(shù)據(jù)可視化
1、繪制折線圖
使用df.plot()可以繪制DataFrame的折線圖。
import pandas as pd
import matplotlib.pyplot as plt
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
df.plot()
plt.show()
2、繪制柱狀圖
使用df[‘column_name’].plot(kind=’bar’)可以繪制某一列的柱狀圖。
import pandas as pd
import matplotlib.pyplot as plt
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
df['A'].plot(kind='bar')
plt.show()
相關(guān)問(wèn)題與解答:
1、如何在Python中使用pd讀取CSV文件?
答:使用pd.read_csv()方法可以讀取CSV文件,并將其轉(zhuǎn)換為DataFrame。df = pd.read_csv('file.csv')。
2、如何根據(jù)條件篩選DataFrame中的數(shù)據(jù)?
答:使用df[df[‘column_name’] > value]可以根據(jù)條件篩選數(shù)據(jù)。df[df['A'] > 1]。
3、如何使用pd計(jì)算某一列的平均值?
答:使用df[‘column_name’].mean()可以計(jì)算某一列的平均值。df['A'].mean()。
4、如何使用pd繪制DataFrame的折線圖?
答:使用df.plot()可以繪制DataFrame的折線圖。df.plot()。
分享名稱:python中pd的用法
本文地址:http://www.dlmjj.cn/article/ccsocsc.html


咨詢
建站咨詢

