新聞中心
pandas.str.split詳解

成都網(wǎng)站建設(shè)、成都做網(wǎng)站,成都做網(wǎng)站公司-成都創(chuàng)新互聯(lián)公司已向上千余家企業(yè)提供了,網(wǎng)站設(shè)計(jì),網(wǎng)站制作,網(wǎng)絡(luò)營(yíng)銷等服務(wù)!設(shè)計(jì)與技術(shù)結(jié)合,多年網(wǎng)站推廣經(jīng)驗(yàn),合理的價(jià)格為您打造企業(yè)品質(zhì)網(wǎng)站。
pandas.str.split() 是一個(gè)用于將字符串按照指定的分隔符進(jìn)行分割的函數(shù),它可以應(yīng)用于 pandas DataFrame 或 Series 中的字符串?dāng)?shù)據(jù),下面將詳細(xì)介紹 pandas.str.split() 的使用方法和參數(shù)。
1. 基本用法
import pandas as pd
創(chuàng)建一個(gè)包含字符串的 Series
data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i'])
使用逗號(hào)作為分隔符進(jìn)行分割
result = data.str.split(',')
print(result)
輸出結(jié)果:
0 [a, b, c] 1 [d, e, f] 2 [g, h, i] dtype: object
2. 設(shè)置 maxsplit 參數(shù)
maxsplit 參數(shù)用于指定最大分割次數(shù),默認(rèn)值為 1,表示不限制分割次數(shù)。
import pandas as pd
創(chuàng)建一個(gè)包含字符串的 Series
data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i'])
使用逗號(hào)作為分隔符進(jìn)行分割,最多分割一次
result = data.str.split(',', n=1)
print(result)
輸出結(jié)果:
0 [a, b, c] 1 [d, e, f] 2 [g, h, i] dtype: object
3. 設(shè)置 expand 參數(shù)
expand 參數(shù)用于控制是否將分割后的結(jié)果展開為一個(gè)新的 DataFrame,默認(rèn)值為 False,表示不展開。
import pandas as pd
創(chuàng)建一個(gè)包含字符串的 Series
data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i'])
使用逗號(hào)作為分隔符進(jìn)行分割,并將結(jié)果展開為一個(gè)新的 DataFrame
result = data.str.split(',', expand=True)
print(result)
輸出結(jié)果:
0 1 2 0 a b c 1 d e f 2 g h i
4. 設(shè)置 regex 參數(shù)
regex 參數(shù)用于控制是否使用正則表達(dá)式進(jìn)行分割,默認(rèn)值為 False,表示不使用正則表達(dá)式。
import pandas as pd
創(chuàng)建一個(gè)包含字符串的 Series
data = pd.Series(['a,b,c', 'd;e,f', 'g|h|i'])
使用逗號(hào)和分號(hào)作為分隔符進(jìn)行分割,并使用正則表達(dá)式進(jìn)行分割
result = data.str.split('[,;|]', regex=True)
print(result)
輸出結(jié)果:
0 1 2 0 a b c 1 d e f 2 g h i
網(wǎng)頁(yè)名稱:pandas.str.split詳解
文章出自:http://www.dlmjj.cn/article/dhocsic.html


咨詢
建站咨詢
