新聞中心
MySQL聚合函數(shù)
很多時(shí)候,我們查詢數(shù)據(jù)的時(shí)候都不會(huì)把明細(xì)數(shù)據(jù)查詢出來(lái),那樣一般意義也不大。更多的時(shí)候是根據(jù)業(yè)務(wù)需求,把數(shù)據(jù)聚合成業(yè)務(wù)能直接使用的數(shù)據(jù)。MYSQL中有5個(gè)聚合函數(shù),如下面5個(gè),用的最多的還是count和sum,下面分別介紹一下用法。

專注于為中小企業(yè)提供成都網(wǎng)站設(shè)計(jì)、成都網(wǎng)站建設(shè)服務(wù),電腦端+手機(jī)端+微信端的三站合一,更高效的管理,為中小企業(yè)北戴河免費(fèi)做網(wǎng)站提供優(yōu)質(zhì)的服務(wù)。我們立足成都,凝聚了一批互聯(lián)網(wǎng)行業(yè)人才,有力地推動(dòng)了上千多家企業(yè)的穩(wěn)健成長(zhǎng),幫助中小企業(yè)通過(guò)網(wǎng)站建設(shè)實(shí)現(xiàn)規(guī)模擴(kuò)充和轉(zhuǎn)變。
【COUNT】
在MySQL中,COUNT()函數(shù)統(tǒng)計(jì)數(shù)據(jù)表中包含的記錄行的總數(shù),或者根據(jù)查詢結(jié)果返回列中包含的數(shù)據(jù)行數(shù),使用方法有以下兩種:
求order表中,查詢一共有多少條訂單數(shù),SQL語(yǔ)句如下↓
【SUM】
在MySQL中,SUM()是一個(gè)求總和的函數(shù),返回指定列值的總和。
求order表中所有產(chǎn)品銷售數(shù)量,SQL語(yǔ)句如下↓
【AVG】
在MySQL中,AVG()函數(shù)通過(guò)計(jì)算返回的行數(shù)和每一行數(shù)據(jù)的和,求得指定列數(shù)據(jù)的平均值。
求order表中,2021年所有產(chǎn)品的平均單價(jià),SQL語(yǔ)句如下↓
【MAX/MIN】
在MySQL中,MAX()函數(shù)是用來(lái)返回指定列中的最大值。
求order表中,查詢最大的單價(jià)價(jià)格,SQL預(yù)計(jì)如下↓
在MySQL中,MIN()函數(shù)是用來(lái)返回指定列中的最小值。
求order表中,查詢最小的單價(jià)價(jià)格,SQL預(yù)計(jì)如下↓
【結(jié)合GROUP BY】
正常情況下,聚合函數(shù)都是搭配著GROUP BY來(lái)使用的。可以是按省份聚合、產(chǎn)品聚合、時(shí)間聚合等等。下面演示每個(gè)品牌最低單價(jià)的聚合,其他幾個(gè)聚合函數(shù)使用方式一樣,SQL語(yǔ)句如下↓
還可以用ORDER BY排個(gè)序,求每個(gè)品牌累計(jì)銷售價(jià)格的SQL語(yǔ)句,從高到低排序↓
End
◆ PowerBI開場(chǎng)白
◆ Python高德地圖可視化
◆ Python不規(guī)則條形圖
Python分組
前言分組原理
核心:
1.不論分組鍵是數(shù)組、列表、字典、Series、函數(shù),只要其與待分組變量的軸長(zhǎng)度一致都可以傳入groupby進(jìn)行分組。
2.默認(rèn)axis=0按行分組,可指定axis=1對(duì)列分組。
對(duì)數(shù)據(jù)進(jìn)行分組操作的過(guò)程可以概括為:split-apply-combine三步:
1.按照鍵值(key)或者分組變量將數(shù)據(jù)分組。
2.對(duì)于每組應(yīng)用我們的函數(shù),這一步非常靈活,可以是python自帶函數(shù),可以是我們自己編寫的函數(shù)。
3.將函數(shù)計(jì)算后的結(jié)果聚合。
1 分組模式及其對(duì)象
1.1 分組的一般模式
三個(gè)要素:分組依據(jù)、數(shù)據(jù)來(lái)源、操作及其返回結(jié)果
df.groupby(分組依據(jù))[數(shù)據(jù)來(lái)源].使用操作
1.2 分組依據(jù)的本質(zhì)
1.3Groupby 對(duì)象
通過(guò) ngroups 屬性,可以訪問(wèn)分為了多少組:
通過(guò) groups 屬性,可以返回從 組名映射到 組索引列表的字典:
當(dāng) size 作為 DataFrame 的屬性時(shí),返回的是表長(zhǎng)乘以表寬的大小,但在 groupby 對(duì)象上表示統(tǒng)計(jì)每個(gè)組的 元素個(gè)數(shù):
通過(guò) get_group 方法可以直接獲取所在組對(duì)應(yīng)的行,此時(shí)必須知道組的具體名字:
1.4 分組的三大操作
分組的三大操作:聚合、變換和過(guò)濾
2.聚合函數(shù)
2.1內(nèi)置聚合函數(shù)
包括如下函數(shù): max/min/mean/median/count/all/any/idxmax/idxmin/mad/nunique/skew/quantile/sum/std/var/sem/size/prod
2.2agg 方法
【a】使用多個(gè)函數(shù)
當(dāng)使用多個(gè)聚合函數(shù)時(shí),需要用列表的形式把內(nèi)置聚合函數(shù)的對(duì)應(yīng)的字符串傳入,先前提到的所有字符串都是合法的。
【b】對(duì)特定的列使用特定的聚合函數(shù)
對(duì)于方法和列的特殊對(duì)應(yīng),可以通過(guò)構(gòu)造字典傳入 agg 中實(shí)現(xiàn),其中字典以列名為鍵,以聚合字符串或字符串列表為值。
【c】使用自定義函數(shù)
在 agg 中可以使用具體的自定義函數(shù),需要注意傳入函數(shù)的參數(shù)是之前數(shù)據(jù)源中的列,逐列進(jìn)行計(jì)算
【d】聚合結(jié)果重命名 如果想要對(duì)結(jié)果進(jìn)行重命名,只需要將上述函數(shù)的位置改寫成元組,元組的第一個(gè)元素為新的名字,第二個(gè)位置為原來(lái)的函數(shù),包括聚合字符串和自定義函數(shù)
3 變換和過(guò)濾
3.1 變換函數(shù)與 transform 方法
變 換 函 數(shù) 的 返 回 值 為 同 長(zhǎng) 度 的 序 列, 最 常 用 的 內(nèi) 置 變 換 函 數(shù) 是 累 計(jì) 函 數(shù):cum- count/cumsum/cumprod/cummax/cummin ,它們的使用方式和聚合函數(shù)類似,只不過(guò)完成的是組內(nèi) 累計(jì)操作。
3.2 組索引與過(guò)濾
過(guò)濾在分組中是對(duì)于組的過(guò)濾,而索引是對(duì)于行的過(guò)濾
組過(guò)濾作為行過(guò)濾的推廣,指的是如果對(duì)一個(gè)組的全體所在行進(jìn)行統(tǒng)計(jì)的結(jié)果返回 True 則會(huì)被保留,F(xiàn)alse 則該組會(huì)被過(guò)濾,最后把所有未被過(guò)濾的組其對(duì)應(yīng)的所在行拼接起來(lái)作為 DataFrame 返回。
在 groupby 對(duì)象中,定義了 filter 方法進(jìn)行組的篩選,其中自定義函數(shù)的輸入?yún)?shù)為數(shù)據(jù)源構(gòu)成的 DataFrame 本身,在之前例子中定義的 groupby 對(duì)象中,傳入的就是 df[['Height', 'Weight']] ,因此所有表方法和屬性 都可以在自定義函數(shù)中相應(yīng)地使用,同時(shí)只需保證自定義函數(shù)的返回為布爾值即可。
4 跨列分組
4.1 apply 的引入
4.2 apply 的使用
在設(shè)計(jì)上,apply 的自定義函數(shù)傳入?yún)?shù)與 filter 完全一致,只不過(guò)后者只允許返回布爾值
【a】標(biāo)量情況:結(jié)果得到的是 Series ,索引與 agg 的結(jié)果一致
【b】Series 情況:得到的是 DataFrame ,行索引與標(biāo)量情況一致,列索引為 Series 的索引
【c】DataFrame 情況:得到的是 DataFrame ,行索引最內(nèi)層在每個(gè)組原先 agg 的結(jié)果索引上,再加一層返 回的 DataFrame 行索引,同時(shí)分組結(jié)果 DataFrame 的列索引和返回的 DataFrame 列索引一致
Python聚合函數(shù)使用
#encoding=utf-8
def?getRows():
names?=?["A",?"B"]
rows?=?[
[1,?'m'],
[2,?'m'],
[3,?'q'],
[3,?'q'],
[2,?'q'],
[1,?'s'],
[4,?'s'],
[2,?'s'],
[1,?'s'],
[3,?'m']
]
rs?=?[]
for?row?in?rows:
rs.append(dict(zip(names,?row)))
return?rs
def?count():
rs?=?getRows()
#?取所有B=m的行
rs?=?[r?for?r?in?rs?if?r["B"]?==?'m']
rs?=?sorted(rs,?key=lambda?r:?r["B"])
#?計(jì)算數(shù)量
result?=?{}
for?r?in?rs:
if?r["A"]?in?result:
result[r["A"]]?+=?1
else:
result[r["A"]]?=?1
return?result
print?count()
python函數(shù)組求各個(gè)極值的問(wèn)題
你把遍歷的結(jié)果放到一個(gè)列表里面,便利結(jié)束后求列表里的最大值就行了
ls=[]
for?i?in?range(xxx):
ls.append(func)
max_value?=?max(ls)
python實(shí)現(xiàn)聚合函數(shù)功能
#encoding=utf-8
def?getRows():
names?=?["A",?"B"]
rows?=?[
[1,?'m'],
[2,?'m'],
[3,?'q'],
[3,?'q'],
[2,?'q'],
[1,?'s'],
[4,?'s'],
[2,?'s'],
[1,?'s'],
[3,?'m']
]
rs?=?[]
for?row?in?rows:
rs.append(dict(zip(names,?row)))
return?rs
def?count():
rs?=?getRows()
#?取所有B=m的行
rs?=?[r?for?r?in?rs?if?r["B"]?==?'m']
rs?=?sorted(rs,?key=lambda?r:?r["B"])
#?計(jì)算數(shù)量
result?=?{}
for?r?in?rs:
if?r["A"]?in?result:
result[r["A"]]?+=?1
else:
result[r["A"]]?=?1
return?result
print?count()
當(dāng)前名稱:python聚合函數(shù),Python聚合
當(dāng)前鏈接:http://www.dlmjj.cn/article/hcoogs.html


咨詢
建站咨詢
