新聞中心
一、信息增益與信息增益率

讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來自于我們對(duì)這個(gè)行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡(jiǎn)單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價(jià)值的長(zhǎng)期合作伙伴,公司提供的服務(wù)項(xiàng)目有:域名申請(qǐng)、虛擬主機(jī)、營(yíng)銷軟件、網(wǎng)站建設(shè)、烏蘭網(wǎng)站維護(hù)、網(wǎng)站推廣。
1、信息增益
以某特征劃分?jǐn)?shù)據(jù)集前后的熵的差值。熵可以表示樣本集合的不確定性,熵越大,樣本的不確定性就越大。因此可以使用劃分前后集合熵的差值來衡量使用當(dāng)前特征對(duì)于樣本集合D劃分效果的好壞。
信息增益 = entroy(前) - entroy(后)
注意:信息增益表示得知特征X的信息而使得類Y的信息熵減少的程度
2、信息增益率
增益率是用前面的信息增益Gain(D, a)和屬性a對(duì)應(yīng)的"固有值"(intrinsic value) [Quinlan , 1993J的比值來共同定義的。
二、信息增益與信息增益率python代碼實(shí)現(xiàn)
1、信息增益定義計(jì)算信息增益的函數(shù):計(jì)算g(D|A)
def g(data, str1, str2):
e1 = data.groupby(str1).apply(lambda x: infor(x[str2]))
p1 = pd.value_counts(data[str1]) / len(data[str1])
# 計(jì)算Infor(D|A)
e2 = sum(e1 * p1)
return infor(data[str2]) - e2
print("學(xué)歷信息增益:{}".format(g(data, "學(xué)歷", "類別")))
# 輸出結(jié)果為:學(xué)歷信息增益:0.083007499855768832、信息增益率定義計(jì)算信息增益率的函數(shù):計(jì)算gr(D,A)
def gr(data, str1, str2):
return g(data, str1, str2) / infor(data[str1])
print("學(xué)歷信息增益率:", gr(data, "學(xué)歷", "類別"))
# 輸出結(jié)果為:學(xué)歷信息增益率: 0.05237190142858302 網(wǎng)站標(biāo)題:創(chuàng)新互聯(lián)Python教程:python中如何實(shí)現(xiàn)信息增益和信息增益率
網(wǎng)頁URL:http://www.dlmjj.cn/article/ccehgds.html


咨詢
建站咨詢
