日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時(shí)間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷解決方案
創(chuàng)新互聯(lián)Python教程:python中如何實(shí)現(xiàn)信息增益和信息增益率

一、信息增益與信息增益率

讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來自于我們對(duì)這個(gè)行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡(jiǎn)單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價(jià)值的長(zhǎng)期合作伙伴,公司提供的服務(wù)項(xiàng)目有:域名申請(qǐng)虛擬主機(jī)、營(yíng)銷軟件、網(wǎng)站建設(shè)、烏蘭網(wǎng)站維護(hù)、網(wǎng)站推廣。

1、信息增益

以某特征劃分?jǐn)?shù)據(jù)集前后的熵的差值。熵可以表示樣本集合的不確定性,熵越大,樣本的不確定性就越大。因此可以使用劃分前后集合熵的差值來衡量使用當(dāng)前特征對(duì)于樣本集合D劃分效果的好壞。

信息增益 = entroy(前) - entroy(后)

注意:信息增益表示得知特征X的信息而使得類Y的信息熵減少的程度

2、信息增益率

增益率是用前面的信息增益Gain(D, a)和屬性a對(duì)應(yīng)的"固有值"(intrinsic value) [Quinlan , 1993J的比值來共同定義的。

二、信息增益與信息增益率python代碼實(shí)現(xiàn)

1、信息增益定義計(jì)算信息增益的函數(shù):計(jì)算g(D|A)

	def g(data, str1, str2):
	    e1 = data.groupby(str1).apply(lambda x: infor(x[str2]))
	    p1 = pd.value_counts(data[str1]) / len(data[str1])
	    # 計(jì)算Infor(D|A)
	    e2 = sum(e1 * p1)
    return infor(data[str2]) - e2
	print("學(xué)歷信息增益:{}".format(g(data, "學(xué)歷", "類別")))
	# 輸出結(jié)果為:學(xué)歷信息增益:0.08300749985576883

2、信息增益率定義計(jì)算信息增益率的函數(shù):計(jì)算gr(D,A)

	def gr(data, str1, str2):
	    return g(data, str1, str2) / infor(data[str1])


	print("學(xué)歷信息增益率:", gr(data, "學(xué)歷", "類別"))
	# 輸出結(jié)果為:學(xué)歷信息增益率: 0.05237190142858302

網(wǎng)站標(biāo)題:創(chuàng)新互聯(lián)Python教程:python中如何實(shí)現(xiàn)信息增益和信息增益率
網(wǎng)頁URL:http://www.dlmjj.cn/article/ccehgds.html