欧美日韩久久久精品无码一区二区 ,免费黄免视频无码,亚洲国产一级片精品

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案

創(chuàng)新互聯(lián)AI教程：AI人工智能分類失衡問題

分類不平衡是屬于一個類別的觀察數(shù)量顯著低于屬于其他類別的觀測數(shù)量的場景。例如，在我們需要識別罕見疾病，銀行欺詐性交易等情況下，這個問題非常突出。

成都創(chuàng)新互聯(lián)是專業(yè)的淮安網(wǎng)站建設(shè)公司，淮安接單;提供成都網(wǎng)站建設(shè)、成都做網(wǎng)站,網(wǎng)頁設(shè)計,網(wǎng)站設(shè)計,建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進(jìn)行淮安網(wǎng)站開發(fā)網(wǎng)頁制作和功能擴(kuò)展;專業(yè)做搜索引擎喜愛的網(wǎng)站,專業(yè)的做網(wǎng)站團(tuán)隊,希望更多企業(yè)前來合作!

不平衡分類的例子 讓我們考慮一個欺詐檢測數(shù)據(jù)集的例子來理解不平衡分類的概念 -

Total observations = 5000
Fraudulent Observations = 50
Non-Fraudulent Observations = 4950
Event Rate = 1%

解決平衡類的行為，解決不平衡的類問題。平衡類的主要目標(biāo)是增加少數(shù)類的頻率或減少多數(shù)類的頻率。以下是解決失衡類問題的方法 -

重采樣 重新采樣是用于重建樣本數(shù)據(jù)集的一系列方法 - 包括訓(xùn)練集和測試集。重新抽樣是為了提高模型的準(zhǔn)確性。以下是一些重新抽樣技術(shù) -

隨機(jī)抽樣 - 這項技術(shù)旨在通過隨機(jī)排除大多數(shù)類別的例子來平衡課堂分布。這樣做直到大多數(shù)和少數(shù)群體的實例得到平衡。

Total observations = 5000
Fraudulent Observations = 50
Non-Fraudulent Observations = 4950
Event Rate = 1%

在這種情況下，我們將 10% 的樣本從非欺詐實例中取而代之，然后將它們與欺詐實例相結(jié)合 - 隨機(jī)抽樣后的非欺詐性觀察:4950 的 10% = 495 將他們與欺詐觀察結(jié)合后的總觀測值: 50 + 495 = 545

因此，現(xiàn)在，低采樣后新數(shù)據(jù)集的事件率為: 9%

這種技術(shù)的主要優(yōu)點是可以減少運行時間并改善存儲。但另一方面，它可以丟棄有用的信息，同時減少訓(xùn)練數(shù)據(jù)樣本的數(shù)量。

隨機(jī)抽樣 - 這種技術(shù)旨在通過復(fù)制少數(shù)類中的實例數(shù)量來平衡類分布。

Total observations = 5000
Fraudulent Observations = 50
Non-Fraudulent Observations = 4950
Event Rate = 1%

如果復(fù)制 50 次欺詐性觀察 30 次，那么在復(fù)制少數(shù)類別觀察值后欺詐觀察值將為 1500。然后，在過采樣后新數(shù)據(jù)中的總觀察值將為:4950 + 1500 = 6450。因此，新數(shù)據(jù)集的事件率是:1500/6450 = 23%。

這種方法的主要優(yōu)點是不會丟失有用的信息。但另一方面，由于它復(fù)制了少數(shù)族群的事件，因此它有更多的過度機(jī)會。

新聞名稱：創(chuàng)新互聯(lián)AI教程：AI人工智能分類失衡問題
轉(zhuǎn)載來源：http://www.dlmjj.cn/article/cdjgsop.html

日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

新聞中心

其他資訊