新聞中心
這里有您想知道的互聯網營銷解決方案
創(chuàng)新互聯Python教程:python數據離散化是什么
概念

站在用戶的角度思考問題,與客戶深入溝通,找到元氏網站設計與元氏網站推廣的解決方案,憑借多年的經驗,讓設計與互聯網技術結合,創(chuàng)造個性化、用戶體驗好的作品,建站類型包括:成都網站制作、做網站、外貿營銷網站建設、企業(yè)官網、英文網站、手機端網站、網站推廣、域名注冊、網絡空間、企業(yè)郵箱。業(yè)務覆蓋元氏地區(qū)。
1、連續(xù)屬性的離散化就是將連續(xù)屬性的值域上,將值域劃分為若干個離散的區(qū)間,最后用不同的符號或整數 值代表落在每個子區(qū)間的屬性值。
2、實現、分組,將分組好的結果轉換成one-hot編碼(啞變量)
實例
# 1)準備數據 data = pd.Series([165,174,160,180,159,163,192,184], index=['No1:165', 'No2:174','No3:160', 'No4:180', 'No5:159', 'No6:163', 'No7:192', 'No8:184']) # 2)分組 # 自動分組 sr = pd.qcut(data, 3) sr.value_counts() # 看每一組有幾個數據 # 3)轉換成one-hot編碼 pd.get_dummies(sr, prefix="height") # 自定義分組 bins = [150, 165, 180, 195] sr = pd.cut(data, bins) # get_dummies pd.get_dummies(sr, prefix="身高")
以上就是python數據離散化的介紹,希望對大家有所幫助。更多Python學習指路:創(chuàng)新互聯Python教程
本文教程操作環(huán)境:windows7系統(tǒng)、Python 3.9.1,DELL G3電腦。
分享標題:創(chuàng)新互聯Python教程:python數據離散化是什么
分享網址:http://www.dlmjj.cn/article/coocseg.html


咨詢
建站咨詢
