(高职)1.2 k邻近算法-2ppt课件.pptx
1.2 k邻近算法-2人工智能KNN算法(二)目录数据的归一化处理利用程序完成算法训练模型与测试应用车型长(mm)宽(mm)高(mm)油耗(L/100km)售价(万元)BAOJ310 4032168014505.35.6XW-M1 4330153518857.814.5POL 4053174014496.210.8BW5 5087186815008.525.6BDe6 4560182216457.815.8Wuling 3797151018205.59.6型号长(mm)宽(mm)高(mm)CrV405317401449BW5508718681500POL403216801450BDe6433015351885VS.可以想像此类不同数量级的数据将给预测带来较大误差数据的归一化处理车型长(mm)宽(mm)高(mm)油耗(L/100km)售价(万元)BAOJ310 4032168014505.35.6XW-M1 4330153518857.814.5POL 4053174014496.210.8BW5 5087186815008.525.6BDe6 4560182216457.815.8Wuling 3797151018205.59.6数据归一化由多种方法,其中最直观的方法是,对每个属性都找出最大数值和最小数值,然后对某一属性数据集中的每个数据都按下面公式整理。 数据的归一化处理本页是Excel 操作录象数据的归一化处理数据的归一化处理品牌型号长(mm) 宽(mm) 高(mm)用户行为BAOJ310 403216801450略过XW-M1 433015351885浏览POL 405317401449略过BW5 508718681500浏览BDe6 456018221645浏览Wuling 379715101820略过数据的多维度扩展归一化后多维数据的KNN本页是Excel 操作录象 1 #引入工具包2 import numpy as np3 from sklearn.neighbors import KNeighborsClassifier as knn4 #定义数据5 ar_x=4032,1680,1450,5.3,5.6,6 4330,1535,1885,7.8,14.5,7 4053,1740,1449,6.2,10.8,8 5087,1868,1500,8.5,25.6,9 4560,1822,1645,7.8,15.8,10 3797,1510,1820,5.5,9.611 ar_y=0,1,0,1KNN算法的程序实现16 #建立模型并预测17 model = knn(n_neighbors=3)18 model.fit(nor_ar:4, ar_y)19 pre=model.predict(nor_ar4:6)20 print (pre) 12 #利用归一化处理数据13 ar_min=np.min(ar_x,0)14 ar_mn=np.max(ar_x,0)-ar_min15 nor_ar =np.around(ar_x-ar_min)/ar_mn,4)KNN算法的程序实现原始数据训练集 测试集模型 合格?模型:f()训练模型与测试应用“测试集”“训练集”训练模型与测试应用本小节结束!