IT Lab艾鍗學院技術Blog: KNN演算法

2018年2月12日星期一

KNN演算法

監督式學習是透過資料訓練(training)出一個model 但是在KNN其實並沒有做training的動作

最近鄰居法（KNN演算法，又譯K-近鄰演算法）

KNN屬於機器學習中的監督式學習(Supervised learning)

K=3 時, 鄰居有3人, 新加入的綠色應為紅色三角形那一群

尚未分類的資料，我們要怎麼將他分類呢？這邊就是非監督式學習(Unsupervised learning)中的K-Means

K-means主要講的就是「物以類聚」

K-means是一個分群(Clustering)的演算法，不需要有預先標記好的資料(unlabeled data)，屬於非監督式學習(Unsupervised learning)。主要是用來做常常被使用在資料分群，簡單的說就是把一堆資料根據你判斷相近的邏輯，把這一堆資料分成k群。

用比較數學(
嚇人)的說法就是，追求各個群組內部的均方誤差總和最小。