DiVoMiner® 使用手冊

  1. Home
  2. Docs
  3. DiVoMiner® 使用手冊
  4. 演算法探勘
  5. K-Means分類

K-Means分類

K-Means是機器學習領域中無監督學習中的一種最常用的聚類演算,將給定的數據分割成多個不同的組,每組的核心點就是該組成員的均值點(通常成為群心),可以被表示成多維向量。

K-Means判斷目標是最小化組成員到群心的平方距離總和。隨著被分析數據集的不斷加大,每次都需要計算全部數據到群心的距離,為了解決計算量及耗時變大的問題,故採用Mini Batch K-Means方法。Mini Batch K-Means是K-Means的變形,不同之處在於Mini Batch K-Means每次只需要從全部數據抽樣疊代,大大縮短計算時間。Mini Batch(分批處理)的思想和方法在梯度下降、神經網絡反向傳播中,也被廣泛用於減少算法的訓練時間。

從數據中隨機抽取小樣本,形成mini batch,並將他們分配到最近的組,然後不斷更新調整群心,當滿足收斂條件(如:疊代次數、精確度)即可終止計算。

Mini Batch K-Means相比K-Means節省了大量計算時間,雖然會犧牲少量聚類品質,在資料量稍大的情況下,精度的差異可以忽略不計。

Was this article helpful to you? Yes No

How can we help?