急求 k Means聚類演算法實現

時間 2021-07-13 09:49:22

1樓:

k-means演算法:

k-means 演算法接受輸入量 k ;然後將n個資料物件劃分為 k個聚類以便使得所獲得的聚類滿足:同一聚類中的物件相似度較高;而不同聚類中的物件相似度較小。聚類相似度是利用各聚類中物件的均值所獲得一個「中心物件」(引力中心)來進行計算的。

k-means 演算法的工作過程說明如下:首先從n個資料物件任意選擇 k 個物件作為初始聚類中心;而對於所剩下其它物件,則根據它們與這些聚類中心的相似度(距離),分別將它們分配給與其最相似的(聚類中心所代表的)聚類;然後再計算每個所獲新聚類的聚類中心(該聚類中所有物件的均值);不斷重複這一過程直到標準測度函式開始收斂為止。一般都採用均方差作為標準測度函式.

k個聚類具有以下特點:各聚類本身儘可能的緊湊,而各聚類之間儘可能的分開。

具體如下:

輸入:k, data[n];

(1) 選擇k個初始中心點,例如c[0]=data[0],…c[k-1]=data[k-1];

(2) 對於data[0]….data[n], 分別與c[0]…c[n-1]比較,假定與c[i]差值最少,就標記為i;

(3) 對於所有標記為i點,重新計算c[i]=/標記為i的個數;

(4) 重複(2)(3),直到所有c[i]值的變化小於給定閾值。

演算法實現起來應該很容易,就不幫你編寫**了。

2樓:自由的菜鳥

什麼是 k-means 聚類演算法?

從網上找到了很多定義,這裡選取比較典型的幾個;

k-mean 分群法是一種分割式分群方法,其主要目標是要在大量高緯的資料點中找出

具有代表性的資料點;這些資料點可以稱為群中心,代表點;然後再根據這些

群中心,進行後續的處理,這些處理可以包含

1 )資料壓縮:以少數的資料點來代表大量的資料,達到資料壓縮的功能;

2 )資料分類:以少數代表點來代表特點類別的資料,可以降低資料量及計算量;

需要程式的話我發給你,太長了

k-means聚類演算法原理是怎麼樣的?

3樓:匿名使用者

k-means 演算法接受引數 k

;然後將事先輸入的n個資料物件劃分為

k個聚類以便使得所獲得的聚類滿足:同一聚類中的物件相似度較高;而不同聚類中的物件相似度較小。聚類相似度是利用各聚類中物件的均值所獲得一個「中心對

象」(引力中心)來進行計算的。

k-means演算法是最為經典的基於劃分的聚類方法,是十大經典資料探勘演算法之一。k-means演算法的基本思想是:以空間中k個點為中心進行聚類,對最靠近他們的物件歸類。

通過迭代的方法,逐次更新各聚類中心的值,直至得到最好的聚類結果。

假設要把樣本集分為c個類別,演算法描述如下:

(1)適當選擇c個類的初始中心;

(2)在第k次迭代中,對任意一個樣本,求其到c箇中心的距離,將該樣本歸到距離最短的中心所在的類;

(3)利用均值等方法更新該類的中心值;

(4)對於所有的c個聚類中心,如果利用(2)(3)的迭代法更新後,值保持不變,則迭代結束,否則繼續迭代。

該演算法的最大優勢在於簡潔和快速。演算法的關鍵在於初始中心的選擇和距離公式。

k-means聚類演算法python實現,匯入的資料集有什麼要求

4樓:匿名使用者

一,k-means聚類演算法原理

k-means 演算法接受引數 k

;然後將事先輸入的n個資料物件劃分為

k個聚類以便使得所獲得的聚類滿足:同一聚類中的物件相似度較高;而不同聚類中的物件相似度較小。聚類相似度是利用各聚類中物件的均值所獲得一個「中心對

象」(引力中心)來進行計算的。

k-means演算法是最為經典的基於劃分的聚類方法,是十大經典資料探勘演算法之一。k-means演算法的基本思想是:以空間中k個點為中心進行聚類,對最靠近他們的物件歸類。

通過迭代的方法,逐次更新各聚類中心的值,直至得到最好的聚類結果。

k-means聚類演算法中 相似中心怎麼計算的

5樓:雙庚的乳酪

每個特徵點都與各個中心點算距離,再比較哪個最近。最簡單就是用歐氏距離。

k means聚類演算法原理是怎麼樣的

k means 演算法接受引數 k 然後將事先輸入的n個資料物件劃分為 k個聚類以便使得所獲得的聚類滿足 同一聚類中的物件相似度較高 而不同聚類中的物件相似度較小。聚類相似度是利用各聚類中物件的均值所獲得一個 中心對 象 引力中心 來進行計算的。k means演算法是最為經典的基於劃分的聚類方法,是...

kmeans演算法用Python怎麼實現

混小子愛 參考 kmeans演算法用python怎麼實現 k means聚類演算法python實現,匯入的資料集有什麼要求 一,k means聚類演算法原理 k means 演算法接受引數 k 然後將事先輸入的n個資料物件劃分為 k個聚類以便使得所獲得的聚類滿足 同一聚類中的物件相似度較高 而不同聚...

24點遊戲的巧妙演算法,高分急求

臣,這萬萬不可示弱,臣以為,應該派出我大軍,給予他們迎頭痛擊,讓他們我大唐上國的天威是不可前幾天還跟朋友說起這個,都覺得那大上海不錯,你進去看看就知道了。 1 1 1 1 算不起1 1 1 2 算不起1 1 1 3 算不起1 1 1 4 算不起1 1 1 5 算不起1 1 1 6 算不起1 1 1 ...