1樓:匿名使用者
歐氏距離:(∑(xi-yi)2)1/2,即兩項間的差是每個變數值差的平方和再平方根,目的是計算其間的整體距離即不相似性。
我們熟悉的歐氏距離雖然很有用,但也有明顯的缺點。它將樣品的不同屬性(即各指標或各變數)之間的差別等同看待,這一點有時不能滿足實際要求。例如,在教育研究中,經常遇到對人的分析和判別,個體的不同屬性對於區分個體有著不同的重要性。
因此,有時需要採用不同的距離函式。
如果用dij表示第i個樣品和第j個樣品之間的距離,那麼對一切i,j和k,dij應該滿足如下四個條件:
①當且僅當i=j時,dij=0
②dij>0
③dij=dji(對稱性)
④dij≤dik+dkj(三角不等式)
顯然,歐氏距離滿足以上四個條件。滿足以上條件的函式有多種,本節將要用到的馬氏距離也是其中的一種。
第i個樣品與第j個樣品的馬氏距離dij用下式計算:
dij=(xi一xj)'s-1(xi一xj)
其中,xi和xj分別為第i個和第j個樣品的m個指標所組成的向量,s為樣本協方差矩陣。
馬氏距離有很多優點。它不受量綱的影響,兩點之間的馬氏距離與原始資料的測量單位無關;由標準化資料和中心化資料(即原始資料與均值之差)計算出的二點之間的馬氏距離相同。馬氏距離還可以排除變數之間的相關性的干擾。
它的缺點是誇大了變化微小的變數的作用。
採用巴氏距離特徵選擇的迭代演算法,可以獲得最小錯誤率上界。當特徵維數高時,為了減少巴氏距離特徵選擇計算時間,對樣本先進行k-l變換,將特徵降低到中間維數。然後進行巴氏距離特徵選擇,降低到結果的維數。
用基於mnist手寫體數字庫的試驗表明,該文方法比單純用巴氏距離特徵選擇計算時間大大減少,並比主分量方法(即單純使用k-l變換)特徵選擇的錯誤率小得多
2樓:蓑袂
謝謝樓上的朋友,你說的我都在查的過程中看到過,但我還不是太明白
歐氏距離是空間中兩點的直線距離,巴氏和馬氏呢?
簡述歐幾里得距離與馬氏距離的區別和聯絡
3樓:匿名使用者
歐氏距離定義:歐氏距離( euclidean distance)是一個通常採用的距離定義,它是在m維空間中兩個點之間的真實距離,兩個向量之間的歐氏距離計算公式如下:
其中x,y分別是m維的向量.
馬氏距離
我們熟悉的歐氏距離雖然很有用,但也有明顯的缺點.它將樣品的不同屬性(即各指標或各變數)之間的差別等同看待,這一點有時不能滿足實際要求.例如,在教育研究中,經常遇到對人的分析和判別,個體的不同屬性對於區分個體有著不同的重要性.
因此,有時需要採用不同的距離函式.
如果用dij表示第i個樣品和第j個樣品之間的距離,那麼對一切i,j和k,dij應該滿足如下四個條件:
①當且僅當i=j時,dij=0
②dij>0
③dij=dji(對稱性)
④dij≤dik+dkj(三角不等式)
顯然,歐氏距離滿足以上四個條件.滿足以上條件的函式有多種,本節將要用到的馬氏距離也是其中的一種.
第i個樣品與第j個樣品的馬氏距離dij用下式計算:
dij=(xi一xj)'s-1(xi一xj)
其中,xi和xj分別為第i個和第j個樣品的m個指標所組成的向量,s為樣本協方差矩陣.
馬氏距離有很多優點.它不受量綱的影響,兩點之間的馬氏距離與原始資料的測量單位無關;由標準化資料和中心化資料(即原始資料與均值之差)計算出的二點之間的馬氏距離相同.馬氏距離還可以排除變數之間的相關性的干擾.
它的缺點是誇大了變化微小的變數的作用.
請教 巴寶莉和寶格麗是同牌子嗎,請教 巴寶莉 和 寶格麗 是同一個牌子嗎
巴寶莉 burberry 也叫做博柏利,是極具英國傳統風格的奢侈品牌。博柏利 burberry 創辦於1856年,是英國皇室御用品,經營範圍包括成衣 配飾 手袋 鞋履 香水 美妝 家居用品等。寶格麗 bvlgari 成立於1884年 是義大利珠寶品牌 經營範圍包括珠寶 腕錶 配飾 香水 護膚品 酒店...
請教,月的巴哥犬用什麼藥體外驅蟲好
小寵沈醫生 按照準確的驅蟲時間,在狗狗4周齡 8周齡 12周齡都是要各驅蟲一次的,在狗狗滿12周齡後,以後每間隔3個月定期驅蟲一次就行。驅蟲和疫苗都要在狗狗健康的狀態下才能進行!有的狗狗驅蟲後會有應激反應,容易引發腸胃問題,你可以在驅蟲時給狗狗喂幾天腸胃寶,能增強狗狗免疫力,避免應激反應!請問巴哥犬...
籃球中的超遠距離三分球用英語怎麼說 請教高手
一般來說,遠距離三分可以叫big three也可以叫deep three 另外,也可以用shoot from way downtown來表示 如果是在中圈附近可以說shoot from midcourt 英語解說表達有很多種的,不過luckyball這種用法卻是很少聽到 你好。three point...