1樓:
我來說說我的思路吧這種擬合問題的目的是求出擬合函式的引數,如多項式函式的係數那麼可以把擬合函式值與y的絕對差值當做目標函式和適應度函式,相對應所求的擬合函式的引數作為遺傳演算法中的基因編碼,每組引數對應一個擬合函式相當於一個染色體個體遺傳演算法採用基本遺傳演算法即可單點交叉,高斯變異初步設想,望請指正
2樓:任耘劇湛芳
核函式一般是為了解決維度過高導致的計算能力不足的缺陷,實質就是特徵向量內積的平方。
為什麼會提出核函式:
一般我們在解決一般的分類或者回歸問題的時候,給出的那個資料可能在低維空間並不線性可分,但是我們選用的模型卻是在特徵空間中構造超平面,從而進行分類,如果在低維空間中直接使用模型,很明顯,效果必然會大打折扣。
但是!如果我們能夠將低緯空間的特徵向量對映到高維空間,那麼這些對映後的特徵線性可分的可能性更大【記住這裡只能說是可能性更大,並不能保證對映過去一定線性可分】,由此我們可以構造對映函式,但問題隨之而來了,維度擴大,那麼隨之而言的計算成本就增加了,模型效果好了,但是可用性降低,那也是不行的。
於是有人提出了核函式的概念,可以在低維空間進行高維度對映過後的計算,使得計算花銷大為降低,由此,使得對映函式成為了可能。舉個簡單的例子吧,假設我們的原始樣本特徵維度為2,將其對映到三維空間,隨便假設我們的對映函式為f(x1,x2)
=(x1^2,
x2^2,
2*x1*x2),那麼在三維空間中,樣本線性可分更大,但是向量內積的計算開銷從4提高到9【如果從10維對映到1000維,那麼計算花銷就提高了10000倍,而實際情況下,特徵維度幾萬上百萬十分常見】,再看對於樣本n1=(a1,a2),n2=(b1,b2),對映到三維空間之後,兩者的內積i1為:a1^2
*b1^2
+a2^2
*b2^2+4
*a1*a2
*b1*b2,此時,又有,n1,n2在二維空間中的內積為:a1b1
+a2b2,平方之後為i2:a1^2
*b1^2
+a2^2
*b2^2+4
*a1*a2
*b1*b2,此時i1和
i2是不是很相似,只要我們將f(x1,x2)調整為:
(x1^2,
x2^2,
根號(2*x1*x2)
),那麼此時就有i1
=i2,也就是說,對映到三維空間裡的內積,可以通過二維空間的內積的平方進行計算!
個人部落格:www.idiotaron.org
裡有關於svm核函式的描述~
實際上核函式還是挺難找的,目前常用的有多項式核,高斯核,還有線性核。
希望能幫到你,也希望有更好的想法,在下面分享下哈。
支援向量機(svm)中的引數c和gamma代表什麼含義呢?
3樓:永丶不悔頭
c是懲罰係數,理解為調節優化方向中兩個指標(間隔大小,分類準確度)偏好的權重,即對誤差的寬容度,c越高,說明越不能容忍出現誤差,容易過擬合,c越小,容易欠擬合,c過大或過小,泛化能力變差。
gamma是選擇rbf函式作為kernel後,該函式自帶的一個引數。隱含地決定了資料對映到新的特徵空間後的分佈,gamma越大,支援向量越少,gamma值越小,支援向量越多。支援向量的個數影響訓練與**的速度。
4樓:匿名使用者
c是懲罰係數
就是說你對誤差的寬容度
這個值越高,說明你越不能容忍出現誤差
gamma是你選擇徑向基函式作為kernel後,該函式自帶的一個引數。隱含地決定了資料對映到新的特徵空間後的分佈。
高斯函式和高斯核函式是不是函式,高斯函式和高斯核函式 是不是一個函式?
不是高斯函式的形式為 其中 a b 與 c 為實數常數 且a 0.c 2 2 的高斯函式是傅立葉變換的特徵函式。這就意味著高斯函式的傅立葉變換不僅僅是另一個高斯函式,而且是進行傅立葉變換的函式的標量倍。高斯函式屬於初等函式,但它沒有初等不定積分。但是仍然可以在整個實數軸上計算它的廣義積分 參見高斯積...
高斯函式和高斯核函式是不是函式,高斯函式和高斯核函式是不是一個函式
迪特格設計 所謂徑向基函式 radial basis function 簡稱 rbf 就是某種沿徑向對稱的標量函式。通常定義為空間中任一點x到某一中心xc之間歐氏距離的單調函式 可記作 k x xc 其作用往往是區域性的 即當x遠離xc時函式取值很小。最常用的徑向基函式是高斯核函式 形式為 k x ...
複合函式極限,複合函式的極限運演算法則
諭優澈鄖樟 設limf x limg x 存在,且令 則有以下運演算法則 如果空心鄰域內有其他點x1,g x1 u0,則g u0,x不一定趨近於x0,可能趨近於x1去了,後面的做法就沒有依據了。 老黃知識共享 我給你仔細地看了一下,又仔細地想了一下,這個限制是為了保證 u u0 0,而不會出現 u ...