ML:基礎學習
課程:機器學習基石
簡介:第十二講 Nonlinear Transformation
不一定存在,所以實際上是將點對應過去確認輸出,再畫回來
事實上,特徵的轉換 也是一種轉換
若轉換為二次式 , ,請問 的 dimension 為多少?
二次項:
一次項:
常數項:1
總共:
如下,共有這麼多項 需要計算與儲存
所以 Q 變大,會導致計算效率變低與儲存空間變大
有其上限
因 在 無法 shatter
所以 在 必定無法 shatter
所以 Q 變大,會導致 變大,使得複雜度變高
考慮以下這張圖,以下步驟 看似在減少
為了 VC-safely, 需要在偷看資料前就被決定,不然很可能被人為所影響
,請問 為多少?
可以發現轉換導致 dimension 變超大,那麼要考慮是否有足夠資料可使用?
如下圖,所以使用高維度 不見得會比較好
線性 model 優先:
課程:機器學習基石
簡介:第十二講 Nonlinear Transformation
利用轉換空間,從非線性變到線性
事實上,特徵的轉換
若轉換為二次式
二次項:
一次項:
常數項:1
總共:
的代價
所以 Q 變大,會導致計算效率變低與儲存空間變大
重複組合排列概念
有其上限
因
所以
所以 Q 變大,會導致
會變小 卻遠離
如何挑選 Q ?
用眼睛挑選嗎?考慮以下這張圖,以下步驟
-
- 那是不是可以改為
- 或者
- 甚至
為了 VC-safely,
簡單範例
Q = 50,可以發現轉換導致 dimension 變超大,那麼要考慮是否有足夠資料可使用?
相互間的關係
安全做法:不要一開始就套進高維度轉換
- 從
開始試 - 假如
足夠小,那麼就 ok,且又安全 - 不夠小,那麼再慢慢地增加維度,唯一浪費的只有計算量而已
留言
張貼留言