ML:基礎學習
課程:機器學習基石
簡介:第四講 Feasibility of Learning
如下圖,假設始終有些資料不在 中
機器學習是不可能從 學到正確的
那麼從機率上來考慮呢?
,並未保證從 選出的
固定 只適用在 驗證 上
簡單多個
假設有 150個人投硬幣,隨機連丟五次,那麼是否有運氣特別好的人?
理想上硬幣機率都是一樣的,所以無所謂特別運氣好的人
因出現連五個硬幣都是正面的機率
所以極可能出現連五個正面的人,但能說他運氣特別好嗎?或者能說他就是硬幣之神嗎?
故若 越多,越容易出現 OK,但 卻不好的情況
下,總共出現 bad 的機率
若有 M 個
課程:機器學習基石
簡介:第四講 Feasibility of Learning
如下圖,假設始終有些資料不在
機器學習是不可能從
那麼從機率上來考慮呢?
Hoeffding's Inequality
- 需為 i.i.d (independent and identically distributed)
:橘色彈珠在瓶子內的機率 : 橘色彈珠在取出樣本中的機率- 收斂跟
無關,只跟 有關
對應到 ML 上
的機率 固定的 的機率- 彈珠
瓶子 - 橘色彈珠
- 綠色彈珠
固定
簡單多個 例子
假設有 150個人投硬幣,隨機連丟五次,那麼是否有運氣特別好的人?理想上硬幣機率都是一樣的,所以無所謂特別運氣好的人
因出現連五個硬幣都是正面的機率
所以極可能出現連五個正面的人,但能說他運氣特別好嗎?或者能說他就是硬幣之神嗎?
故若
Hoeffding 的意義
如下表,Hoeffding 是保證不同Hoeffding | ||||||||
bad | bad |
若有 M 個 呢?
Hoeffding | ||||||||
bad | bad | |||||||
bad | ||||||||
bad | bad | bad | ||||||
bad | bad | |||||||
all | BAD | BAD | BAD | ? |
- 有限的 M, N, and
- 無需知道
是 PAC (probably approximately correct),而不用管
總結
有限, 足夠大,則即使為 挑選出來的 ,仍可保證- 故
留言
張貼留言