๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
CODING/AI & ML & DL

[๊ธฐ๊ณ„ํ•™์Šต] Bias - Variance Decomposition

by ๋ฐํ†จ๋งนํ†จ 2020. 9. 29.
728x90
728x90

 

์ค‘์•™์— ๊ฐ€๊นŒ์šฐ๋ฉด bias๊ฐ€ ์ž‘์€๊ฒƒ์ด๊ณ  ํผ์ ธ์žˆ์ง€ ์˜ˆ์ธก๊ฐ’๋“ค์ด ํผ์ ธ์žˆ์ง€ ์•Š์œผ๋ฉด variance๊ฐ€ ์ž‘์€ ๊ฒƒ ๋งˆ์ง€๋ง‰ ๊ณผ๋…์ด ๊ฐ€์žฅ ์ด์ƒ์ 

๐Ÿ”Ž Bias [ํŽธํ–ฅ]

 

- ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์—์„œ ์ž˜๋ชป๋œ ๊ฐ€์ •์„ ํ–ˆ์„ ๋•Œ ๋ฐœ์ƒํ•˜๋Š” ์˜ค์ฐจ 

- ๋ชจ๋ธ์˜ ์น˜์šฐ์นจ ์ •๋„

- ๋†’์€ bias๋Š” underfitting ๋ฌธ์ œ ๋ฐœ์ƒ

 

๐Ÿ”Ž variance [๋ถ„์‚ฐ]

 

- ์˜ˆ์ธก๊ฐ’์ด ํ‰๊ท ๊ณผ ์–ผ๋งˆ๋‚˜ ์ฐจ์ด๊ฐ€ ๋‚˜๋Š”๊ฐ€ 

๋†’์€ variance๋Š” ํฐ ๋…ธ์ด์ฆˆ๊นŒ์ง€ ๋ชจ๋ธ๋ง์— ํฌํ•จ์‹œํ‚ค๋Š” overfitting ๋ฌธ์ œ ๋ฐœ์ƒ

 

์ผ๋ฐ˜์ ์œผ๋กœ bias โฌ†๏ธ ์ด๋ฉด variance โฌ‡๏ธ ๊ฐ€ ์•„๋‹ˆ๋ฉด  bias โฌ‡๏ธ  ์ผ๋•Œ variance โฌ†๏ธ


๐Ÿ“ข ์ •๊ทœํ™”๋ž€

- variance๋ฅผ ๊ฐ์†Œ์‹œ์ผœ์„œ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ โฌ†๏ธ

- ํšŒ๊ท€๊ณ„์ˆ˜๊ฐ€ ๊ฐ€์งˆ์ˆ˜ ์žˆ๋Š” ๊ฐ’์— ์ œ์•ฝ์กฐ๊ฑด์„ ๋ถ€์—ฌํ•˜์—ฌ ๋ฏธ๋ž˜๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์˜ค์ฐจ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ์„๊ฑฐ๋ผ๊ณ  ํ•˜๋Š” ๊ฒƒ

 

โœ”๏ธ ์™ผ์ชฝ์€ ๋ฏธ๋ž˜์˜ ๋ฐ์ดํ„ฐ๊ฐ€ ์กฐ๊ธˆ๋งŒ ๋ฐ”๋€Œ์–ด๋„ ์˜ˆ์ธก๊ฐ’์ด ๋“ค์ญ‰ ๋‚ ์ญ‰  

โœ”๏ธ์˜ค๋ฅธ์ชฝ์€ ๋ฏธ๋ž˜๋ฐ์ดํ„ฐ ๋ณ€ํ™”์— ์ƒ๋Œ€์ ์œผ๋กœ ์•ˆ์ •์ ์ธ ๊ฒฐ๊ณผ  - ๊ฐ•ํ•œ ์ˆ˜์ค€์˜ ์ •๊ทœํ™” ์ˆ˜ํ–‰ํ•œ ๊ฒƒ


 

๐Ÿ“ข Bias-Variance Decomposition

์ผ๋ฐ˜ํ™”[generalization] ์„ฑ๋Šฅ์„ ๋†’์ด๋Š” ์ •๊ทœํ™”[Regularization], ์•™์ƒ๋ธ”[ensemble] ๊ธฐ๋ฒ•์˜ ์ด๋ก ์  ๋ฐฐ๊ฒฝ

ํ•™์Šต์— ์“ฐ์ง€์•Š์€ ๋ฏธ๋ž˜๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์˜ค์ฐจ์˜ ๊ธฐ๋Œ€๊ฐ’์„ ๋ชจ๋ธ์˜ Bias์™€ Variance๋กœ ๋ถ„ํ•ดํ•˜์ž๋Š” ๋‚ด์šฉ

 

 


๐Ÿ”Ž Bias ๐Ÿ”ป โž• variance ๐Ÿ”บ 

- ํŠœ๋‹์„ ์ž˜ํ•œ๋‹ค๋ฉด ๊ณผ๋…์„ ์ œ๋Œ€๋กœ ๋งž์ถœ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ

EX)  1๏ธโƒฃNN[๋‰ด๋Ÿด ๋„คํŠธ์›Œํฌ] 2๏ธโƒฃ SVM 3๏ธโƒฃ KNN (small K)

 


๐Ÿ”Ž Bias ๐Ÿ”บ โž• variance ๐Ÿ”ป

- ๋ฐ์ดํ„ฐ ๋…ธ์ด์ฆˆ์— ๊ฐ•์ธํ•œ ๋ชจ๋ธ

EX ) 1๏ธโƒฃ ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€ 2๏ธโƒฃ LDA 3๏ธโƒฃ KNN (Large K)

 


โž• 

๋ถ€์ŠคํŒ… [Boosting] - bias ๐Ÿ”ป  โžก๏ธ ์„ฑ๋Šฅ์„ โฌ†๏ธ

๋ผ์˜ํšŒ๊ท€ [Lasso regression] - variance ๐Ÿ”ปโžก๏ธ ์„ฑ๋Šฅ์„ โฌ†๏ธ

728x90

๋Œ“๊ธ€