๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
CODING/AI & ML & DL

[๊ธฐ๊ณ„ํ•™์Šต] ํŒ๋ณ„ ๋ถ„์„ | Discriminant analysis

by ๋ฐํ†จ๋งนํ†จ 2020. 10. 13.
728x90
728x90

๐Ÿ” ํŒ๋ณ„ ๋ถ„์„์ด๋ž€ ?

- ๋‘ ๊ฐœ ์ด์ƒ์˜ ๋ชจ ์ง‘๋‹จ(= ์ง‘๋‹จ ์ „์ฒด)์—์„œ ์ถ”์ถœ๋œ ํ‘œ๋ณธ(=๊ด€์ฐฐํ•œ ๊ฒฐ๊ณผ, ์ง‘๋‹จ์˜ ์„ฑ์งˆ์„ ์ถ”์ถ•ํ•  ์ˆ˜ ์žˆ๋Š” ํ†ต๊ณ„์ž๋ฃŒ)๋“ค์ด ์ง€๋‹ˆ๊ณ  ์žˆ๋Š” ์ •๋ณด(= ๋ถ„ํฌ)๋ฅผ ์ด์šฉํ•˜์—ฌ ์ด ํ‘œ๋ณธ๋“ค์ด ์–ด๋Š ๋ชจ ์ง‘๋‹จ์—์„œ ์ถ”์ถœ๋œ ๊ฒƒ์ธ์ง€๋ฅผ ๊ฒฐ์ •ํ•ด ์ค„ ์ˆ˜ ์žˆ๋Š” ๊ธฐ์ค€์„ ์ฐพ๋Š” ๋ถ„์„๋ฒ•

ex) ์€ํ–‰์—์„œ ๋ถ€๋™์‚ฐ ๋‹ด๋ณด ๋Œ€์ถœ์„ ํ–‰ํ•˜๊ณ ์ž ํ•  ๊ฒฝ์šฐ ์ฑ„๋ฌด์ž๊ฐ€ ๋Œ€์ถœ๊ธˆ์„ ๊ฐš์„ ๊ฒƒ์ธ๊ฐ€? ๊ทธ๋ ‡์ง€ ์•Š์„ ๊ฒƒ์ธ๊ฐ€? ๋ฅผ ์•Œ๊ณ  ์‹ถ์„ ๋•Œ,
๊ณผ๊ฑฐ์— ๋Œ€์ถœ๊ธˆ์„ ๋ฐ˜ํ™˜ํ•˜์ง€ ์•Š์€ ์‚ฌ๋žŒ์˜ ์ •๋ณด ์œ ํ˜•(์—ฐ๋ น, ์†Œ๋“, ์ง์—…, ๊ฒฐํ˜ผ ์œ ๋ฌด)์„ ์ฐธ๊ณ ํ•˜์—ฌ ์‹ ์ฒญ์ž์˜ ์ •๋ณด ์œ ํ˜•์„ ๊ณผ๊ฑฐ์˜ ์œ ํ˜•๊ณผ ๋น„๊ตํ•˜์—ฌ ํŒŒ์•…ํ•˜๋Š” ๊ฒƒ 

๐Ÿ“Œ ๊ณผ๊ฑฐ์— ๋Œ€์ถœ๊ธˆ์„ ๋ฐ˜ํ™˜ํ•˜์ง€ ์•Š์€ ์‚ฌ๋žŒ - ํ‘œ๋ณธ
๐Ÿ“Œ ๊ณผ๊ฑฐ์— ๋Œ€์ถœ๊ธˆ์„ ๋ฐ˜ํ™˜ํ•˜์ง€ ์•Š์€ ์‚ฌ๋žŒ์˜ ์ •๋ณด ์œ ํ˜• - ํŒ๋ณ„ ๋ณ€์ˆ˜
๐Ÿ“Œ ๋Œ€์ถœ์„ ์Šน์ธ๋ฐ›์€ ๊ทธ๋ฃน A, ๋Œ€์ถœ์„ ์Šน์ธ๋ฐ›์ง€ ๋ชปํ•œ ๊ทธ๋ฃน B - ๋ชจ ์ง‘๋‹จ

 

ํŒ๋ณ„ ๋ถ„์„์˜ ๊ธฐ์ดˆ ๊ฐœ๋… 

๐Ÿ“Œ ํŒ๋ณ„ ๋ณ€์ˆ˜ ( Discriminant variable)

     - ์–ด๋–ค ์ง‘๋‹จ์— ์†ํ•˜๋Š”์ง€ ํŒ๋ณ„ํ•˜๊ธฐ ์œ„ํ•œ ๋ณ€์ˆ˜ ๋…๋ฆฝ ๋ณ€์ˆ˜ ์ค‘ ํŒ๋ณ„๋ ฅ์ด ๋†’์€ ๋ณ€์ˆ˜๋ฅผ ๋œปํ•˜๊ณ ,

     ๋ณ€์ˆ˜๋ฅผ ๊ณ ๋ฅผ ๋•Œ ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ์ ์€ ๋…๋ฆฝ ๋ณ€์ˆ˜๋ฅผ ์„ ํƒํ•ด์•ผ ํšจ๊ณผ์ ์ธ ํŒ๋ณ„ ํ•จ์ˆ˜๋ฅผ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋‹ค.


โ€ผ๏ธ ์œ„์˜ ์˜ˆ์‹œ์—์„œ ์ฐพ๊ธฐ 

์—ฐ๋ น, ์†Œ๋“, ์ง์—…, ๊ฒฐํ˜ผ ์œ ๋ฎค = ๋…๋ฆฝ๋ณ€์ˆ˜ 

์ด ์ค‘์—์„œ ์†Œ๋“๐Ÿ’ต๊ณผ ์ง์—…๐Ÿ’ผ์€ ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ๋งŽ์€ ๋…๋ฆฝ๋ณ€์ˆ˜์ง€๋งŒ 

๊ฒฐํ˜ผ์œ ๋ฌด๐Ÿ‘ซ์™€ ์†Œ๋“๐Ÿ’ต์€ ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ์ ์€ ๋…๋ฆฝ๋ณ€์ˆ˜

 

โžก๏ธ ํŒ๋ณ„ํ•จ์ˆ˜๋ฅผ ๋งŒ๋“ ๋‹ค๋ฉด ์†Œ๋“๐Ÿ’ต๊ณผ ์ง์—…๐Ÿ’ผ์ค‘ ํ•˜๋‚˜๋ฅผ ํŒ๋ณ„๋ณ€์ˆ˜๋กœ ์„ ํƒํ•˜๊ณ  ๊ฒฐํ˜ผ์œ ๋ฌด๐Ÿ‘ซ๋ฅผ ๋˜ ๋‹ค๋ฅธ ํŒ๋ณ„๋ณ€์ˆ˜๋กœ ์„ ํƒํ•˜๋ฉด ํšจ๊ณผ์ ์ธ ํŒ๋ณ„ํ•จ์ˆ˜๋ฅผ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋‹ค.


๐Ÿ“Œ ํŒ๋ณ„ ํ•จ์ˆ˜( Discriminant function)

- ํŒ๋ณ„ ๋ถ„์„์ด ์ด์šฉ๋˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๊ฐ ๊ฐœ์ฒด๋Š” ์—ฌ๋Ÿฌ ์ง‘๋‹จ ์ค‘์—์„œ ์–ด๋Š ์ง‘๋‹จ์— ์†ํ•ด ์žˆ๋Š”์ง€ ์•Œ๋ ค์ ธ ์žˆ์–ด์•ผ ํ•˜๋ฉฐ = Y๊ฐ’ ( ์œ„์˜ ์˜ˆ์‹œ : ๋Œ€์ถœ ๊ฐ€๋Šฅ ์œ ๋ฌด ) ์ด ์žˆ์–ด์•ผํ•œ๋‹ค. ( ์ง€๋„ํ•™์Šต | supervised learning ) 

- ์†Œ์† ์ง‘๋‹จ์ด ์ด๋ฏธ ์•Œ๋ ค์ง„ ๊ฒฝ์šฐ์— ๋Œ€ํ•ด ๋ณ€์ˆ˜๋“ค ( X ) ์„ ์ธก์ •ํ•˜๊ณ  ์ด๋“ค ๋ณ€์ˆ˜๋“ค์„ ์ด์šฉํ•˜์—ฌ ๊ฐ ์ง‘๋‹จ์„ ๊ฐ€์žฅ ์ž˜ ๊ตฌ๋ถ„ํ•ด ๋‚ผ ์ˆ˜ ์žˆ๋Š” ํŒ๋ณ„์‹์„ ๋งŒ๋“ค์–ด ๋ถ„๋ณ„ํ•˜๋Š” ๊ณผ์ •

 

โžก๏ธ ํŒ๋ณ„ ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•˜์—ฌ ๊ฐ ๊ฐœ์ฒด๋“ค์ด ์†Œ์† ์ง‘๋‹จ์— ์–ผ๋งˆ๋‚˜ ์ž˜ ํŒ๋ณ„๋˜๋Š”๊ฐ€์— ๋Œ€ํ•œ ํŒ๋ณ„๋ ฅ์„ ์ธก์ •ํ•˜๊ณ  ์ƒˆ๋กœ์šด ๋Œ€์ƒ์„ ์–ด๋Š ์ง‘๋‹จ์œผ๋กœ ๋ถ„๋ฅ˜ํ•  ๊ฒƒ์ด๋ƒ๋ฅผ ์˜ˆ์ธกํ•˜๋Š”๊ฒŒ ์ฃผ ๋ชฉ์  --> ํŒ๋ณ„๋ ฅ์ด ๋†’์€ ํ•จ์ˆ˜๋ฅผ ์ฐพ๋Š” ๊ฒƒ 

 

๐Ÿ“Œ ํŒ๋ณ„ ์ ์ˆ˜( Discriminant score)

- ์–ด๋–ค ๋Œ€์ƒ์ด ์–ด๋–ค ์ง‘๋‹จ์— ์†ํ•˜๋Š” ์ง€ ํŒ๋ณ„ํ•˜๊ธฐ ์œ„ํ•ด ๊ทธ ๋Œ€์ƒ์˜ ํŒ๋ณ„ ๋ณ€์ˆ˜๋“ค์˜ ๊ฐ’์„ ํŒ๋ณ„ ํ•จ์ˆ˜์— ๋Œ€์ž…ํ•˜์—ฌ ๊ตฌํ•œ ๊ฐ’

 

๐Ÿ“Œ ํ‘œ๋ณธ์˜ ํฌ๊ธฐ

โ€ผ๏ธ ์ด ์กฐ๊ฑด์— ํ•ด๋‹น๋˜์ง€ ์•Š์œผ๋ฉด ํŒ๋ณ„ ๋ถ„์„์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„์„ํ•  ์ˆ˜ ์—†์Œ 

1. ์ „์ฒด ํ‘œ๋ณธ์˜ ํฌ๊ธฐ( N )๋Š” ํ†ต์ƒ์ ์œผ๋กœ ๋…๋ฆฝ๋ณ€์ˆ˜์˜ ๊ฐœ์ˆ˜( D )๋ณด๋‹ค 3๋ฐฐ ( ์ตœ์†Œ 2๋ฐฐ ) ์ด์ƒ ๋˜์–ด์•ผํ•จ  

 

ํ•™์Šต๋ฐ์ดํ„ฐ์˜ ์ˆ˜ ( = ์ „์ฒด ํ‘œ๋ณธ์˜ ํฌ๊ธฐ N ) > 3 * ๋…๋ฆฝ๋ณ€์ˆ˜ ( ๊ฒฐํ˜ผ ์œ ๋ฌด, ์ง์—…, ์†Œ๋“ ) 

 

2. ์ข…์† ๋ณ€์ˆ˜์˜ ์ง‘๋‹จ ๊ฐ๊ฐ ํ‘œ๋ณธ์˜ ํฌ๊ธฐ ์ค‘ ์ตœ์†Œํฌ๊ธฐ๊ฐ€ ๋…๋ฆฝ ๋ณ€์ˆ˜์˜ ๊ฐœ์ˆ˜( D )๋ณด๋‹ค ์ปค์•ผํ•จ 

 

๐Ÿ”ด A ํด๋ž˜์Šค - 15 /  ๐ŸŸก B ํด๋ž˜์Šค - 20  / ๐Ÿ”ต C ํด๋ž˜์Šค - 3 ์ค‘

์ตœ์†Œ ํฌ๊ธฐ์ธ ๐Ÿ”ต C ํด๋ž˜์Šค ํ‘œ๋ณธ์˜ ์ˆ˜ (3) ์ด ๋…๋ฆฝ ๋ณ€์ˆ˜์˜ ๊ฐœ์ˆ˜( D ) ๋ณด๋‹ค ์ปค์•ผํ•จ

 

๐Ÿท ํŒ๋ณ„ ๋ถ„์„์˜ ๋‹จ๊ณ„ ๐Ÿท

 

1. ๋…๋ฆฝ ๋ณ€์ˆ˜ ์ฐพ๊ธฐ 

๐Ÿ”ป

2. ํŒ๋ณ„ ํ•จ์ˆ˜( ์„ ํ˜•ํ•จ์ˆ˜ / ๋น„์„ ํ˜•ํ•จ์ˆ˜ ) ๋„์ถœํ•˜๊ธฐ

๐Ÿ”ป

3. ๋ถ„๋ฅ˜์˜ ์ •ํ™•๋„ ๋ถ„์„ํ•˜๊ธฐ

๐Ÿ”ป

4. ์ƒˆ๋กœ์šด ์ผ€์ด์Šค๊ฐ€ ์†ํ•˜๋Š” ํด๋ž˜์Šค ์˜ˆ์ธกํ•˜๊ธฐ

 

ํŒ๋ณ„ ๋ถ„์„์—๋Š” ์„ ํ˜• ํŒ๋ณ„ ๋ถ„์„ ( LDA ) ์™€ ๋น„์„ ํ˜• ํŒ๋ณ„ ๋ถ„์„ ( QDA ) ์ด ์žˆ๋Š”๋ฐ, ์ด๊ฑด ๋‹ค์Œ ๊ธ€๋กœ ๐Ÿ’ก

728x90

๋Œ“๊ธ€