Study Anything ๐Ÿง

[CV] CNN, ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ, ํŒจ๋”ฉ, ํ’€๋ง ๋ณธ๋ฌธ

์Šคํ„ฐ๋””/ML, DL

[CV] CNN, ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ, ํŒจ๋”ฉ, ํ’€๋ง

์†” 2020. 2. 1. 11:54

CNN ์ด๋ž€?

ํ•ฉ์„ฑ๊ณฑ ์‹ ๊ฒฝ๋ง(Convolutional Neural Network, CNN)์€

์‹œ๊ฐ์  ์ด๋ฏธ์ง€๋ฅผ ๋ถ„์„ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋˜๋Š” ๊นŠ๊ณ  ํ”ผ๋“œ-ํฌ์›Œ๋“œ์ ์ธ ์ธ๊ณต์‹ ๊ฒฝ๋ง์˜ ํ•œ ์ข…๋ฅ˜์ด๋‹ค.

์ด๋ฏธ์ง€ ๋ฐ ๋น„๋””์˜ค ์ธ์‹, ์ถ”์ฒœ ์‹œ์Šคํ…œ, ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜, ์˜๋ฃŒ ์ด๋ฏธ์ง€ ๋ถ„์„ ๋ฐ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ์— ์‘์šฉ๋˜์–ด ์‚ฌ์šฉ๋œ๋‹ค.

CNN์˜ ์ •๊ทœํ™” ๋ฐฉ๋ฒ•์€ ์ผ๋ฐ˜์ ์ธ ๋ฐฉ๋ฒ•๊ณผ ์กฐ๊ธˆ ๋‹ค๋ฅธ๋ฐ, ์ผ๋ฐ˜์ ์ธ ์ •๊ทœํ™” ๋ฐฉ๋ฒ•์€ ์†์‹ค ํ•จ์ˆ˜์— ๊ฐ€์ค‘์น˜ ์ธก์ •์„ ์ถ”๊ฐ€ํ•˜์ง€๋งŒ CNN์€ ๋ฐ์ดํ„ฐ์—์„œ ๊ณ„์ธต์  ํŒจํ„ด์„ ํ™œ์šฉํ•˜๊ณ  ์ž‘๊ณ  ๊ฐ„๋‹จํ•œ ํŒจํ„ด์„ ์‚ฌ์šฉํ•ด ๋ณต์žกํ•œ ํŒจํ„ด์„ ์กฐ๋ฆฝํ•œ๋‹ค.

์ด๋Ÿฐ ํŠน์ง• ๋•Œ๋ฌธ์— ์ผ๋ฐ˜์ ์ธ ๊ฒฝ์šฐ์—๋Š” ์ด๋ฏธ์ง€ ์ธ์‹ ์‹œ์— ์‚ฌ์šฉํ•˜๋Š” ์ด๋ฏธ์ง€์˜ ํ•ด์ƒ๋„๊ฐ€ ๋†’์•„์ง€๋ฉด ์ž…๋ ฅ๊ฐ’๊ณผ ๊ฐ€์ค‘์น˜์˜ ์ˆ˜๊ฐ€ ์ปค์ง€๊ธฐ ๋•Œ๋ฌธ์— ์—ฐ๊ฒฐ์„ฑ๊ณผ ๋ณต์žก์„ฑ์ด ์ฆ๊ฐ€ํ•˜์ง€๋งŒ, CNN์€ ์—ฐ๊ฒฐ์„ฑ๊ณผ ๋ณต์žก์„ฑ์ด ํ›จ์”ฌ ๋‚ฎ๋‹ค.

CNN์˜ ๊ตฌ์กฐ๋Š” ์•„๋ž˜์˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด ํ•ฉ์„ฑ๊ณฑ์ธต(covolutional layer)๊ณผ ํ’€๋ง์ธต(pooling layer)์œผ๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ๋‹ค.

 

 

 

 

ํ•ฉ์„ฑ๊ณฑ์ธต์€ ์ž…๋ ฅ๋ฐ์ดํ„ฐ์˜ ํ˜•์ƒ์„ ์œ ์ง€ํ•œ๋‹ค.

์ด๋ฏธ์ง€๋Š” ๋†’์ดX๋„ˆ๋น„X์ฑ„๋„์˜ 3์ฐจ์›์œผ๋กœ ํ‘œํ˜„๋  ์ˆ˜ ์žˆ๋Š”๋ฐ ์ด๊ฒƒ์„ ํ…์„œ(tensor)๋ผ๊ณ  ํ•œ๋‹ค.

์ฑ„๋„์€ ์ƒ‰์ƒ์ฝ”๋“œ์˜ ์ˆ˜๋ฅผ ์˜๋ฏธํ•œ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์ด๋ฏธ์ง€์˜ ์ƒ‰์ƒ ์ฝ”๋“œ๊ฐ€ RGB๋ผ๋ฉด ์ฑ„๋„์˜ ํฌ๊ธฐ๋Š” 3์ด ๋œ๋‹ค.

CNN์˜ ํ•ฉ์„ฑ๊ณฑ์ธต์—์„œ๋Š” 3์ฐจ์›์˜ ์ด๋ฏธ์ง€ ๊ทธ๋Œ€๋กœ๋ฅผ ์ž…๋ ฅ์ฐฝ์— ๋ฐ›๊ณ , 3์ฐจ์›์˜ ๋ฐ์ดํ„ฐ๋กœ ์ถœ๋ ฅํ•ด์„œ ๋‹ค์Œ ๊ณ„์ธต์œผ๋กœ ์ „๋‹ฌํ•œ๋‹ค.

 

์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ

 

ํ•ฉ์„ฑ๊ณฑ์ธต(Convolutional Layer)์˜ ๋‰ด๋Ÿฐ์€ ์•„๋ž˜ ๊ทธ๋ฆผ์ฒ˜๋Ÿผ ์ž…๋ ฅ ์ด๋ฏธ์ง€์˜ ๋ชจ๋“  ํ”ฝ์…€์— ์—ฐ๊ฒฐ๋˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ

ํ•ฉ์„ฑ๊ณฑ์ธต ๋‰ด๋Ÿฐ์˜ ์ˆ˜์šฉ์˜์—ญ(receptive field)์•ˆ์— ์žˆ๋Š” ํ”ฝ์…€์—๋งŒ ์—ฐ๊ฒฐ๋˜๊ธฐ ๋•Œ๋ฌธ์—, ์•ž์˜ ํ•ฉ์„ฑ๊ณฑ์ธต์—์„œ๋Š” ์ €์ˆ˜์ค€ ํŠน์„ฑ์— ์ง‘์ค‘ํ•˜๊ณ  ๊ทธ ๋‹ค์Œ ํ•ฉ์„ฑ๊ณฑ์ธต์—์„œ๋Š” ๊ณ ์ˆ˜์ค€ ํŠน์„ฑ์œผ๋กœ ์กฐํ•ฉํ•ด ๋‚˜๊ฐ€๋„๋ก ํ•œ๋‹ค.

ํ•˜๋‚˜์˜ ํ•ฉ์„ฑ๊ณฑ ๊ณ„์ธต์—๋Š” ์ž…๋ ฅ๋˜๋Š” ์ด๋ฏธ์ง€์˜ ์ฑ„๋„ ๊ฐœ์ˆ˜๋งŒํผ ํ•„ํ„ฐ๊ฐ€ ์กด์žฌํ•˜๋ฉฐ,

๊ฐ ์ฑ„๋„์— ํ• ๋‹น๋œ ํ•„ํ„ฐ๋ฅผ ์ ์šฉํ•ด ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ(*)์„ ์ˆ˜ํ–‰ํ•˜๊ณ , ๊ทธ ๊ฒฐ๊ณผ๋กœ ํ•ฉ์„ฑ๊ณฑ ๊ณ„์ธต์˜ ์ถœ๋ ฅ ์ด๋ฏธ์ง€๊ฐ€ ์ƒ์„ฑ๋œ๋‹ค.

์˜ˆ๋ฅผ ๋“ค์–ด, ๋†’์ดX๋„ˆ๋น„X์ฑ„๋„์ด 4X4X1์ธ ์ž…๋ ฅ ์ด๋ฏธ์ง€์— ๋Œ€ํ•ด 3X3 ํฌ๊ธฐ์˜ ํ•„ํ„ฐ๋ฅผ ์ ์šฉํ•˜๋Š” ํ•ฉ์„ฑ๊ณฑ ๊ณ„์ธต์—์„œ๋Š”

์•„๋ž˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด ์ด๋ฏธ์ง€์™€ ํ•„ํ„ฐ์— ๋Œ€ํ•œ ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ์„ ํ†ตํ•ด 2X2X1 ํ˜•ํƒœ์˜ ์ด๋ฏธ์ง€๊ฐ€ ์ƒ์„ฑ๋œ๋‹ค.

์ด๋Ÿฐ ์—ฐ์‚ฐ์„ ํ†ตํ•ด ์ด๋ฏธ์ง€์—์„œ ๋ชจ์„œ๋ฆฌ๋ฅผ ๊ฐ์ง€ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ตœ๊ทผ ๋”ฅ๋Ÿฌ๋‹์—์„œ๋Š” ์ž„์˜์˜ ์ˆซ์ž๋กœ ํ•„ํ„ฐ๋ฅผ ๋งŒ๋“  ๋‹ค์Œ ์—ญ์ „ํŒŒ๋ฅผ ํ†ตํ•ด ํ•™์Šต์‹œ์ผœ์„œ ๋ฌธ์ œ์— ์ ํ•ฉํ•œ ํ•„ํ„ฐ๋ฅผ ๋งŒ๋“œ๋Š” ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•œ๋‹ค.

 

ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ

 

ํ•˜์ง€๋งŒ ์ด๊ฒƒ์—๋Š” ๋‘ ๊ฐ€์ง€์˜ ๋‹จ์ ์ด ์žˆ๋Š”๋ฐ, ์ฒซ ๋ฒˆ์งธ๋Š” ํ•ฉ์„ฑ๊ณฑ ์—ฐ์‚ฐ์„ ๊ณ„์† ์ˆ˜ํ–‰ํ•˜๋ฉด ์ด๋ฏธ์ง€๊ฐ€ ๊ณ„์† ์ž‘์•„์ง„๋‹ค๋Š” ๊ฒƒ์ด๊ณ 
๋‘ ๋ฒˆ์งธ๋Š” ๊ฐ€์žฅ์ž๋ฆฌ์˜ ํ”ฝ์…€์€ ํ•œ ๋ฒˆ๋งŒ ์‚ฌ์šฉ๋˜๋ฏ€๋กœ ์ด๋ฏธ์ง€์˜ ์œค๊ณฝ ์ •๋ณด๋ฅผ ๋œ ์‚ฌ์šฉํ•˜๊ฒŒ ๋œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.

์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ ํŒจ๋”ฉ(Padding)์ด ์žˆ๋Š”๋ฐ, ํŒจ๋”ฉ์ด๋ž€ ์ด๋ฏธ์ง€ ์ฃผ์œ„์— ์ถ”๊ฐ€๋กœ ํ•˜๋‚˜์˜ ๊ฒฝ๊ณ„๋ฅผ ๋ง๋Œ€๋Š” ๊ฒƒ์ด๋‹ค. 

ํ•ฉ์„ฑ๊ณฑ ๊ณ„์ธต์˜ ์ถœ๋ ฅ์ด ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์˜ ๊ณต๊ฐ„์  ํฌ๊ธฐ์™€ ๋™์ผํ•˜๊ฒŒ ๋งž์ถฐ์ฃผ๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉํ•œ๋‹ค.

๊ฒฝ๊ณ„๋ฅผ ๋ง๋Œ€๋Š” ๋ฐ์— ์‚ฌ์šฉํ•˜๋Š” ์ˆซ์ž๋กœ๋Š” ๋ณดํ†ต 0์„ ์‚ฌ์šฉํ•œ๋‹ค.

 

ํŒจ๋”ฉ

 

 

 

 

 

ํ•ฉ์„ฑ๊ณฑ ์‹ ๊ฒฝ๋ง์—์„œ๋Š” ํ•ฉ์„ฑ๊ณฑ์ธต ๋ง๊ณ ๋„ ํ’€๋ง์ธต(Pooling Layer)

 

 

 

 

728x90
Comments