๋ชฉ๋ก์Šคํ„ฐ๋”” (23)

Study Anything ๐Ÿง

[NetworkX] ๊ทธ๋ž˜ํ”„ ์ €์žฅํ•˜๊ณ  ๋ถˆ๋Ÿฌ์˜ค๊ธฐ

์ฐธ๊ณ  : NetworkX : GML ํŒŒ์ด์ฌ ํŒŒ์ผ์„ ์‹คํ–‰ํ•  ๋•Œ๋งˆ๋‹ค ๊ทธ๋ž˜ํ”„๋ฅผ ๊ทธ๋ฆฌ์ง€ ์•Š์•„๋„ ๋˜๋Š” ๊ฒฝ์šฐ๋“ค์ด ์žˆ๋‹ค. ์ด๋Ÿฐ ๊ฒฝ์šฐ, ๊ทธ๋ž˜ํ”„๋ฅผ ํ•œ ๋ฒˆ ๊ทธ๋ ค ์ €์žฅํ•˜๊ณ  ์ €์žฅ๋œ ๊ทธ๋ž˜ํ”„๋ฅผ ๋ถˆ๋Ÿฌ์˜ค๋Š” ๊ฒƒ์ด ํšจ์œจ์ ์ด๋‹ค. ์ด๋ฒˆ ํฌ์ŠคํŠธ์—์„œ๋Š” ๊ทธ๋ฆฐ ๊ทธ๋ž˜ํ”„๋ฅผ ์ €์žฅํ•˜๊ณ  ๋‹ค๋ฅธ ํŒŒ์ผ์—์„œ ๋ถˆ๋Ÿฌ์˜ค๋Š” ๋ฐฉ๋ฒ•์„ ๋‹ค๋ค„๋ณด์ž. ๊ทธ๋ž˜ํ”„๋Š” json, gml ๋“ฑ ์—ฌ๋Ÿฌ ํฌ๋งท์œผ๋กœ ์ €์žฅํ•  ์ˆ˜ ์žˆ์ง€๋งŒ ๋‚˜๋Š” ๋‹จ์ˆœํžˆ ๊ทธ๋ž˜ํ”„๋ฅผ ํŒŒ์ด์ฌ ํŒŒ์ผ์— ๋‹ค์‹œ ๋ถˆ๋Ÿฌ์˜ฌ ์šฉ๋„๋กœ ์ €์žฅํ•˜๋Š” ๊ฒƒ์ด๊ธฐ ๋•Œ๋ฌธ์— GML ํฌ๋งท์œผ๋กœ ์ €์žฅํ–ˆ๋‹ค. ๋จผ์ € ๊ทธ๋ž˜ํ”„๋ฅผ ๊ทธ๋ฆฐ ๋ถ€๋ถ„์„ ์ƒˆ๋กœ์šด ํŒŒ์ผ์— ์˜ฎ๊ฒจ์ค€๋‹ค. ๊ธฐ์กด : main.py -> ์ƒˆ ํŒŒ์ผ : graph.py # graph.py import networkx as nx def drawGraph(data): # ๊ทธ๋ž˜ํ”„ ๊ทธ๋ฆฌ๋Š” ๋ถ€๋ถ„ ์ƒ๋žต ... G = nx.Graph()..

์Šคํ„ฐ๋””/Python 2022. 7. 7. 16:40
[ML] ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€

๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋Š” ์ด๋ฆ„์€ ํšŒ๊ท€์ด์ง€๋งŒ ๋ถ„๋ฅ˜ ๋ชจ๋ธ์ด๋‹ค. ์„ ํ˜• ํšŒ๊ท€์™€ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ์„ ํ˜• ๋ฐฉ์ •์‹์„ ํ•™์Šตํ•œ๋‹ค. z = a*x1 + b*x2 + c*x3 + d*x4 + e*x5 + f ์™€ ๊ฐ™์€ ํ˜•ํƒœ์ด๋‹ค. ์ด ๋•Œ ๋ฐฉ์ •์‹์˜ a,b,c,d,e๋Š” ๊ฐ€์ค‘์น˜ ํ˜น์€ ๊ณ„์ˆ˜์ด๊ณ  x1~5๋Š” ํŠน์„ฑ์ด๋‹ค. ๋‹ค์ค‘ ํšŒ๊ท€์™€ ๋น„์Šทํ•œ ํ˜•ํƒœ์ด๋‹ค. z์˜ ๊ฐ’์€ ์–ด๋–ค ๊ฐ’์ด๋“  ๊ฐ€๋Šฅํ•˜์ง€๋งŒ ํ™•๋ฅ ๋กœ ๋‚˜ํƒ€๋‚ด๊ธฐ ์œ„ํ•ด์„œ๋Š” 0~1 ์‚ฌ์ด ๊ฐ’์ด ๋˜์–ด์•ผ ํ•œ๋‹ค. z์˜ ๊ฐ’์„ 0~1 ์‚ฌ์ด์˜ ๊ฐ’์œผ๋กœ ๋ณ€ํ™˜ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๋ณ€ํ™˜ ํ•จ์ˆ˜๊ฐ€ ํ•„์š”ํ•˜๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ๋Š” ์‹œ๊ทธ๋ชจ์ด๋“œ ํ•จ์ˆ˜๋ฅผ ๋งŽ์ด ์“ด๋‹ค. ์•„์ฃผ ํฐ ์Œ์ˆ˜์ผ ๋•Œ 0์ด ๋˜๊ณ  ์•„์ฃผ ํฐ ์–‘์ˆ˜์ผ ๋•Œ 1์ด ๋˜๋„๋ก ํ•œ๋‹ค. ์•„๋ž˜ ๊ทธ๋ฆผ์ฒ˜๋Ÿผ Sํ˜• ๊ณก์„ ์˜ ํ˜•ํƒœ๋ฅผ ๋„๊ฒŒ ๋œ๋‹ค. ํ•จ์ˆ˜ ์‹์€ ์ž์—ฐ ์ƒ์ˆ˜ e์˜ -z์ œ๊ณฑ์— +1์„ ํ•œ ๋‹ค์Œ ์—ญ์ˆ˜๋ฅผ ์ทจํ•œ๋‹ค. ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋กœ ์ด..

์Šคํ„ฐ๋””/ML, DL 2022. 3. 19. 22:13
๋ฐ์ดํ„ฐ ๋ถ„์„ ํ”„๋ ˆ์ž„์›Œํฌ - AARRR (ํ•ด์ ์ง€ํ‘œ)

AARRR ๊ธฐ๋ฒ•์€ ๊ทธ๋กœ์Šค ํ•ดํ‚น(Growth Hacking) ์˜ ๋ถ„์„ ๊ธฐ๋ฒ•์ด๋‹ค. ๊ทธ๋กœ์Šค ํ•ดํ‚น์€ ๊ธฐ์—…์˜ ์„ฑ์žฅ์„ ์ตœ์šฐ์„ ์œผ๋กœ ํ•˜๋ฉฐ, ์‚ฌ์šฉ์ž์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„์„ํ•ด ์„œ๋น„์Šค๋ฅผ ๊ฐœ์„ ํ•˜๋Š” ๋ฐ์— ํ™œ์šฉํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ด๋Ÿฐ ์ด๋ฆ„์ด ๋ถ™๊ฒŒ ๋˜์—ˆ๋‹ค. ๋‹ค์„ฏ ๋‹จ์–ด์˜ ์•ž ๊ธ€์ž๋ฅผ ๋•„์œผ๋ฉฐ ๊ฐ๊ฐ Acquisition(ํš๋“), Activation(ํ™œ๋™), Retention(์žฌ๋ฐฉ๋ฌธ), Referral(๊ณต์œ ), Revenue(์ˆ˜์ต) ์ด๋‹ค. ์‚ฌ์šฉ์ž๊ฐ€ ์„œ๋น„์Šค๋ฅผ ํ™œ์šฉํ•˜๋ฉด์„œ ์ˆ˜์ง‘๋˜๋Š” ์—ฌ๋Ÿฌ ๋ฐ์ดํ„ฐ ์ค‘ ์œ„ ๋‹ค์„ฏ๊ฐ€์ง€์˜ ์ง€ํ‘œ๋ฅผ ํ•ต์‹ฌ์œผ๋กœ ์„œ๋น„์Šค์˜ ์„ฑ์žฅ์— ํ™œ์šฉํ•œ๋‹ค. ๋‹ค์„ฏ ๊ฐœ์˜ ์ง€ํ‘œ๋ฅผ ์ˆœ์ฐจ์ ์œผ๋กœ ๋ถ„์„ํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ํ•จ๊ป˜ ๋ถ„์„ํ•ด์•ผ ํ•œ๋‹ค. (1) Acquisition ํš๋“ ๋‹จ๊ณ„์—์„œ๋Š” ์†Œ๋น„์ž๊ฐ€ ์„œ๋น„์Šค๋ฅผ ์–ด๋–ป๊ฒŒ ์•Œ๊ฒŒ ๋˜์—ˆ๋Š”์ง€, ์–ด๋–ค ๊ฒฝ๋กœ๋กœ ์œ ์ž…๋˜์—ˆ๋Š”์ง€ ๋“ฑ์„ ๋ถ„์„ํ•œ๋‹ค. DAU, ..

[ML] ํšŒ๊ท€ ์•Œ๊ณ ๋ฆฌ์ฆ˜ : ์„ ํ˜• ํšŒ๊ท€ (2) - ๋‹ค์ค‘ ํšŒ๊ท€

์„ ํ˜• ํšŒ๊ท€๋Š” ํ•˜๋‚˜์˜ ํŠน์„ฑ์„ ์ด์šฉํ•œ ํšŒ๊ท€ ๋ฐฉ๋ฒ•์ด๋‹ค. ํ•˜์ง€๋งŒ ์ผ๋ฐ˜์ ์œผ๋กœ ํŠน์„ฑ์€ ์—ฌ๋Ÿฌ ๊ฐœ์ด๋‹ค. ์ด๋Ÿด ๋•Œ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์ด ๋ฐ”๋กœ ๋‹ค์ค‘ ํšŒ๊ท€์ด๋‹ค. ํŠน์„ฑ์ด ํ•˜๋‚˜์ธ ์„ ํ˜• ํšŒ๊ท€์—์„œ๋Š” ๋ชจ๋ธ์ด ์ง์„ ์„ ํ•™์Šตํ•˜์ง€๋งŒ 2๊ฐœ์˜ ํŠน์„ฑ์„ ๊ฐ€์ง„๋‹ค๋ฉด ๋ชจ๋ธ์€ ํ‰๋ฉด์„ ํ•™์Šตํ•œ๋‹ค. ๋ฐฉ์ •์‹์„ ๋ณด๋ฉด ์‰ฝ๊ฒŒ ์™€๋‹ฟ๋Š”๋ฐ 'ํƒ€๊ฒŸ = a*ํŠน์„ฑ1 + b*ํŠน์„ฑ2 + ์ ˆํŽธ' ์˜ ํ‰๋ฉด ๋ฐฉ์ •์‹์„ ๊ฐ€์ง€๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ์ด์ฒ˜๋Ÿผ ํŠน์„ฑ์ด ๋งŽ์„ ๋•Œ ๊ณ ์ฐจ์›์„ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ์„ ํ˜• ํšŒ๊ท€๋Š” ๋ณต์žกํ•œ ๋ชจ๋ธ์„ ํ•™์Šต์‹œํ‚ฌ ์ˆ˜ ์žˆ๋‹ค. ํŠน์„ฑ๋“ค์ด ์—ฌ๋Ÿฌ ๊ฐœ ์กด์žฌํ•  ๋•Œ ํŠน์„ฑ ๊ทธ๋Œ€๋กœ๋ฅผ ์‚ฌ์šฉํ•ด๋„ ์ข‹์ง€๋งŒ ํŠน์„ฑ๋ผ๋ฆฌ ๊ณฑํ•˜๋Š” ๋“ฑ ์ƒˆ๋กœ์šด ํŠน์„ฑ์„ ๋งŒ๋“ค ์ˆ˜๋„ ์žˆ๋‹ค. ์‚ฌ์ดํ‚ท๋Ÿฐ์—์„œ๋Š” ๊ธฐ์กด ํŠน์„ฑ์œผ๋กœ๋ถ€ํ„ฐ ์ƒˆ๋กœ์šด ํŠน์„ฑ์„ ๋งŒ๋“œ๋Š” ์‰ฌ์šด ๋„๊ตฌ๋ฅผ ์ œ๊ณตํ•œ๋‹ค. ์‚ฌ์ดํ‚ท๋Ÿฐ์˜ ํŠน์„ฑ์„ ๋งŒ๋“ค๊ณ  ์ „์ฒ˜๋ฆฌํ•˜๋Š” ๋‹ค์–‘ํ•œ ํด๋ž˜์Šค๋ฅผ ๋ณ€ํ™˜๊ธฐ๋ผ๊ณ  ํ•˜๊ณ  ์ด๋Š”..

์Šคํ„ฐ๋””/ML, DL 2022. 3. 14. 22:57
[ML] ํšŒ๊ท€ ์•Œ๊ณ ๋ฆฌ์ฆ˜ : ์„ ํ˜• ํšŒ๊ท€ (1)

๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์—๋Š” ์ง€๋„ ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ ๋น„์ง€๋„ ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์žˆ๋‹ค. ์ง€๋„ ํ•™์Šต์€ ํ›ˆ๋ จ์„ ์œ„ํ•œ ๋ฐ์ดํ„ฐ์™€ ์ •๋‹ต์ด ํ•„์š”ํ•˜๊ณ , ๋น„์ง€๋„ ํ•™์Šต์€ ์ •๋‹ต์ด ์—†๊ณ  ๋Œ€์‹  ๋น„์Šทํ•œ ๋ฐ์ดํ„ฐ๋ผ๋ฆฌ ๋ฌถ๋Š”๋‹ค. ์ง€๋„ ํ•™์Šต์€ ๋˜ ๋‹ค์‹œ ๋ถ„๋ฅ˜์™€ ํšŒ๊ท€๋กœ ๋‚˜๋‰˜๋Š”๋ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์—ฌ๋Ÿฌ ์˜ต์…˜ ์ค‘ ํ•˜๋‚˜๋กœ ์„ ํƒ/๊ฒฐ์ •ํ•˜๋Š” ๊ฒƒ์ด ๋ถ„๋ฅ˜, ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด ์ž„์˜์˜ ์–ด๋–ค ๊ฐ’์„ ์˜ˆ์ธกํ•˜๋Š” ๊ฒƒ์ด ํšŒ๊ท€์ด๋‹ค. ์—ฌ๋Ÿฌ ํšŒ๊ท€ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ค‘ ์ด๋ฒˆ ํฌ์ŠคํŠธ์—์„œ๋Š” ์„ ํ˜• ํšŒ๊ท€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ๋Œ€ํ•ด ๋‹ค๋ค„๋ณด๋ ค๊ณ  ํ•œ๋‹ค. ์„ ํ˜• ํšŒ๊ท€๋Š” ๋Œ€ํ‘œ์ ์ธ ํšŒ๊ท€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ, ์—ฌ๋Ÿฌ ๊ณณ์—์„œ ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๊ณ  ์žˆ๋‹ค. ๋‹จ์–ด ๊ทธ๋Œ€๋กœ ๋ฐ์ดํ„ฐ์˜ ํŠน์„ฑ์ด ํ•˜๋‚˜์ธ ๊ฒฝ์šฐ ํŠน์„ฑ์„ ๊ฐ€์žฅ ์ž˜ ๋‚˜ํƒ€๋‚ผ ์ˆ˜ ์žˆ๋Š” ์–ด๋– ํ•œ ์ง์„ ์— ๋Œ€ํ•ด ํ•™์Šตํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‹ค. (์ „์ฒ˜๋ฆฌํ•œ)๋ฐ์ดํ„ฐ๋ฅผ ๊ทธ๋ž˜ํ”„๋กœ ๋‚˜ํƒ€๋‚ด๋ฉด ๊ทธ ๋ฐ์ดํ„ฐ์˜ ํŠน์„ฑ์ด ํ•˜๋‚˜์ผ ๋•Œ ๋ถ„ํฌ์— ๋”ฐ๋ผ ์–ด๋– ํ•œ ์„ ์ด..

์Šคํ„ฐ๋””/ML, DL 2022. 3. 3. 23:50
[GCP] ๊ตฌ๊ธ€ ํด๋ผ์šฐ๋“œ ํ”Œ๋žซํผ์œผ๋กœ ์„œ๋ฒ„ ๊ตฌ์ถ•ํ•˜๊ธฐ (1) - ์ธ์Šคํ„ด์Šค ์ƒ์„ฑ

ํ”„๋กœ์ ํŠธ ๊ฐœ๋ฐœ์ด ๋ชจ๋‘ ๋๋‚œ ํ›„ ๊ทธ ํ”„๋กœ์ ํŠธ์˜ ๋งˆ์ง€๋ง‰ ๋‹จ๊ณ„๋Š” ๋‹จ์—ฐ์ฝ” ์„œ๋ฒ„์— ์˜ฌ๋ ค์„œ ์ž˜ ์ž‘๋™ํ•˜๋Š”์ง€ ํ™•์ธํ•˜๋Š” ๊ฒƒ์ผ ๊ฒƒ์ด๋‹ค. ๋งˆ์นจ ์–ผ๋งˆ ์ „์— ํ”„๋กœ์ ํŠธ ๊ฐœ๋ฐœ์ด ๋ชจ๋‘ ๋๋‚˜์„œ ์„œ๋ฒ„์— ์˜ฌ๋ ค๋ณด๋ ค๋Š” ์ค‘์ธ๋ฐ ์—ฌ๋Ÿฌ ์„œ๋ฒ„ ํ”Œ๋žซํผ์ด ์žˆ์ง€๋งŒ, GCP๊ฐ€ ๋ฌด๋ฃŒ ์ฒดํ—˜ํŒ ๋“ฑ ๋ฌด๋ฃŒ๋กœ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•๋“ค์ด ์žˆ์–ด์„œ ์šฐ๋ฆฌ๋Š” Google Cloud Platform(์ดํ•˜ GCP)๋ฅผ ์ด์šฉํ•ด์„œ ์„œ๋ฒ„์— ์˜ฌ๋ ค๋ณด๋ ค๊ณ  ํ•œ๋‹ค. ๋จผ์ € GCP ์ฝ˜์†”์— ์ ‘์†ํ•œ๋‹ค. https://console.cloud.google.com/ ๊ทธ ๋‹ค์Œ์œผ๋กœ๋Š” ํ”„๋กœ์ ํŠธ๋ฅผ ์ƒ์„ฑํ•œ๋‹ค. ํ˜น์‹œ ์ด๋ฏธ ํ”„๋กœ์ ํŠธ๋ฅผ ๋งŒ๋“ค์–ด์„œ ๋Œ€์‹œ๋ณด๋“œ๊ฐ€ ๋œฌ๋‹ค๋ฉด ์ƒ๋‹จ์˜ ํ”„๋กœ์ ํŠธ ์ด๋ฆ„์„ ํด๋ฆญํ•ด ๋œจ๋Š” ์ฐฝ์— ํ”„๋กœ์ ํŠธ๋ฅผ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋Š” ๋ฒ„ํŠผ์ด ์žˆ๋‹ค. ํ”„๋กœ์ ํŠธ ์ด๋ฆ„๊ณผ ์œ„์น˜๋ฅผ ์„ค์ •ํ•˜๊ณ  '๋งŒ๋“ค๊ธฐ' ๋ฒ„ํŠผ์„ ํด๋ฆญํ•œ๋‹ค. ํ”„๋กœ์ ํŠธ๊ฐ€ ์ƒ์„ฑ๋˜๋ฉด..

์Šคํ„ฐ๋””/Web 2022. 3. 2. 00:00
[Hadoop] ๋งต๋ฆฌ๋“€์Šค - ๋ถ„์‚ฐ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ํ”„๋ ˆ์ž„์›Œํฌ

์ข‹์€ ๋ถ„์‚ฐ ์‹œ์Šคํ…œ์„ ๊ตฌ์ถ•ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ํšจ์œจ์ ์ธ ์ž…์ถœ๋ ฅ๋„ ์ค‘์š”ํ•˜์ง€๋งŒ ์ด๊ฒƒ๋งŒ์œผ๋กœ๋Š” ์ถฉ๋ถ„ํ•˜์ง€ ์•Š๋‹ค. YARN์€ ํด๋Ÿฌ์Šคํ„ฐ์— ๊ณ„์‚ฐ์„ ๋ถ„์‚ฐํ•˜๊ณ  HDFS์— ๋ณด๊ด€๋œ ๋ฐ์ดํ„ฐ๋ฅผ ํ™•์žฅ ๊ฐ€๋Šฅํ•˜๋„๋ก ์ฒ˜๋ฆฌํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ถ”์ƒํ™”ํ•ด์„œ ์ œ๊ณตํ•˜๋Š” ๊ฒƒ ๋ฟ์ด๋‹ค. ๋”ฐ๋ผ์„œ ๊ณ„์‚ฐ์„ ํ‘œํ˜„ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด ์ค‘์š”ํ•œ๋ฐ, ํ•˜๋‘ก์ด ๊ฐ€์žฅ ์ฒ˜์Œ ์ง€์›ํ•œ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ๋ชจ๋ธ์€ ๋งต๋ฆฌ๋“€์Šค์ด๋‹ค. ๋งต๋ฆฌ๋“€์Šค๋Š” ๊ตฌ๊ธ€์ด ๋ฐœํ‘œํ–ˆ๊ณ  ๋งŽ์€ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ ๋‹จ์ˆœํ•œ ๋ชจ๋ธ์— ๊ธฐ๋ฐ˜์„ ๋‘”๋‹ค. ๋•๋ถ„์— ๋ถ„์‚ฐ ์‹œ์Šคํ…œ์„ ์ž˜ ๋ชฐ๋ผ๋„ ์ธํ”„๋ผ ๊ตฌ์ถ•์„ ๊ณ ๋ฏผํ•˜์ง€ ์•Š๊ณ  ๋งต๋ฆฌ๋“€์Šค๋ฅผ ํ†ตํ•ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค. ๋งต๋ฆฌ๋“€์Šค๋Š” ๋ณ‘๋ ฌ ์ฒ˜๋ฆฌ ๋ชจ๋ธ์ด๊ณ  ๋ฌธ์ œ๋ฅผ ๋งต ๋‹จ๊ณ„, ์…”ํ”Œ ๋‹จ๊ณ„, ๋ฆฌ๋“€์Šค ๋‹จ๊ณ„๋กœ ๋‚˜๋ˆ ์„œ ์ˆ˜ํ–‰ํ•œ๋‹ค. HDFS์˜ ๋ฐ์ดํ„ฐ ์ง€์—ญ์„ฑ๊ณผ YARN์˜ ์ž‘์—… ๋ฐ ๋ฆฌ์†Œ์Šค ๊ด€๋ฆฌ ๊ธฐ๋Šฅ์ด ์ด ์„ธ ๋‹จ๊ณ„ ๊ณ„์‚ฐ์ด ํšจ์œจ์ ์ด๋„๋ก ๋•๋Š”๋‹ค. ..

[PySpark] ์ฅฌํ”ผํ„ฐ ๋…ธํŠธ๋ถ์œผ๋กœ PySpark ์‚ฌ์šฉํ•˜๊ธฐ

์ €๋ฒˆ ํฌ์ŠคํŠธ์—์„œ๋Š” windows10 ์— ์ŠคํŒŒํฌ๋ฅผ ์„ค์น˜ํ•ด๋ณด์•˜๋‹ค. ๋‹ค๋งŒ cmd ์ฐฝ์—์„œ ๋ชจ๋“  ์ž‘์—…์„ ์ง„ํ–‰ํ•˜๊ธฐ์—๋Š” ๋ถˆํŽธํ•จ์ด ์žˆ์–ด์„œ (์ž‘์—… ๋ช…๋ น์–ด ๋“ฑ ๋‚ด์šฉ ์ €์žฅ์— ๋ถˆํŽธ) ์•ž์œผ๋กœ๋Š” ์ฅฌํ”ผํ„ฐ ๋…ธํŠธ๋ถ์œผ๋กœ ์ž‘์—…ํ•˜๊ธฐ ์œ„ํ•ด ์ž‘์—…ํ™˜๊ฒฝ์„ ์„ธํŒ…ํ•˜๊ณ  ํ…Œ์ŠคํŠธ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถˆ๋Ÿฌ์™€๋ณด์•˜๋‹ค. ์ฅฌํ”ผํ„ฐ ๋…ธํŠธ๋ถ๊ณผ ์•„๋‚˜์ฝ˜๋‹ค๋Š” ์ด๋ฏธ ์„ค์น˜๋˜์–ด ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•œ๋‹ค. ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅํ•˜๊ณ  ๊ด€๋ฆฌํ•˜๊ธฐ ์œ„ํ•ด ํ•˜๋‘ก์„ ํ•จ๊ป˜ ์‚ฌ์šฉํ•œ๋‹ค. (ํ•˜๋‘ก ์„ค์น˜ ๋ฐฉ๋ฒ•์€ ์ด์ „ ํฌ์ŠคํŠธ ์ฐธ๊ณ ) ์ฆ‰, ์ด๋ฒˆ ํฌ์ŠคํŠธ์—์„œ ๋‹ค๋ฃจ๋Š” ๋‚ด์šฉ์€ ์ŠคํŒŒํฌ์™€ ํ•˜๋‘ก์„ ์—ฐ๊ฒฐํ•˜๋Š” ๋‚ด์šฉ์ด๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ๊ฒ ๋‹ค. (1) ํ•˜๋‘ก ์‹คํ–‰ cmd ์ฐฝ์„ ์—ด์–ด ํ•˜๋‘ก ์„ค์น˜ํŒŒ์ผ์ด ์žˆ๋Š” ๋””๋ ‰ํ† ๋ฆฌ๋กœ ์ด๋™ํ•˜๊ณ  ๋‹ค์Œ ๋ช…๋ น์–ด๋“ค์„ ์ฐจ๋ก€๋กœ ์‹คํ–‰ํ•œ๋‹ค. ์ด ๋•Œ 'hdfs namenode -format' ๋ช…๋ น์€ ํ•  ๋•Œ๋งˆ๋‹ค ์‹คํ–‰ํ•˜์ง€ ์•Š๊ณ  ๋งจ ์ฒ˜์Œ์—๋งŒ ์‹คํ–‰ํ•ด๋„ ๋˜..

[Hadoop] YARN - ๋ฆฌ์†Œ์Šค ๊ด€๋ฆฌ์ž์™€ ์Šค์ผ€์ค„๋Ÿฌ

์ €๋ฒˆ์—๋Š” ํ•˜๋‘ก์ด ๋ฌด์—‡์ธ์ง€, ๊ทธ๋ฆฌ๊ณ  ํ•˜๋‘ก์˜ ๊ธฐ๋ณธ ํŒŒ์ผ ์‹œ์Šคํ…œ์ธ ๋ถ„์‚ฐ ํŒŒ์ผ ์‹œ์Šคํ…œ์— ๋Œ€ํ•ด ๊ณต๋ถ€ํ–ˆ๋‹ค. ์ด๋ฒˆ์—๋Š” ์ด์–ด์„œ ํ•˜๋‘ก์˜ ๋ฆฌ์†Œ์Šค ๊ด€๋ฆฌ์ž์™€ ์Šค์ผ€์ค„๋Ÿฌ์— ๋Œ€ํ•ด ๊ณต๋ถ€ํ•ด๋ณด๋ ค๊ณ  ํ•œ๋‹ค. ๋ถ„์‚ฐ ์‹œ์Šคํ…œ์—์„œ๋Š” ์Šค์ผ€์ค„๋ง๊ณผ ๋ฆฌ์†Œ์Šค ๊ด€๋ฆฌ ๊ธฐ๋Šฅ์„ ํ•ต์‹ฌ ์š”์†Œ๋กœ ๊ฐ€์ง€๊ณ  ์žˆ๋Š”๋ฐ, ํ•˜๋‘ก์—์„œ๋Š” ๊ณ„์‚ฐ ๋ฆฌ์†Œ์Šค๋ฅผ ํ• ๋‹นํ•˜๊ณ  ์‚ฌ์šฉ์ž ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ์Šค์ผ€์ค„๋งํ•˜๋Š” ์‹œ์Šคํ…œ์œผ๋กœ YARN ์„ ์‚ฌ์šฉํ•œ๋‹ค. YARN (Yet Another Resource Negotiator) ์€ ์Šค์ผ€์ค„๋ง๊ณผ ๋ฆฌ์†Œ์Šค ๊ด€๋ฆฌ๋ฅผ ๋‹ด๋‹นํ•˜์—ฌ ๋ฐ์ดํ„ฐ์˜ ์ง€์—ญ์„ฑ์„ ๊ทน๋Œ€ํ™”ํ•˜๊ณ  ๊ณ„์‚ฐ๋Ÿ‰์ด ๋งŽ์€ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์ด ์ž์›์„ ๋…์ ํ•˜์ง€ ์•Š๋„๋ก ์ œ์–ดํ•œ๋‹ค. ๋˜ํ•œ ๊ต์ฒด๊ฐ€ ๊ฐ€๋Šฅํ•œ ์Šค์ผ€์ค„๋ง ์‹œ์Šคํ…œ์„ ์ง€์›ํ•˜๊ณ  ์‚ฌ์šฉ์ž๋‹น ๋ฆฌ์†Œ์Šค ์ œํ•œ, ์ž‘์—… ๋Œ€๊ธฐ์—ด๋‹น ๋ฆฌ์†Œ์Šค ํ• ๋‹น๋Ÿ‰ ๋“ฑ์˜ ๊ณต์šฉ ๋ฆฌ์†Œ์Šค ์‹œ์Šคํ…œ ์Šค์ผ€์ค„๋ง์— ํ•„์š”ํ•œ ํ™˜๊ฒฝ ์„ค์ •์„ ์Šค์ผ€์ค„๋Ÿฌ์—..

[Hadoop] ํ•˜๋‘ก ์„ค์น˜ํ•˜๊ณ  ํ™•์ธํ•ด๋ณด๊ธฐ

์ŠคํŒŒํฌ๋ฅผ ์‚ฌ์šฉํ•  ๋•Œ ์ €์žฅ์†Œ๋กœ ํ•˜๋‘ก์„ ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•ด ํ•˜๋‘ก์„ ์„ค์น˜ํ•ด๋ณด๊ฒ ๋‹ค. ํ•˜๋‘ก ์„ค์น˜๋Š” ๋‹ค์Œ ๊ณผ์ •์„ ๋”ฐ๋ฅธ๋‹ค. (1) ํ•˜๋‘ก, ์ž๋ฐ” ๋‹ค์šด https://hadoop.apache.org/releases.html ์œ„ ๋งํฌ์—์„œ ๋ฐ›์œผ๋ ค๋Š” ํ•˜๋‘ก ๋ฒ„์ „์„ ํ™•์ธํ•˜๊ณ  binary ๋ฅผ ์„ ํƒํ•ด ์••์ถ•ํŒŒ์ผ์„ ๋‹ค์šด๋ฐ›๋Š”๋‹ค. ์••์ถ•ํŒŒ์ผ์€ ~.tar.gz ํ™•์žฅ์ž ์ด๋ฆ„์„ ๊ฐ€์ง€๊ณ  ์žˆ๊ณ  ๋‚˜๋Š” 3.2.2 ๋ฒ„์ „์„ ๋ฐ›์•˜๋‹ค. (์ŠคํŒŒํฌ์— ํฌํ•จ๋œ ํ•˜๋‘ก ๋ฒ„์ „์ด 3.2 ๋ฒ„์ „์ด๋‹ค.) ์ž๋ฐ”(jdk)๋„ ๋‹ค์šด๋ฐ›์•„์•ผ ํ•˜์ง€๋งŒ ์ž๋ฐ”๋Š” ์ด๋ฏธ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ํ•ด๋‹น ๊ณผ์ •์€ ์ƒ๋žตํ•œ๋‹ค. (๋‚˜์˜ ์ž๋ฐ” ๋ฒ„์ „ 13) (2) ํ™˜๊ฒฝ๋ณ€์ˆ˜ ์„ค์ • ์ŠคํŒŒํฌ ์„ค์น˜ ๋•Œ์™€ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ํ™˜๊ฒฝ๋ณ€์ˆ˜๋ฅผ ์„ค์ •ํ•œ๋‹ค. (์ด์ „ ๊ฒŒ์‹œ๊ธ€์—์„œ ์ž์„ธํžˆ ๋‹ค๋ค˜์œผ๋ฏ€๋กœ ์—ฌ๊ธฐ์„œ๋Š” ํŒจ์Šคํ•œ๋‹ค.) ๋‹ค๋งŒ ์ด์ „์— ์„ค์ •ํ–ˆ๋˜ HADOOP_HOME ์„ ํŽธ..