Study Anything 🧐

[Hadoop] YARN - λ¦¬μ†ŒμŠ€ κ΄€λ¦¬μžμ™€ μŠ€μΌ€μ€„λŸ¬ λ³Έλ¬Έ

μŠ€ν„°λ””/Data Analytics

[Hadoop] YARN - λ¦¬μ†ŒμŠ€ κ΄€λ¦¬μžμ™€ μŠ€μΌ€μ€„λŸ¬

솔 2022. 2. 24. 23:32

μ €λ²ˆμ—λŠ” ν•˜λ‘‘μ΄ 무엇인지, 그리고 ν•˜λ‘‘μ˜ κΈ°λ³Έ 파일 μ‹œμŠ€ν…œμΈ λΆ„μ‚° 파일 μ‹œμŠ€ν…œμ— λŒ€ν•΄ κ³΅λΆ€ν–ˆλ‹€.

μ΄λ²ˆμ—λŠ” μ΄μ–΄μ„œ ν•˜λ‘‘μ˜ λ¦¬μ†ŒμŠ€ κ΄€λ¦¬μžμ™€ μŠ€μΌ€μ€„λŸ¬μ— λŒ€ν•΄ 곡뢀해보렀고 ν•œλ‹€.

 

 

λΆ„μ‚° μ‹œμŠ€ν…œμ—μ„œλŠ” μŠ€μΌ€μ€„λ§κ³Ό λ¦¬μ†ŒμŠ€ 관리 κΈ°λŠ₯을 핡심 μš”μ†Œλ‘œ 가지고 μžˆλŠ”λ°, ν•˜λ‘‘μ—μ„œλŠ” 계산 λ¦¬μ†ŒμŠ€λ₯Ό ν• λ‹Ήν•˜κ³  μ‚¬μš©μž μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ„ μŠ€μΌ€μ€„λ§ν•˜λŠ” μ‹œμŠ€ν…œμœΌλ‘œ YARN 을 μ‚¬μš©ν•œλ‹€.

YARN (Yet Another Resource Negotiator) 은 μŠ€μΌ€μ€„λ§κ³Ό λ¦¬μ†ŒμŠ€ 관리λ₯Ό λ‹΄λ‹Ήν•˜μ—¬ λ°μ΄ν„°μ˜ 지역성을 κ·ΉλŒ€ν™”ν•˜κ³  κ³„μ‚°λŸ‰μ΄ λ§Žμ€ μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ΄ μžμ›μ„ λ…μ ν•˜μ§€ μ•Šλ„λ‘ μ œμ–΄ν•œλ‹€.

λ˜ν•œ ꡐ체가 κ°€λŠ₯ν•œ μŠ€μΌ€μ€„λ§ μ‹œμŠ€ν…œμ„ μ§€μ›ν•˜κ³  μ‚¬μš©μžλ‹Ή λ¦¬μ†ŒμŠ€ μ œν•œ, μž‘μ—… λŒ€κΈ°μ—΄λ‹Ή λ¦¬μ†ŒμŠ€ ν• λ‹ΉλŸ‰ λ“±μ˜ 곡용 λ¦¬μ†ŒμŠ€ μ‹œμŠ€ν…œ μŠ€μΌ€μ€„λ§μ— ν•„μš”ν•œ ν™˜κ²½ 섀정을 μŠ€μΌ€μ€„λŸ¬μ— μž…λ ₯ν•  수 μžˆλ‹€.

 

YARN은 ν΄λŸ¬μŠ€ν„°μ˜ λ¦¬μ†ŒμŠ€λ₯Ό μ»¨ν…Œμ΄λ„ˆλ‘œ λΆ„ν• ν•˜κ³ , μ»¨ν…Œμ΄λ„ˆλŠ” 기본적으둜 ν• λ‹Ήλ˜λŠ” CPU의 μ½”μ–΄ μˆ˜μ™€ λ©”λͺ¨λ¦¬ μš©λŸ‰μœΌλ‘œ μ •μ˜λ˜λ©° 좔가적인 λ¦¬μ†ŒμŠ€(CPU μ½”μ–΄, λ©”λͺ¨λ¦¬, GPU, μŠ€ν† λ¦¬μ§€) 등을 ν¬ν•¨ν•˜κΈ°λ„ ν•œλ‹€.

YARN은 μ‹€ν–‰ 쀑인 μ»¨ν…Œμ΄λ„ˆλ“€μ„ λͺ¨λ‹ˆν„°λ§ν•˜λ©° μ»¨ν…Œμ΄λ„ˆκ°€ λ¦¬μ†ŒμŠ€(CPU, λ©”λͺ¨λ¦¬, λ””μŠ€ν¬, λ„€νŠΈμ›Œν¬ λ“±)의 μ΅œλŒ€ ν• λ‹ΉλŸ‰μ„ μ΄ˆκ³Όν•˜μ§€ μ•Šλ„λ‘ μ œμ–΄ν•œλ‹€.

λ‹€λ₯Έ μ›Œν¬ν”Œλ‘œμš° μŠ€μΌ€μ€„λŸ¬λ“€κ³Ό 달리 데이터 지역성도 λ¦¬μ†ŒμŠ€λ‘œ μ œκ³΅ν•˜λŠ”λ°, λ§΅λ¦¬λ“€μŠ€ 같은 YARN μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ—μ„œλŠ” νŠΉμ •ν•œ μ»¨ν…Œμ΄λ„ˆκ°€ νŠΉμ • 데이터λ₯Ό μ €μž₯ν•˜κ³  μžˆκ±°λ‚˜ μ΅œλŒ€ν•œ κ°€κΉκ²Œ μ—°κ²°λœ μ„œλ²„μ—μ„œ μ‹€ν–‰λ˜λ„λ‘ μš”μ²­ν•  수 μžˆλ‹€.

 

YARN은 ν΄λŸ¬μŠ€ν„°μ˜ λ¦¬μ†ŒμŠ€λ₯Ό μ»¨ν…Œμ΄λ„ˆλ‘œ κ΄€λ¦¬ν•˜λ©° λΆ„μ‚° μ‹œμŠ€ν…œμ„ μ›ν™œν•˜κ²Œ μš΄μ˜ν•˜κ³  ν΄λŸ¬μŠ€ν„°μ˜ λ¦¬μ†ŒμŠ€λ₯Ό μ—¬λŸ¬ μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ— κ³΅ν‰ν•œ λ°©μ‹μœΌλ‘œ κ³΅μœ ν•œλ‹€. μ»¨ν…Œμ΄λ„ˆλ₯Ό λΉ„κ³΅κ°œλ‘œ μ„€μ •ν•˜μ—¬ μ‚¬μš©μžλ³„λ‘œ 뢄리할 μˆ˜λ„ 있고, μ‚¬μš©μžκ°€ μš”μ²­ν•œ μž‘μ—…μ„ μ λ‹Ήν•œ μ‹œμ μ— μ‹œμž‘ν•  μˆ˜λ„ μžˆλ‹€.

 

 

μœ„μ— μ‚΄νŽ΄λ³Έ λ‚΄μš©μ„ ν† λŒ€λ‘œ ν•˜λ‘‘μ˜ 전체적인 ꡬ쑰λ₯Ό 보면 λ‹€μŒκ³Ό κ°™λ‹€.

λ§΅λ¦¬λ“€μŠ€, ν…Œμ¦ˆ, 슀파크, SAS λ“±μ˜ 처리 엔진
YARN
I
μŠ€μΌ€μ€„λŸ¬ 제곡, μ»¨ν…Œμ΄λ„ˆ 관리와 뢄리(λ¦¬μ†ŒμŠ€ 관리), 데이터 지역성을 λ¦¬μ†ŒμŠ€λ‘œ μ‚¬μš©
HDFS (ν•˜λ‘‘ λΆ„μ‚° 파일 μ‹œμŠ€ν…œ)

 

 

 

μ°Έκ³  : γ€Œν•˜λ‘‘κ³Ό 슀파크λ₯Ό ν™œμš©ν•œ μ‹€μš© 데이터 과학」, 였퍼 λ©˜λΈλ¦¬λΉ„μΉ˜ μ™Έ 2λͺ…

 

 

728x90
Comments