Study Anything π§
[Hadoop] νλ‘ μ€μΉνκ³ νμΈν΄λ³΄κΈ° λ³Έλ¬Έ
μ€νν¬λ₯Ό μ¬μ©ν λ μ μ₯μλ‘ νλ‘μ μ¬μ©νκΈ° μν΄ νλ‘μ μ€μΉν΄λ³΄κ² λ€.
νλ‘ μ€μΉλ λ€μ κ³Όμ μ λ°λ₯Έλ€.
(1) νλ‘, μλ° λ€μ΄
https://hadoop.apache.org/releases.html
μ λ§ν¬μμ λ°μΌλ €λ νλ‘ λ²μ μ νμΈνκ³ binary λ₯Ό μ νν΄ μμΆνμΌμ λ€μ΄λ°λλ€.
μμΆνμΌμ ~.tar.gz νμ₯μ μ΄λ¦μ κ°μ§κ³ μκ³ λλ 3.2.2 λ²μ μ λ°μλ€.
(μ€νν¬μ ν¬ν¨λ νλ‘ λ²μ μ΄ 3.2 λ²μ μ΄λ€.)
μλ°(jdk)λ λ€μ΄λ°μμΌ νμ§λ§ μλ°λ μ΄λ―Έ μκΈ° λλ¬Έμ ν΄λΉ κ³Όμ μ μλ΅νλ€. (λμ μλ° λ²μ 13)
(2) νκ²½λ³μ μ€μ
μ€νν¬ μ€μΉ λμ λ§μ°¬κ°μ§λ‘ νκ²½λ³μλ₯Ό μ€μ νλ€. (μ΄μ κ²μκΈμμ μμΈν λ€λ€μΌλ―λ‘ μ¬κΈ°μλ ν¨μ€νλ€.)
λ€λ§ μ΄μ μ μ€μ νλ HADOOP_HOME μ νΈμ§ν΄μ μμΆν΄μ ν ν΄λλ‘ μ€μ νλ€.
(λμ κ²½μ° : (κΈ°μ‘΄) C:\Hadoop → (λ³κ²½) C:\Hadoop\hadoop-3.2.2)
μ€νν¬ μ€μΉ λ λ€μ΄λ°μλ C:\Hadoop\bin ν΄λμ winutils.exe νμΌλ ν΄λΉνλ κ°μ κ²½λ‘μ μΆκ°νλ€.
(λμ κ²½μ° : C:\Hadoop\hadoop-3.2.2\bin ν΄λλ‘ μ΄λ)
(3) νλ‘ λ²μ νμΈ
νλ‘μ΄ μ λλ‘ μ€μΉλμλμ§ νμΈνκΈ° μν΄ νλ‘ λ²μ μ νμΈν΄λ³΄μλ€.
λ΄ νκ²½μ jdk λ²μ μ΄ 13μ΄κΈ° λλ¬Έμ μλ° λ²μ μ΄ 13μΈ κ²μ΄ νμΈλκ³ μλ€.
νΉμ μ΄ λ 'μ§μ λ κ²½λ‘λ₯Ό μ°Ύμ μ μμ΅λλ€. Error: JAVA_HOME is incorrectly set.' μ€λ₯κ° λ°μνλ€λ©΄
μ΄κ²μ νκ²½ λ³μμ JAVA_HOME μ λμ΄μ°κΈ°κ° ν¬ν¨λμκΈ° λλ¬ΈμΌλ‘
C:\Program Files\ λΌλ©΄ C:\Progra~1\ μΌλ‘, C:\Program Files(x86)\ μ΄λΌλ©΄ C:\Progra~2\ μΌλ‘ λ³κ²½νλ€.
(4) νμΌ μμ
C:\Hadoop\hadoop-3.2.2\etc\hadoop ν΄λλ‘ μ΄λν΄ νμΌλ€μ μμ νλ€.
μμ ν νμΌμ λͺ¨λ 5κ°μ΄λ©°, μ€κ°μ C:\Hadoop\hadoop-3.2.2 μμ data\datanode ν΄λμ data\namenode ν΄λλ₯Ό λ§λ λ€. μ΄ κ³Όμ μ μλ λ§ν¬λ₯Ό μ°Έκ³ νλ€.
https://codedragon.tistory.com/9582
(4) μ€μΉ νμΈ
μ κ³Όμ μ λͺ¨λ λ§μΉ ν cmd μ°½μμ λ€μ λͺ λ Ήμ΄λ₯Ό μ λ ₯ν΄ ν΄λλ‘ μ΄λνλ€.
...> cd C:\Hadoop\hadoop-3.2.2\etc\hadoop
μ°¨λ‘λλ‘ λͺ λ Ήμ΄λ€μ μ λ ₯νλ€.
...\etc\hadooop> hadoop-env
...\etc\hadooop> hadoop namenode -format
κ°μ’ INFO κ° νμΈλλ©° HDFS λ₯Ό κΈ°λ°μΌλ‘ ν κ²½λ‘κ° λ³΄μΈλ€.
μ΄μ΄μ ν΄λλ₯Ό μ΄λν ν κ³μ μ§ννλ€.
start-dfs λͺ λ Ήμ΄λ₯Ό μ λ ₯νλ©΄ namenode μ datanode μ κ΄λ ¨λ μ°½ 2κ°κ° λμμ§λ€.
λ°©νλ²½ κ΄λ ¨ μ°½μ΄ λμμ§λ€λ©΄ μ‘μΈμ€λ₯Ό νμ©νλ€.
μλ‘ λμμ§ μ°½μ λ μ΄μ μλ‘μ΄ λ΄μ©μ΄ μ λ°μ΄νΈλμ§ μμΌλ©΄ μλμ cmd μ°½μμ κ³μ μ§ννλ€.
start-yarn λͺ λ Ήμ΄λ₯Ό μ λ ₯νλ©΄ yarn λ°λͺ¬μ΄ μ€νλλ€. λ§μ°¬κ°μ§λ‘ 2κ°μ μ°½μ΄ κ΅¬λλλ€.
...\etc\hadoop> cd ../../sbin
...\sbin> start-dfs
...\sbin> start-yarn
λ§μ§λ§μΌλ‘ λ€μ νμ΄μ§λ€μ΄ μ ꡬλλλμ§ νμΈνλ€.
- λ€μλ Έλ μ 보 (NameNode Information) : http://localhost:9870/
- λ°μ΄ν°λ Έλ μ 보 (DataNode Information) : http://localhost:9864/
- YARN μ 보 (YARN Information) : http://localhost:8088/
μ°¨λ‘λλ‘ λ€μκ³Ό κ°μ μΉνμ΄μ§κ° λμμ§λ€.
νμ§λ§ λμ κ²½μ° YARN λ°λͺ¬μ μ€ννμ λ resourcemanager μμ
'ERROR capacity.CapacityScheduler: Attempting to remove non-existent node ~' μ μ€λ₯κ° λ°μνλ€.
μμ μΊ‘μ³νλ©΄μμ 보λ€μνΌ YARN μ 보창μ μ λ¨κΈ°λ νμ§λ§ μμΈν 보면 Cluster Nodesμ Unhealty Nodes λΆλΆμ 1μ΄ μΆκ°λμ΄ μλ κ²μ λ³Ό μ μλ€.
μ΄κ²μ λ΄ PCμ μ μ₯μ©λμ΄ 90% μ΄μ μ°¨μμ λ λ°μνλ νμμ΄μλ€..
PCμ μ©λμ μ 리νκ³ μ΄λ μ λμ μ©λμ ν보ν λ€μ μ λͺ λ Ήλ€μ μ€ννλλ μ€λ₯λ μκΈ°μ§ μμκ³ YARN μ 보창μ ν΄λ¬μ€ν° λ Έλ Active Nodes λΆλΆμ 1μ΄ μΆκ°λ κ²μ νμΈν μ μμλ€.
μ΄μ²λΌ νΉμ λͺ¨λ₯Ό μ€λ₯λ€μ λλΉν΄ νμ PCμ μ©λμ μ μ 리νλλ‘ νμ... (μ€μ λ‘ μ΄ μ€λ₯ ν΄κ²° λλ¬Έμ λ©°μΉ μ λ λ¦Ό..)
'μ€ν°λ > Data Analytics' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
[PySpark] μ₯¬νΌν° λ ΈνΈλΆμΌλ‘ PySpark μ¬μ©νκΈ° (0) | 2022.02.25 |
---|---|
[Hadoop] YARN - 리μμ€ κ΄λ¦¬μμ μ€μΌμ€λ¬ (0) | 2022.02.24 |
[Spark] μ€νν¬ μ€μΉνκ³ csv νμΌ λΆλ¬μ€κΈ° (0) | 2022.02.15 |
[Hadoop] νλ‘κ³Ό λΆμ° νμΌ μμ€ν (0) | 2022.02.14 |
[Pandas] νλ€μ€μ μλ¦¬μ¦ κΈ°λ³Έ (0) | 2022.02.06 |