Tässä opetusohjelmassa opastamme sinut vaihe vaiheelta asentamaan Apache Hadoopin Linux-ruutuun (Ubuntu). Tämä on 2-osainen prosessi
- Osa 1) Lataa ja asenna Hadoop
- Osa 2) Määritä Hadoop
Edellytyksiä on 2
- Sinulla on oltava asennettuna ja käynnissä Ubuntu
- Sinulla on oltava Java asennettuna.
Osa 1) Lataa ja asenna Hadoop
Vaihe 1) Lisää Hadoop-järjestelmän käyttäjä alla olevan komennon avulla
sudo addgroup hadoop_
sudo adduser --ingroup hadoop_ hduser_
Kirjoita salasanasi, nimesi ja muut tiedot.
HUOMAUTUS: Tässä asennus- ja asennusprosessissa voi olla alla mainittu virhe.
"hduseria ei ole sudoers-tiedostossa. Tästä tapahtumasta ilmoitetaan."
Tämä virhe voidaan ratkaista kirjautumalla pääkäyttäjänä
Suorita komento
sudo adduser hduser_ sudo
Re-login as hduser_
Vaihe 2) Määritä SSH
Ryhmän solmujen hallitsemiseksi Hadoop vaatii SSH-pääsyn
Vaihda ensin käyttäjä ja kirjoita seuraava komento
su - hduser_
Tämä komento luo uuden avaimen.
ssh-keygen -t rsa -P ""
Ota SSH-yhteys paikalliseen koneeseen käyttöön tällä avaimella.
cat $HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys
Testaa nyt SSH-asetukset muodostamalla yhteys paikalliseen isäntään hduser-käyttäjänä.
ssh localhost
Huomaa: Huomaa, että jos näet alla olevan virheen 'ssh localhost' vastauksena, on mahdollista, että SSH ei ole käytettävissä tässä järjestelmässä-
Tämän ratkaisemiseksi -
Poista SSH käyttämällä
sudo apt-get purge openssh-server
On hyvä puhdistaa ennen asennuksen aloittamista
Asenna SSH komento-
sudo apt-get install openssh-server
Vaihe 3) Seuraava vaihe on ladata Hadoop
Valitse Vakaa
Valitse tar.gz-tiedosto (ei tiedosto, jossa on src)
Kun lataus on valmis, siirry tervatiedoston sisältävään hakemistoon
Tulla sisään,
sudo tar xzf hadoop-2.2.0.tar.gz
Nimeä nyt hadoop-2.2.0 uudelleen hadoopiksi
sudo mv hadoop-2.2.0 hadoop
sudo chown -R hduser_:hadoop_ hadoop
Osa 2) Määritä Hadoop
Vaihe 1) Muokkaa ~ / .bashrc- tiedostoa
Lisää seuraavat rivit tiedoston ~ / .bashrc loppuun
#Set HADOOP_HOMEexport HADOOP_HOME=#Set JAVA_HOMEexport JAVA_HOME= # Add bin/ directory of Hadoop to PATHexport PATH=$PATH:$HADOOP_HOME/bin
Lähde nyt tämä ympäristökokoonpano alla olevan komennon avulla
. ~/.bashrc
Vaihe 2) HDFS: ään liittyvät määritykset
Set JAVA_HOME sisällä tiedosto $ HADOOP_HOME / etc / Hadoop / hadoop-env.sh
Kanssa
Kohteessa $ HADOOP_HOME / etc / hadoop / core-site.xml on kaksi parametria, jotka on asetettava
1. 'hadoop.tmp.dir' - Määritetään hakemisto, jota Hadoop käyttää datatiedostojensa tallentamiseen.
2. 'fs.default.name' - Tämä määrittää oletustiedostojärjestelmän.
Voit asettaa nämä parametrit avaamalla core-site.xml
sudo gedit $HADOOP_HOME/etc/hadoop/core-site.xml
Kopioi rivin alapuolelle tunnisteiden
hadoop.tmp.dir /app/hadoop/tmp Parent directory for other temporary directories. fs.defaultFS hdfs://localhost:54310 The name of the default file system.
Siirry hakemistoon $ HADOOP_HOME / etc / Hadoop
Luo nyt hakemisto, joka on mainittu core-site.xml-tiedostossa
sudo mkdir -p
Myönnä hakemistolle käyttöoikeudet
sudo chown -R hduser_:Hadoop_
sudo chmod 750
Vaihe 3) Kartan pienennä kokoonpanoa
Ennen kuin aloitat näillä kokoonpanoilla, anna asettaa HADOOP_HOME-polku
sudo gedit /etc/profile.d/hadoop.sh
Ja Enter
export HADOOP_HOME=/home/guru99/Downloads/Hadoop
Seuraava kirjoita
sudo chmod +x /etc/profile.d/hadoop.sh
Poistu terminaalista ja käynnistä se uudelleen
Kirjoita echo $ HADOOP_HOME. Vahvista polku
Kopioi nyt tiedostot
sudo cp $HADOOP_HOME/etc/hadoop/mapred-site.xml.template $HADOOP_HOME/etc/hadoop/mapred-site.xml
Avaa tiedosto mapred-site.xml
sudo gedit $HADOOP_HOME/etc/hadoop/mapred-site.xml
Lisää asetusten rivien alle tunnisteiden
mapreduce.jobtracker.address localhost:54311 MapReduce job tracker runs at this host and port.
Avaa $ HADOOP_HOME / etc / hadoop / hdfs-site.xml kuten alla,
sudo gedit $HADOOP_HOME/etc/hadoop/hdfs-site.xml
Lisää asetusten alapuolelle tunnisteiden
dfs.replication 1 Default block replication. dfs.datanode.data.dir /home/hduser_/hdfs
Luo yllä olevassa asetuksessa määritetty hakemisto-
sudo mkdir -p
sudo mkdir -p /home/hduser_/hdfs
sudo chown -R hduser_:hadoop_
sudo chown -R hduser_:hadoop_ /home/hduser_/hdfs
sudo chmod 750
sudo chmod 750 /home/hduser_/hdfs
Vaihe 4) Ennen kuin aloitamme Hadoopin ensimmäisen kerran, alusta HDFS käyttämällä alla olevaa komentoa
$HADOOP_HOME/bin/hdfs namenode -format
Vaihe 5) Käynnistä Hadoopin yksisolmuryhmä alla olevan komennon avulla
$HADOOP_HOME/sbin/start-dfs.sh
Yllä olevan komennon tulos
$HADOOP_HOME/sbin/start-yarn.sh
Käyttäen 'JPS' työkalu / komento, ovatko kaikki Hadoop liittyvät prosessit ovat käynnissä vai ei.
Jos Hadoop on käynnistynyt onnistuneesti, JPPS-lähdön pitäisi näyttää NameNode, NodeManager, ResourceManager, SecondaryNameNode, DataNode.
Vaihe 6) Hadoopin lopettaminen
$HADOOP_HOME/sbin/stop-dfs.sh
$HADOOP_HOME/sbin/stop-yarn.sh