Hadoop 2.4.0 – Installation et utilisation seul
Créé le: 2014/04/26 ; Révisé le: 2014/06/20
Dans ce tutoriel, nous allons installer Hadoop 2.4.0 sur Ubuntu Server.
Prérequis:
- Ubuntu server 14.04 64 bits
Étapes:
- Devenir root (00:30)
- Installer les logiciels (00:56)
- apt-get update
- apt-get -y install python-software-properties openjdk-7-jdk
- Créer l’utilisateur et le groupe hadoop (01:33)
- Obtenir Hadoop et l’installer (02:00)
- cd /usr/local
- wget http://apache.mirror.iweb.ca/hadoop/common/hadoop-2.4.0/hadoop-2.4.0.tar.gz
- tar -zxf hadoop-2.4.0.tar.gz
- ln -s hadoop-2.4.0 hadoop
- chown -R hadoop:hadoop hadoop-2.4.0 hadoop
- sudo -i -H -u hadoop
- Configurer (04:12)
- cd /usr/local/hadoop
- vim etc/hadoop/hadoop-env.sh
export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64
export HADOOP_PREFIX=/usr/local/hadoop
# On 64 bits
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_PREFIX/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_PREFIX/lib"
- Essayer la ligne de commande (05:58)
- Tester (06:13)
- mkdir input
- cp etc/hadoop/*.xml input
- bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.4.0.jar grep input output ‘dfs[a-z.]+’
- cat output/*
- rm -rf input output