Comment installer Apache Hive avec Hadoop sur Centos, Ubuntu et Linuxmint
- 1690
- 183
- Rayan Lefebvre
Qu'est-ce qu'Apache Hive ? Le logiciel d'entrepôt de données Apache Hive facilite l'interrogation et la gestion de grands ensembles de données résidant dans un stockage distribué. Hive fournit un mécanisme pour projeter la structure sur ces données et interroger les données à l'aide d'un langage de type SQL appelé HiveQL. En savoir plus sur le site officiel
Ce guide pratique vous aidera à installer Apache Hive sur Centos / Rhel avec Hadoop avec des étapes faciles.
Étape 1: Installez Java et Hadoop
Apache Hive requis Java 6 ou version ultérieure. Nous devons également installer Hadoop avant d'installer Apache Hive sur notre système. Utilisez des liens ci-dessous pour les installer
Étapes pour installer Java sur Centos et Rhel 7/6/5
Étapes pour installer Hadoop sur Linux
Étape 2: Téléchargez l'archive Hive
Après avoir configuré Hadoop avec succès sur votre système Linux. Permet de démarrer la configuration de la ruche. Téléchargez d'abord le dernier code source Hive et extraire les archives à l'aide des commandes suivantes.
# cd / home / hadoop # wget http: // archive.apache.org / dist / hive / hive-0.12.0 / Hive-0.12.0 bac.le goudron.GZ # TAR XZF HIVE-0.12.0 bac.le goudron.gz # mv hive-0.12.0-Bin Hive # Chown -r Hadoop Hive
Étape 3: Configuration des variables d'environnement
Après avoir extrait le fichier d'archive Hive, passez à l'utilisateur de Hadoop et configurez les variables d'environnement.
# su - hadoop $ export hadoop_home = / home / hadoop / hadoop $ export hadoop_prefix = / home / hadoop / hadoop $ export hive_home = / home / hadoop / hive $ export path = $ hive_home / bin: $ path
Étape 4: Démarrez la ruche
Avant d'exécuter Hive, nous devons créer / tmp et / utilisateur / ruche / entrepôt Et définissez-les Chmod G + W dans HDFS avant de créer une table dans Hive. Utilisez les commandes suivantes.
$ CD / Home / Hadoop / Hive $ $ HADOOP_HOME / BIN / HADOOP FS -MKDIR / TMP $ $ HADOOP_HOME / BIN / HADOOP FS -MKDIR / User / Hive / Warehouse $ $ HADOOP_HOME / BIN / HADOOP FS -CHMOD G + W / tmp $ $ hadoop_home / bin / hadoop fs -chmod g + avec utilisateur / ruche / entrepôt
Permet de commencer à utiliser Hive en utilisant la commande suivante.
$ bin / Hive Logging initialisé à l'aide de la configuration en jar: fichier: / home / hadoop / hive / lib / hive-common-0.12.0.pot!/ ruche-log4j.Propriétés Hive>
Étape 5: Créez une table de démonstration et tester
À ce stade, vous avez réussi à installer Hive. Permet de créer un échantillon de table à l'aide de la commande suivante
Hive> Create Table Demo1 (id int, name String); Ok Temps pris: 6.565 secondes
Afficher les tables créées avec la commande ci-dessous.
Hive> Afficher les tables; Ok Demo1 Temps pris: 0.231 secondes, récupéré: 1 rangée (s)
Déposez le tableau en utilisant la commande ci-dessous.
Hive> Drop Table Demo1; Ok Temps pris: 2.393 secondes
En savoir plus sur les opérations SQL sur Hive sur le site officiel Apache Hive.
- « Fedora 20 Sortie - Quoi de neuf dans Fedora 20
- Installez ELGG (plateforme de réseautage social) sur Centos Rhel 6/5 »