Comment installer Apache Hive avec Hadoop sur Centos, Ubuntu et Linuxmint

Comment installer Apache Hive avec Hadoop sur Centos, Ubuntu et Linuxmint

Qu'est-ce qu'Apache Hive ? Le logiciel d'entrepôt de données Apache Hive facilite l'interrogation et la gestion de grands ensembles de données résidant dans un stockage distribué. Hive fournit un mécanisme pour projeter la structure sur ces données et interroger les données à l'aide d'un langage de type SQL appelé HiveQL. En savoir plus sur le site officiel

Ce guide pratique vous aidera à installer Apache Hive sur Centos / Rhel avec Hadoop avec des étapes faciles.

Étape 1: Installez Java et Hadoop

Apache Hive requis Java 6 ou version ultérieure. Nous devons également installer Hadoop avant d'installer Apache Hive sur notre système. Utilisez des liens ci-dessous pour les installer

Étapes pour installer Java sur Centos et Rhel 7/6/5
Étapes pour installer Hadoop sur Linux

Étape 2: Téléchargez l'archive Hive

Après avoir configuré Hadoop avec succès sur votre système Linux. Permet de démarrer la configuration de la ruche. Téléchargez d'abord le dernier code source Hive et extraire les archives à l'aide des commandes suivantes.

# cd / home / hadoop # wget http: // archive.apache.org / dist / hive / hive-0.12.0 / Hive-0.12.0 bac.le goudron.GZ # TAR XZF HIVE-0.12.0 bac.le goudron.gz # mv hive-0.12.0-Bin Hive # Chown -r Hadoop Hive 

Étape 3: Configuration des variables d'environnement

Après avoir extrait le fichier d'archive Hive, passez à l'utilisateur de Hadoop et configurez les variables d'environnement.

# su - hadoop $ export hadoop_home = / home / hadoop / hadoop $ export hadoop_prefix = / home / hadoop / hadoop $ export hive_home = / home / hadoop / hive $ export path = $ hive_home / bin: $ path 

Étape 4: Démarrez la ruche

Avant d'exécuter Hive, nous devons créer / tmp et / utilisateur / ruche / entrepôt Et définissez-les Chmod G + W dans HDFS avant de créer une table dans Hive. Utilisez les commandes suivantes.

$ CD / Home / Hadoop / Hive $ $ HADOOP_HOME / BIN / HADOOP FS -MKDIR / TMP $ $ HADOOP_HOME / BIN / HADOOP FS -MKDIR / User / Hive / Warehouse $ $ HADOOP_HOME / BIN / HADOOP FS -CHMOD G + W / tmp $ $ hadoop_home / bin / hadoop fs -chmod g + avec utilisateur / ruche / entrepôt 

Permet de commencer à utiliser Hive en utilisant la commande suivante.

$ bin / Hive Logging initialisé à l'aide de la configuration en jar: fichier: / home / hadoop / hive / lib / hive-common-0.12.0.pot!/ ruche-log4j.Propriétés Hive> 

Étape 5: Créez une table de démonstration et tester

À ce stade, vous avez réussi à installer Hive. Permet de créer un échantillon de table à l'aide de la commande suivante

Hive> Create Table Demo1 (id int, name String); Ok Temps pris: 6.565 secondes 

Afficher les tables créées avec la commande ci-dessous.

Hive> Afficher les tables; Ok Demo1 Temps pris: 0.231 secondes, récupéré: 1 rangée (s) 

Déposez le tableau en utilisant la commande ci-dessous.

Hive> Drop Table Demo1; Ok Temps pris: 2.393 secondes 

En savoir plus sur les opérations SQL sur Hive sur le site officiel Apache Hive.