Comment installer Apache Hive avec Hadoop sur Centos, Ubuntu et Linuxmint

1754
183
Rayan Lefebvre

Qu'est-ce qu'Apache Hive ? Le logiciel d'entrepôt de données Apache Hive facilite l'interrogation et la gestion de grands ensembles de données résidant dans un stockage distribué. Hive fournit un mécanisme pour projeter la structure sur ces données et interroger les données à l'aide d'un langage de type SQL appelé HiveQL. En savoir plus sur le site officiel

Ce guide pratique vous aidera à installer Apache Hive sur Centos / Rhel avec Hadoop avec des étapes faciles.

Étape 1: Installez Java et Hadoop

Apache Hive requis Java 6 ou version ultérieure. Nous devons également installer Hadoop avant d'installer Apache Hive sur notre système. Utilisez des liens ci-dessous pour les installer

Étapes pour installer Java sur Centos et Rhel 7/6/5
Étapes pour installer Hadoop sur Linux

Étape 2: Téléchargez l'archive Hive

Après avoir configuré Hadoop avec succès sur votre système Linux. Permet de démarrer la configuration de la ruche. Téléchargez d'abord le dernier code source Hive et extraire les archives à l'aide des commandes suivantes.

# cd / home / hadoop # wget http: // archive.apache.org / dist / hive / hive-0.12.0 / Hive-0.12.0 bac.le goudron.GZ # TAR XZF HIVE-0.12.0 bac.le goudron.gz # mv hive-0.12.0-Bin Hive # Chown -r Hadoop Hive

Étape 3: Configuration des variables d'environnement

Après avoir extrait le fichier d'archive Hive, passez à l'utilisateur de Hadoop et configurez les variables d'environnement.

# su - hadoop $ export hadoop_home = / home / hadoop / hadoop $ export hadoop_prefix = / home / hadoop / hadoop $ export hive_home = / home / hadoop / hive $ export path = $ hive_home / bin: $ path

Étape 4: Démarrez la ruche

Avant d'exécuter Hive, nous devons créer / tmp et / utilisateur / ruche / entrepôt Et définissez-les Chmod G + W dans HDFS avant de créer une table dans Hive. Utilisez les commandes suivantes.

$ CD / Home / Hadoop / Hive $ $ HADOOP_HOME / BIN / HADOOP FS -MKDIR / TMP $ $ HADOOP_HOME / BIN / HADOOP FS -MKDIR / User / Hive / Warehouse $ $ HADOOP_HOME / BIN / HADOOP FS -CHMOD G + W / tmp $ $ hadoop_home / bin / hadoop fs -chmod g + avec utilisateur / ruche / entrepôt

Permet de commencer à utiliser Hive en utilisant la commande suivante.

$ bin / Hive Logging initialisé à l'aide de la configuration en jar: fichier: / home / hadoop / hive / lib / hive-common-0.12.0.pot!/ ruche-log4j.Propriétés Hive>

Étape 5: Créez une table de démonstration et tester

À ce stade, vous avez réussi à installer Hive. Permet de créer un échantillon de table à l'aide de la commande suivante

Hive> Create Table Demo1 (id int, name String); Ok Temps pris: 6.565 secondes

Afficher les tables créées avec la commande ci-dessous.

Hive> Afficher les tables; Ok Demo1 Temps pris: 0.231 secondes, récupéré: 1 rangée (s)

Déposez le tableau en utilisant la commande ci-dessous.

Hive> Drop Table Demo1; Ok Temps pris: 2.393 secondes

En savoir plus sur les opérations SQL sur Hive sur le site officiel Apache Hive.

Comment installer Apache Hive avec Hadoop sur Centos, Ubuntu et Linuxmint

Étape 1: Installez Java et Hadoop

Étape 2: Téléchargez l'archive Hive

Étape 3: Configuration des variables d'environnement

Étape 4: Démarrez la ruche

Étape 5: Créez une table de démonstration et tester

Meilleurs articles

11 meilleures applications de prise de notes open source pour Linux

Une application de prise de notes vous permet d'enregistrer des notes en déplacement, que vous soyez...

Installez automatiquement les correctifs de sécurité ou les mises à jour sur CentOS et RHEL

L'un des besoins graves d'un système Linux est d'être tenu à jour avec les derniers correctifs ou mi...