的一个工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。本篇文章和大家分享一下Linux系统安装Hive的教程,有需要的朋友可以参考一下。
Hive简介:
-
Facebook为了解决海量日志数据的分析而开发了Hive,后来开源给了Apache软件基金会。
-
Hive是一种用类SQL语句来协助读写、管理那些存储在分布式存储系统上大数据集的数据仓库软件。
-
Hive的数据是存储在HDFS上的。Hive中的库和表可以看作是对HDFS上数据做的一个映射。所以Hive必须是运行在一个Hadoop集群上的。
Linux系统安装Hive详细步骤:
1) 解压Hive文件:
tar -zxf /opt/soft/apache-hive-2.1.1-bin.tar.gz -C /opt/
2) 修改名称: mv apache-hive-2.1.1-bin/ hive
3) 添加环境变量:vim /etc/profile.d/hadoop-ect.sh
export HIVE_HOME=/opt/hive
export PATH=HIVE_HOME/bin
使环境变量生效
source /etc/profile.d/hadoop-etc.sh
4) 进入cd/opt/hive/conf/修改文件
cp hive-env.sh.template hive-env.sh
cp hive-default.xml.template hive-site.xml
5) 修改$HIVE_HOME/conf的hive-env.sh,增加以下三行
export JAVA_HOME=/opt/jdk
export HADOOP_HOME=/opt/hadoop
export HIVE_HOME=/opt/hive
6) 修改$HIVE_HOME/conf/hive-site.xml
7) 拷贝mysql驱动到/opt/hive/lib/目录
cp /opt/soft/mysql-connector-java-5.1.39.jar /opt/hive/lib/
8) 初始化hive元数据仓库
执行目录$HIVE_HOME/bin
./schematool -initSchema -dbType mysql -userName root -passWord 123456
9) 启动hive
Hive] bin/hive –hiveconf hive.cli.print.current.db=true
以上就是为各位朋友分享的相关内容。想要了解更多Linux相关知识记得关注公众号“良许Linux”,或扫描下方二维码进行关注,更多等着你!