Hive?

Hadoop의 리포팅 및 분석을 위한 Database라고 보면 됩니다.
Hive는 Hadoop 상에 있으며 데이터는 HDFS에 저장됩니다.
그리고, 사용자가 작성한 Hive QL(SQL Query)을 Compile 하여 Hadoop Cluster에 MR(Map Reduce) 작업을 실행 하도록 합니다.
더 자세한건.. 검색 하길 권장.
– Hive Architecture

Hive Architecture

 

당연한거지만.. Hive를 설치 하기 전에 hadoop이 설치 되어 있어야 합니다.

1. Hive 설치
아래 주소에서 Hive를 다운로드 합니다.

http://www.apache.org/dyn/closer.cgi/hive/

[root@ruo91 ~]# cd /usr/local
[root@ruo91 ~]# wget http://mirror.apache-kr.org/hive/stable/hive-0.11.0.tar.gz
[root@ruo91 ~]# tar xzvf hive-0.11.0.tar.gz
[root@ruo91 ~]# mv hive-0.11.0 hive

2. Hive 환경 변수 등록

[root@ruo91 ~]# echo ‘export HIVE_HOME=/usr/local/hive’ >> ~/.bash_profile
[root@ruo91 ~]# echo ‘export PATH=$HIVE_HOME/bin:$PATH’ >> ~/.bash_profile

설정 적용

[root@ruo91 ~]# source ~/.bash_profile

3. Hive 실행
Hadoop을 실행 합니다.

[root@ruo91 ~]# start-all.sh

Hive에서 사용할 HDFS의 디렉토리를 생성 합니다.

[root@ruo91 ~]# hadoop fs -mkdir /tmp
[root@ruo91 ~]# hadoop fs -mkdir -p /user/hive/warehouse
[root@ruo91 ~]# hadoop fs -chmod g+w /tmp
[root@ruo91 ~]# hadoop fs -chmod g+w /user/hive/warehouse

Hive를 실행 합니다.

[root@ruo91 ~]# hive

Logging initialized using configuration in jar:file:/opt/hive/lib/hive-common-0.11.0.jar!/hive-log4j.properties
Hive history file=/tmp/root/hive_job_log_root_22942@ruo91.yongbok.net_201310162232_33999657.txt
hive>

정상 동작 하는지 확인 해봅니다.

hive> show tables;
OK
Time taken: 2.432 seconds

참고