아파치 하이브

하둡에서 동작하는 데이터 웨어하우스 인프라 구조

아파치 하이브(Apache Hive)는 하둡에서 동작하는 데이터 웨어하우스(Data Warehouse) 인프라 구조로서 데이터 요약, 질의 및 분석 기능을 제공한다.[3] 초기에는 페이스북에서 개발되었지만 넷플릭스 등과 같은 회사에서 사용되고 있으며 개발되고 있다.[4][5]

아파치 하이브
Apache Hive
개발자아파치 소프트웨어 재단
발표일2010년 10월 1일(13년 전)(2010-10-01)[1]
안정화 버전
3.1.3 / 2022년 4월 8일(23개월 전)(2022-04-08)[2]
미리보기 버전
4.0.0-alpha-2 / 2022년 11월 16일(16개월 전)(2022-11-16)[2]
저장소
프로그래밍 언어자바
운영 체제크로스 플랫폼
라이선스아파치 라이선스 2.0
상태지원 중
웹사이트hive.apache.org

아파치 하이브는 아파치 HDFS이나 아파치 HBase와 같은 데이터 저장 시스템에 저장되어 있는 대용량 데이터 집합들을 분석한다. HiveQL 이라고 불리는 SQL같은 언어를 제공하며 맵리듀스의 모든 기능을 지원한다. 쿼리를 빠르게 하기 위해 비트맵 인덱스를 포함하여 인덱스 기능을 제공한다.[6]

기본적으로 하이브는 메타데이터를 내장된 아파치 더비(Derby) 데이터 베이스안에 저장한다. 그렇지만 MySQL과 같은 다른 서버/클라이언트 데이터베이스를 사용할 수 있는 선택권을 제공한다.[7] 현재 TEXTFILE, SEQUENCEFILE, ORC 그리고 RCFILE등 4개의 파일 포맷을 지원한다.[8][9]

같이 보기 편집

참조 편집

  1. “Release release-1.0.0 · apache/Hive”. 《GitHub》. 
  2. “Apache Hive - Downloads”. 2022년 11월 21일에 확인함. 
  3. Venner, Jason (2009). 《Pro Hadoop》. Apress. ISBN 978-1-4302-1942-2. 
  4. Use Case Study of Hive/Hadoop
  5. OSCON Data 2011, Adrian Cockcroft, "Data Flow at Netflix" - 유튜브
  6. Working with Students to Improve Indexing in Apache Hive
  7. Lam, Chuck (2010). 《Hadoop in Action》. Manning Publications. ISBN 1-935182-19-6. 
  8. “Facebook's Petabyte Scale Data Warehouse using Hive and Hadoop” (PDF). 2011년 7월 28일에 원본 문서 (PDF)에서 보존된 문서. 2011년 9월 9일에 확인함. 
  9. Yongqiang He, Rubao Lee, Yin Huai, Zheng Shao, Namit Jain, Xiaodong Zhang and Zhiwei Xu. “RCFile: A Fast and Space-efficient Data Placement Structure in MapReduce-based Warehouse Systems” (PDF). 

외부 링크 편집