오픈리파인(OpenRefine, 이전 이름: 구글 리파인/Google Refine, 프리베이스 그리드웍스/Freebase Gridworks)은 데이터 랭글링으로 알려진 데이터 정리 및 다른 포맷으로의 변환을 위한 독립적인 오픈 소스 데스크톱 애플리케이션이다.[3] 스프레드시트 파일 포맷과 동작한다는 점에서 스프레드시트 애플리케이션과 유사하지만 보다 데이터베이스처럼 동작한다.

오픈리파인
개발자프리베이스(최초) 이후 구글(현재 오픈 소스 커뮤니티)
발표일2010년 11월 10일(13년 전)(2010-11-10)
안정화 버전
3.8.2[1] 위키데이터에서 편집하기 / 2024년 7월 8일 (3개월 전)
저장소
프로그래밍 언어자바[2]
플랫폼마이크로소프트 윈도우, 리눅스, macOS
언어영어, 이탈리아어, 중국어, 일본어, 프랑스어
종류
라이선스BSD 허가서
웹사이트openrefine.org/ 위키데이터에서 편집하기

컬럼 밑(column)에 셀이 있는 데이터의 로우(row) 상에서 동작하는데, 이는 마치 관계형 데이터베이스 테이블과 매우 비슷하다. 오픈리파인 프로젝트는 하나의 테이블로 구성된다. 사용자는 필터링 기준을 정의하는 페싯(facet)을 이용하여 표출할 로우를 필터링할 수 있다.(예: 특정 컬럼이 비어있지 않은 로우를 표시) 스프레드시트와 달리 오픈리파인의 대부분의 운영은 보이는 모든 로우상에서 처리된다: 한 컬럼 하의 모든 로우의 모든 셀의 변환,[4] 기존 컬럼 데이터에 기반하여 새 컬럼 생성 등. 데이터셋에서 완료되는 모든 동작은 프로젝트에 저장되며 다른 데이터셋에서 리플레이가 가능하다.

스프레드시트와 달리 셀에 공식이 저장되지 않으나 공식을 사용하여 데이터를 변환할 수 있으며 변환은 한 차례 수행된다.[5] 변환식은 GREL(General Refine Expression Language),[6] 자이썬(예: 파이썬), 클로저로 작성된다.[7]

이 프로그램은 웹 애플리케이션이다. 그러나 웹(SaaS)로 호스팅되지 않으며 로컬 머신에서 다운로드하여 이용이 가능하다. 오픈리파인을 시작할 때 웹 서버를 기동하며 웹 서버에 의해 지원되는 웹 UI를 열기 위해 브라우저를 시작한다.

가져오기, 내보내기를 위한 지원 포맷

편집

가져오기는 다음의 포맷으로 지원한다:[8]

내보내기는 다음 포맷으로 지원한다:[10]

네이티브 포맷의 오픈리파인 프로젝트들은 .tar.gz 아카이브로 내보내기가 가능하다.

각주

편집
  1. “Release 3.8.2”. 2024년 7월 8일. 2024년 7월 24일에 확인함. 
  2. “OpenRefine/OpenRefine - GitHub”. 2017년 6월 25일에 확인함. 
  3. “openrefine.github.com”. 《openrefine.org》. 
  4. “Editing by transforming: Cell Editing wiki page from Refine documentation”. 2012년 4월 18일에 확인함. 
  5. “Comparison with spreadsheet software: Cell Editing wiki page in Refine documentation”. 2012년 4월 18일에 확인함. 
  6. General Refine expression language OpenRefine/OpenRefine Wiki GitHub. Github.com (2013-04-03). Retrieved on 2013-08-16.
  7. “Expressions: Refine documentation”. 2012년 4월 18일에 확인함. 
  8. “Importers: Refine documentation wiki page”. 2012년 4월 18일에 확인함. 
  9. “Changelog for 2.5”. 2012년 4월 18일에 확인함. 
  10. “Exporting: Refine documentation wiki page”. 2012년 4월 18일에 확인함. 

외부 링크

편집