비정형 데이터: 두 판 사이의 차이

내용 삭제됨 내용 추가됨
TedBot (토론 | 기여)
잔글 봇: 틀 이름 및 스타일 정리
편집 요약 없음
1번째 줄:
'''비정형 데이터'''(unstructured data, unstructured information, 비정형 정보), '''비구조화 데이터''', '''비구조적 데이터'''는 미리 정의된 [[데이터 모델]]이 없거나 미리 정의된 방식으로 정리되지 않은 정보를 말한다. 비정형 정보는 일반적으로 [[플레인 텍스트|텍스트]] 중심으로 되어 있으나 날짜, 숫자, 사실과 같은 데이터도 포함할 수 있다. 이로써 변칙과 [[모호]]함이 발생하므로 데이터베이스의 칸 형식의 폼에 저장되거나 문서에 [[말뭉치 주석|주석화된]]([[태그 (정보)|의미적으로 태그된]]) 데이터에 비해 전통적인 프로그램을 사용하여 이해하는 것을 불가능하게 만든다.
 
1998년, [[메릴린치]]는 잠재적으로 이용 가능한 모든 비즈니스 정보 중 약 80~90% 정도가 비정형 형식에서 기원한 것으로 보는 경험 법칙을 언급하였다.{{ref|ML}} 이 경험 법칙은 1차 연구나 양적 연구에 근간을 두지 않지만 그럼에도 일부 받아들여지고 있다.{{ref|Clarabridge}}