벡터 공간 모델: 두 판 사이의 차이

내용 삭제됨 내용 추가됨
잔글 위키링크를 수정
잔글 →‎무료 오픈 소스 소프트웨어: 위키링크를 추가
81번째 줄:
 
===무료 오픈 소스 소프트웨어===
* [[루씬|Apache Lucene]]: 전체가 자바로 작성된 고성능 다기능 텍스트 검색 엔진 라이브러리
* [https://web.archive.org/web/20080828220200/http://semanticvectors.googlecode.com/ SemanticVectors]: Apache Lucene으로 생성한 단어-문서 매트릭스에 랜덤 프로젝션 알고리즘을 적용해 구현한 의미 벡터 색인([[잠재 의미 분석]]과 유사)
* Gensim: 벡터 공간 모델링을 위한 Python+[[NumPy]] 프레임워크. [[TF-IDF]], [[잠재 의미 색인]], [[국지성 민감 해싱]] 및 [[잠재 디리클레 할당]]을 위한 점증적(메모리-효율적) 알고리즘을 포함함