Download List

프로젝트 설명

HanDic(한딕, ハンディク)은 현대 한국어 텍스트를 형태소로 분석하여 형태소 정보를 부여하기 위한 분석 사전입니다.

HanDic은 형태소분석 엔진 MeCab(메카브)로 이용할 수 있습니다.

분석 사전에 대한 자세한 정보는 MeCab를 이용한 한국어 형태소 분석, HanDic概要, HanDicの詳細情報 등을 참조하여 주시기 바랍니다. 한국어 문서는 준비되는 대로 공개할 예정입니다.

System Requirements

System requirement is not defined

Released at 2015-07-03 10:54
tools k2jamo (3 files Hide)

Release Notes

UTF-8エンコーディングの韓国語テキストのうち,完成型ハングル(U+AC00〜U+D7A3)を字母(U+1100~U+11F9)に分解するためのスクリプトです. 入力例として,完成型ハングルで記述したinput.txtも合わせて配布します.内容は韓国・国立国語院の『標準国語大辞典』(ウェブ版)から,「말01」(ことば)の定義1を引用したものです.

  1. perl k2jamo.pl input.txt

あるいは

  1. echo "한국어 문장" | perl k2jamo.pl
のように使います. Pythonの場合,上記のperl部分を適宜書き換えてください.

UTF-8로 인코딩된 텍스트 중 완성형 한글(U+AC00-U+D7A3)을 자모(U+1100-U+11F9)로 나누어서 출력해 주는 스크립트입니다. 입력의 예로서 완성형 한글로 기술한 input.txt을 함께 배포합니다. 내용은 "표준국어대사전"에서 '말01'의 정의 1을 인용한 것입니다.

  1. perl k2jamo.pl input.txt

혹은

  1. echo "한국어 문장" | perl k2jamo.pl
처럼 사용합니다. Python으로 처리할 경우 위의 perl 부분을 바꾸면 됩니다.

Changelog

[2015/07/04] 最初の公開

[2015/12/14] 標準入力,および引数で指定したファイルのいずれも入力として受け取ることができるように改善.

[2018/05/13] Python3用のスクリプトを追加(Python初心者のため,誤りがあるかもしれません).

[2015/07/04] 첫 공개

[2015/12/14] 표준입력 및 지정된 파일을 입력으로 처리할 수 있도록 개선했음.

[2018/05/13] Python3을 위한 스크립트를 추가했습니다(Python 초보자이기 때문에 오류가 있을 수 있습니다).