2019-04-28から1日間の記事一覧

ChaSen(茶筌)の概要

ChaSen(茶筌)は、奈良先端科学技術大学院大学の松本研究室で開発された、入力文を単語単位に分割し品詞を付与するツールである。JUMANをベースに開発された。JUMANでは、形態素の連接コストを人手で定義していたが、茶筌では統計処理(HMM)によって自動的に連…

JUMANの概要

JUMANは、京都大学の黒橋・河原研究室で開発された、形態素解析システムだ。 UNIX系や、Windows(試験版。一部機能に制限あり)で動作するC言語で書かれたプログラムだ。2019年4月時点の最新バージョンは7.0だ。 解析に使用する辞書は、基本的な単語については…