4. Senの使用法
2005.09.28 株式会社四次元データ 宮澤了祐
4.1. 簡単なサンプル
この章ではSen単体での使用法を解説します。
すでにSenをインストールし、辞書を作成しているとします。
Senのインストールにはこちらを参考にしてください。
クラスパスにsen.jar
およびcommons-logging.jar
を追加しておきます。
import java.io.IOException; import net.java.sen.StringTagger; import net.java.sen.Token; public class SenSample { public static void main(String[] args) throws IllegalArgumentException, IOException { StringTagger tagger = StringTagger.getInstance(); String str = "今日は良い天気です。"; Token[] token = tagger.analyze(str); for(int i=0; i<token.length; i++){ System.out.println(token[i].getBasicString() +"("+token[i].getTermInfo()+")"); } } }
net.java.sen.StringTagerは、java.lang.Stringを使用した文字列を形態素解析するクラスです。 StringTaggerのanalyze(String)メソッドによって、形態素解析を行います。
net.java.sen.Tokenは形態素の情報を保持するクラスです。 TokenのgetBasicString()で、基本形を出力できます。また語句の詳しい説明はToken.getTermInfo()で表示出来ます。
Senを利用したプログラムを実行するには、Senのインストールされているフォルダを環境変数sen.homeに設定する必要があります。
System.setProperty("sen.home","c:/sen");をプログラムの先頭に含めるか、またはプログラム実行時に-Dオプションで次の用に指定してください。
$ java -Dsen.home=c:/sen
次のように出力されれば、成功です。
今日(名詞,副詞可能,*,*,*,*,今日,キョウ,キョー) は(助詞,係助詞,*,*,*,*,は,ハ,ワ) 良い(形容詞,自立,*,*,形容詞・アウオ段,基本形,良い,ヨイ,ヨイ) 天気(名詞,一般,*,*,*,*,天気,テンキ,テンキ) です(助動詞,*,*,*,特殊・デス,未然形,です,デショ,デショ) 。(記号,句点,*,*,*,*,。,。,。)