自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
論文
概念辞書の類義語と分散表現を利用した教師なし all-words WSD
鈴木 類古宮 嘉那子浅原 正幸佐々木 稔新納 浩幸
著者情報
ジャーナル フリー

2019 年 26 巻 2 号 p. 361-379

詳細
抄録

all-words 語義曖昧性解消(以下 all-words WSD (word sense disambiguation))とは文書中のすべての単語の語義ラベルを付与するタスクである.単語の語義は文脈,すなわち周辺の単語によって推定でき,周辺の単語同士が類似している場合中心の単語同士の語義も類似していると考える.そこで本研究では,対象単語とその類義語群から周辺単語の分散表現を作成し,ユークリッド距離を計算することで対象単語の語義を予測した.また,語義の予測結果をもとにコーパスを語義ラベル列に変換し,語義の分散表現を作成した.語義の分散表現を用いて周辺単語ベクトルを作成し直し,再び語義の予測を行った.コーパスには分類語彙表番号がアノテーションされた『現代日本語書き言葉均衡コーパス』(BCCWJ) を利用した.本研究では分類語彙表における分類番号を語義とし,類義語も分類語彙表から取得した.本研究では,提案手法とランダムベースライン,Pseudo Most Frequent Sense (PMFS),Yarowsky の手法,LDAWN を比較し,提案手法が勝ることを示した.

著者関連情報
© 2019 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top