研究紹介

我々は、文書やWeb、人とのコミュニケーション等を通じて、様々な情報を獲得し、整理し、また発信しています。このような知的活動を行うには、言葉 (自然言語) が必要不可欠といえます。

計算言語学研究室では、大量の言語情報を活用・処理し、人の知的活動を計算機によって支援する技術の開発を目指しています。このような技術は自然言語処理技術と呼ばれています。本研究室では、その基礎と応用に関する研究を行っています。

研究テーマ

話し言葉の解析

音声対話や音声翻訳、音声検索などの自然言語処理システムにおいて、キーワードベースの処理から脱却した、より豊かな処理を実現するための要素技術として、日本語話し言葉のための解析技術を開発しています。具体的には、話し言葉の解析に求められる、 (1) 非文法的な言語現象に対する解析の頑健性、 (2) 極端に長い文に対する解析の効率性、 (3) 話し手の話速に追従した解析の漸進性、を備えた解析技術の開発に取り組んでいます。

漸進的な係り受け解析
漸進的な係り受け解析
書き言葉の解析

テキスト入力支援や文書作成支援といった言語アプリケーションにおいて高度な言語処理を実現するための要素技術として、書き言葉の読みにくい文を対象とした解析技術を開発しています。文を読みにくくする原因はいくつか存在しますが、これまでに、読みにくい語順や複雑な階層的並列構造をもった文、平仮名文に対する解析技術の開発を推進してます。

法令文の並列構造解析
法令文の並列構造解析
テキスト作成支援

人が即興で生成したテキストは、推敲されていないため、読みにくい文が頻出します。読みやすいテキストを作成するための支援技術として、語順整序手法や自動読点挿入手法などの研究開発を行っています。

係り受け解析との同時実行に基づく語順整序
係り受け解析との同時実行に基づく語順整序
字幕生成 (テキスト提示方式に関する研究)

専門家による講演や解説などから得られる情報は人間の貴重な知的資源と考えられます。これらの情報を聴覚障害者や難聴者にも平等に提供する手段として、リアルタイム字幕生成システムの開発が望まれています。一方、講演文は、話し言葉であり、一文が長い傾向にあるため、たとえ音声認識率が100%であっても、書き起こしテキストをそのまま表示しただけでは読みにくい表示となります。そこで、講演や解説などに対して読みやすい字幕を生成するための要素技術として、改行挿入手法や、話し言葉のテキスト整形手法の研究開発を行っています。

字幕生成における改行挿入
字幕生成における改行挿入
音声対話

対話システムにおいて、単にタスクを達成できるだけでなく、ユーザがより快適に対話を進められるように、システムの応答性を高めることを目指した研究を推進しています。

相槌収集インタフェース
相槌収集インタフェース