理研におけるプロジェクト:ダウンロード

理研ワープロ操作対話音声コーパス

 2001年6月から2002年12月にかけて日常的なコンピュータの使用にかかわる被験者実験を行い、対話音声データを収集しました。実験は、ワープロ使用に関するユーザとインストラクターとの質疑応答、およびコンピュータを使ったユーザの文書作成の支援です。実験の内容は、回ごとに少しずつ異なりますが、質疑応答型と依頼応対型とに分けることができます。質疑応答型においては、ユーザが自ら文書を作成し、操作方法に関してインストラクターに質問しました。依頼応対型では、ユーザは直接文書を作成せずに文書の内容に関する指示を秘書に与えて文書を作成してもらいました。  これらの実験で収集された対話音声データを基に、書き起こしコーパスと形態素解析情報付きデータベースを作成しました(高橋他2004)。この音声データ、書き起こしコーパス、形態素解析情報付きデータベースは、2007年9月より音声資源コンソーシアムから入手していただけるようになりました。

LBISシステミックツール

 LBISシステミックツールは、選択体系機能言語学に基づく日本語テキスト理解・生成のための資源開発支援ツールです。

コーダー
選択体系網と具現規則を参照しながら手作業でテキストの分析(コーディング)を行うためのツール
注釈付きテキストツール
セミオティックベースを使ってテキストの分析を行い、結果の出力や表示を行うツール
KWICコンコーダンサー
テキスト分析の結果を複数個読み込んで条件検索を行ったり、その結果を並べ替えたりするためのツール
概念辞書エディタ
セミオティックベース内の概念辞書データを作成するためのツール

 日本語テキストの分析結果は注釈付きテキストと呼ばれる一般的なデータ構造で表現され、また、各ツールはセミオティックベースのデータが完全に揃っていなくても動作可能であることから、セミオティックベースの開発や応用に従事する方はもちろん、一般の選択体系機能言語学・日本語学、自然言語処理研究を行う研究者にとっても本ツールは有用であると思われます。


トップ   編集 凍結解除 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2021-10-08 (金) 11:02:10