クラウドソーシングに基づく聴覚障害者による文字情報保障システムの開発 張 建偉,白石優旗 筑波技術大学 産業技術学部 産業情報学科 キーワード:クラウドソーシング,聴覚障害者,文字情報保障 1.はじめに 聴覚障害者と健聴者の円滑なコミュニケーションの実現のためには,音声,文字,手話の3種の異なるモダリティ間の変換が必要になる。一般に,聴覚障害者は音声を扱うことはできず,また,手話が得意な者と文字が得意な者とに分類できる。したがって,特定の伝達手段による情報の獲得に支障がある人々に,代替手段を用いて情報の獲得の支援を行う手法である「情報保障」が必要となる。一方で,計算機ネットワークを通じて不特定多数の人々(ワーカ)に業務(タスク)を委託するクラウドソーシングと呼ばれる新しい仕組みが注目されている。これにより,多くの非専門家が協力することが可能となり,これまでは実現の難しかった種類の情報保障が実現される可能性があり注目されている[1]。本研究では,手話(手話言語) → 文字(日本語)の変換に着目し,手話講演を文字情報にリアルタイムで変換するクラウドソーシング型情報保障システム(図1)を提案する。本稿では,提案する情報保障システムの概要について説明し,評価実験の概要を報告する。詳細は参考文献[2]を参照してもらいたい。 図1 情報保障の様子 2.提案システム 本システムの実現のためには,話者が連続的に発する文を複数のワーカで協力して通訳する必要性から,(1)タスクの分割,(2)タスクの割当,(3)ワーカの役割 を適切に設定するという課題がある。 本システムは,手話から文字への変換(通訳)を対象としたものであり,意味の区切りを考慮してタスクを分割する必要があると考えられる。そこで,我々はタスク分割の手法として,第3者カウンタ方式 講演者や通訳者とは異なる第3者がタスクを分割する方式自動カウンタ方式 複数通訳者の判断を統合することよりタスクが自動で分割される方式の2種類の方式による情報保障システムを提案する。ここで,カウンタとは,タスクを分割する毎に1増加する整数のことであり,一つのタスクに対して一意の整数が対応する。提案システムのタスク割当手法は以下の通りである。- 多数のワーカを複数のグループに分割する。- 各グループにタスクを順に割り当てる。- グループ内のすべてのワーカが当該タスクを実行する。タスク割り当ての様子を図2に示す。 また,通訳が追いつけない場合や,通訳ミスや入力ミス等を修正する役割として,校閲・調整係を設定する。以上のワーカの役割をまとめたものを図3に示す。 図2 タスクの割当 図3 ワーカの役割 3.実験 3.1 実験概要最初に,実験1として,実用的な通訳レベルを確保するために必要な適切な設定を明らかにする。次に,実験2として,任意のカウンタ係に対して,統一的に適切な区切りを指定可能か検証する。最後に,実験3として,これまでの実験の結果に基づき,実際に手話から文字への通訳を行い,通訳品質を定量的に評価することで,本システムの実用可能性について検証する。なお,聴覚障害者が日常会話で使用する言語は,(1)日本語対応手話(対応手話,手指日本語)(2)中間手話(混成手話)(3)日本手話の3種類に分類できる。そこで,本実験では,これら3種の手話に対してそれぞれ実験を行う。 3.2 実験設定実験1の設定は以下の通りである。【被験者】講演者3名(T1:日本語対応手話,T2:中間手話,T3:日本手話各1名),通訳者10〜12名(全員手話がわかる大学生)とする。【講演内容】NHKやさしいニュースの記事を各講演者に3つずつ,計9つ選定する。【実験方法】文の区切り箇所は講演者が決定し,1区切りの講演の長さ,1区切りの通訳にかかった時間,通訳結果を採取する。その際,区切りの箇所は文の句読点と文の意味の区切りの2種類に対して実験する。【評価方法】通訳品質は,講演者自身により,すべての通訳区切りに対して,7段階(1: 低い,7: 高い)で評価を行う。【解析方法】「1区切りの長さ」「1区切りの箇所(句読点か意味)」「通訳時間」「通訳の品質」の相関を調べる。以上により,実用レベルの通訳に必要な「区切りの方法」「必要グループ数」「1グループあたりの必要ワーカ数」を明らかにする。 実験2の設定では,被験者について,講演者3名とカウンタ係5名とする。講演内容について,ニュース記事以外に,講演者自身の内容を各講演者1回ずつ実施する。実験方法について,カウンタ係5名に対して,すべての区切り時間を採取する。評価・解析方法について,カウンタ係5名に対して,区切り箇所とそのばらつきを評価する。実験3では,実験1,2の解析結果に基づき,模擬講演に対して文字への通訳を開発システムを用いて実際に行う。通訳品質を定量的に評価,検証することで,本システムの実用可能性を示す。 3.3 実験結果実験1で,中間手話(T2)と日本手話(T3)において,句読点の区切りよりも,意味の区切りの方が通訳品質が高くなることが確認された。「意味の切れ目で,できるだけ短く区切る」方針が最適であるという結果が得られた。また,標準以上の通訳品質を確保した上で解析を行った結果,T1,T2の必要グループ数は5,T3の必要グループ数は6と推定された。さらに,T1,T2の必要グループ内ワーカ数は3,T3の必要グループ内ワーカ数は4と推定された。実験2により,区切りの方針を指定することで,通訳者に混乱を及ばさない程度の区切りの一致を実現できていると考えられる。 実験3により,すべての話者に対して,ニュース記事よりも講演者自身の内容を講演した場合の方が通訳結果の品質が良い傾向があることがわかった。また,T1,T2の通訳品質がほぼ6以上であることから,日本語対応手話と中間手話において講演者自身の内容を講演した場合においては,実用レベルの翻訳結果が得られることを確認できた。 4.まとめと今後の課題 本研究は,手話講演を文字情報にリアルタイムで変換するクラウドソーシング型情報保障システムを提案した。また,評価実験により,実利用のための課題を明らかにするとともに,実用可能性を示した。今後は,自動カウンタ方式について解析を行う予定である。 参考文献 [1] 高木啓伸,井床利生,斉藤新,小林正朋.クラウドアクセシビリティ ─クラウドソーシングによる障害者支援─.人工知能学会誌,Vol. 29, No. 1, pp. 41-46, 2014. [2] 白石優旗,張建偉,熊井克仁,森嶋厚行.クラウドソーシングに基づく聴覚障害者によるリアルタイム文字情報保障手法の検討.DEIM 2016,2016年2月.