外字について3 所障害者高等教育研究支援センター 障害者基礎教育研究部(視覚障害系) 村上 佳久 要旨:Windows Vistaの登場は文字コード問題を引き起こしたが、外字の問題は、文字コードの問題と字形の問題と合成音声利用上の問題の様々な問題が交錯している。ここでは視覚障害者の利用率の高いWindows XpやVistaの外字環境について合成音声の問題を含めてその課題を調査・検討する。 キーワード:視覚障害補償,合成音声,Windows Vista,Windows Xp 1.はじめに  2006年11月にWindows Vistaが登場したが、Windowsとしては、搭載文字に劇的な変化があった。Unicodeを全面的に採用し、さらに文字の字形をJIS2004対応とした。印刷や出版・編集業界で事実上標準とも考えられているAdobe-Japan 1-6と異なる文字コード体系の登場は印刷や出版現場大きな混乱をもたらしたと言われている。  ここでは、視覚障害を有するユーザの多くがWindows Xpを使い続けている現状でWindows Vistaに搭載されている文字コードやフォントの問題、視覚障害者が利用する画面読み合成音声ソフトとの関連、さらに教科書とパソコンやワープロとの関係を元に文字コードの問題、特に外字と呼ばれる分野について検討する。 2.Windows Vistaの文字コード  2006年11月にリリースされたWindows Vistaは、文字コードとグリフセットがAdobe-Japan 1-5以上となると共に、JIS X 0213:2004をサポートし、さらに文字字形がJIS2004をサポートすることとなった。これらは、MSゴシック・MS明朝と新しく搭載されたメイリオに採用されている。  同じ字形はMacOS X Leopardでもサポートされた。このMacOS X Leopardでは標準フォントとして「ヒラギノ」が採用されているが、ヒラギノもバージョンが8.0となりJIS2004の字形対応となった。今後、Adobe-Japan 1-5もAdobe-Japan 1-5n(JIS2004字形対応)として変更される可能性があり、場合によってはJIS90字形とJIS2004字形の2つがサポートされる可能性もある。Windows VistaでもJIS90字形を選択することも可能である。問題なのは、Adobe-Japan 1-5対応とされているが実際には21,000字以上の文字を有している。Adobe-Japan 1-5は20,000文字程度なので文字数が異なる。  したがって、Windows Vista対応の文字フォントを利用した場合、互換性についての問題が発生することは避けられない。さらに字形の問題があるので、JIS2004字形が定着すると思われる2008年頃までは、文字コードと文字字形の混乱は避けられないと思われる。 3.合成音声で利用する外字  近年、視覚障害者が利用する画面読み合成音声ソフトウェアに利用される合成音声エンジンは、この2、3年程度で急速に進化を遂げており、日本語だけでなく英語などでもその進歩は目覚ましいものがある。一般に合成音声はTTS(Text-To-Speech)と呼ばれ、英語の合成音声などは一般の人が聞けばほとんどNative Speaker(英語を母国語とする人たちの発音)に迫る音質を有する製品もある。また、この種の多くのソフトウェアで、単に音声を発音するだけでなく、WAVデータとして保存可能なものがあり、デジタルデータとして教育的活用の大きいものである。実際に外国語教育メディア学会などの全国研究大会でもこの種のTTSを積極的に教育に活用する発表が見受けられる。 3.1 画面読み合成音声ソフトウェア  近年、視覚障害者向けに販売されている画面読み合成音声ソフトウェアを調査すると、以下のようなものがある。 ①PC-Taker Vista(Pentax VoiceText) ②VDMW500(Pentax VoiceText) ③PC-Talker Xp(IBM ProTalker97, Pentax VoiceText) ④VDMW300(IBM ProTalker97, Pentax VoiceText) ⑤FocusTalk 2.0(ANIMO FineSpeech2) ⑥FocusTalk 1.0(ANIMO FineSpeech) ⑦XpNavo(Pentax VoiceText) ⑧JAWS 8.0(クリエートシステムD-Talker) ⑨95Reader Ver6.0(Ricoh 合成音声エンジン) ⑩CatWalk(音声エンジンなし) ⑪MM-Talker Ver2(音声エンジンなし)  この中で、12589がWindowsVistaに対応しており、Windows Xp対応版が③④⑤⑥⑦⑧⑨⑩⑪となる。①と②、③と④は詳細読みの部分が異なるだけでほぼ同一の製品である。⑩⑪は、画面解析部分のみの販売で、合成音声エンジン部分は別途購入する必要がある。  視覚障害者が利用する際に問題となるのは、鍼師・灸師・あん摩・マッサージ・指圧師などのいわゆる三療と呼ばれる職種で利用されることの多い、東洋医学関連の文字である。  Windows 2000頃までは、フォントの環境に問題があり、東洋医学関連の文字はShift-JIS以外の文字、いわゆる外字として取り扱われてきた。Windows XpになるとOpenTypeFontの登場により、Adobe-Japan 1-4や1-5のフォントが取り扱えるようになり、フォント環境は著しく改善され、東洋医学関連の文字のほとんどが扱えるようになった。しかし問題は、画面読み合成音声ソフトウェアとの関連である。  画面読み合成音声ソフトウェアに搭載されている合成音声エンジンのほとんどが、Shift-JISの文字コード体系であり、文字コードがUnicode準拠のAdobe-Japan1-4以上に対応していないことである。つまり、画面に文字は表されても、画面読み合成音声ソフトウェアは、表示されている文字を読まない(読めない)現象が起こる。  読まないというのは、合成音声が「シフトジスF050」と文字コードを発音したり、全くの無音であること言う。つまり、Shift-JISで規定された約9000語以上の文字に関して合成音声エンジンが対応できない。 3.2 合成音声エンジン  ここでは、現在利用されている合成音声エンジンについて調査を行った。 ①Pentax VoiceText合成音声エンジン  株式会社ボイスウェア(本社:大韓民国ソウル市)が開発し、その後Pentaxが同社をPentax Voiceware Co. Ltd.として子会社化し、合成音声エンジンを販売している。現在、日本の合成音声エンジンで高品位のものとしては、比較的数多く利用されており、多くの画面読み合成音声ソフトウェアに利用されている。内部ではUnicodeを採用しているが日本語処理はShift-JISで行っており外字数も1880字となる。 ②Animo FineSpeech 1,2音声合成エンジン  「コーパスベース波形生成アルゴリズム」を採用し、格段になめらかで自然な合成音声生成する。約16万語におよぶ単語辞書を標準装備して高品位な音声を出力する。Shift-JIS文字コード体系で1880字の外字領域に外字登録が可能である。 ③IBM ProTalker 97合成音声エンジン  IBM製の合成音声エンジンとして従来から多くの画面読み合成音声ソフトウェアに利用されてきた非常に実績のあるソフトウェア。非常に枯れたシステムであるが既に開発が終了しており、最近では新しい合成音声エンジンに取って代わられている。Shift-JISで文字コード体系で1880字の外字領域に外字登録が可能である。 ④Ricoh合成音声エンジン  Ricoh製の合成音声エンジンは、画面読み合成音声ソフトウェアの95Readerシリーズに利用されており、ProTalker97と共に非常に実績のあるソフトウェアで利用者も多い。しかし、ProTalker97同様に既に開発が終了しており、最近では新しい合成音声エンジンに取って代わられている。Shift-JISで文字コード体系で940字の外字領域に外字登録が可能である。 ⑤クリエートシステム開発 ドキュメントトーカPlus  クリエートシステム開発で開発された合成音声エンジン。Windows Vistaにも対応。また、Linux版やUnix版・Mac版なども販売されている。やや音質の劣る部分はあるが汎用性が高く、利用者も多い。日本語処理の文字コードとしてはShift-JISを利用している。 NTT関連の合成音声エンジン ⑥NTT IT FutureVoice音声合成エンジン  NTTサイバースペース研究所開発のCralinet合成音声エンジン搭載し、従来の音声合成技術と比べ、大規模な音声データベースを用いることで肉声に限りなく近い音声品質を実現している。音質的にPentax VoiceTextに対応できる製品であるが、設定価格が非常に高価である。 ⑦NTT IT HiperVoice音声合成エンジン  NTTサイバースペース研究所開発のFLUET合成音声エンジンを搭載し、約6000個の音声素片を用意し、前後の音韻の連鎖に応じて適切な波形接続を行うことで、滑らかで自然な合成音声を実現している。IBM ProTalker97よりも音質はよいが、Pentax VoiceTextやFutureVoiceに比べると音質は数段劣る。 ⑧NTT IT FineVoice音声合成エンジン  NTTサイバースペース研究所開発のFinalFluet合成音声エンジンを搭載し、女声約9万、男声約2万におよぶ多種多様な音声断片を用いた独自のハイブリッド合成方式によって、肉声品質に近い高品質な合成音声を実現している。安価であるが、音質はHiperVoiceよりも劣る。 ⑨日立ビジネスソリューション ボイスソムリエ  日立製作所中央研究所開発の合成音声エンジンを搭載し、任天堂DSなどにも搭載されている。音声素片データベースを利用した高品位知的音声合成技術であるとしている。音質はPentax VoiceTextに少し劣るかもしれない程度。比較的安価に購入可能。  ③④⑤を除いてこれらの新世代の合成音声エンジンは、どの程度の読み分け性能を達成しているのかを客観的に評価する方法として、JEITA(電子情報技術産業協会)の制定した「音声合成システム性能評価方法」があり、多くがこの評価方法に沿って高品質合成音声エンジンと称している。特に①と⑥は非常に音質がよいとされるが⑥は非常に高価なので①のVoiceTextが現在では高品質合成音声エンジンの中心的存在である。  文字コードの処理をOSとの整合性から内部ではUnicodeで処理していても、日本語処理はShift-JISで行っている合成音声エンジンがほとんどで、このことが、フォント環境と合成音声エンジンの整合性がない視覚障害者にとって非常に不幸な環境を作り出している。  さらに、Shift-JISで提供される外字領域とUnicodeであるAdobe-Japan 1-5以上をサポートする文字体系が同一でないため、Shift-JISで提供される外字領域を利用する際には合成音声エンジンのShift-JISの外字部分の詳細読みと文字グリフを別途提供する必要がある。この方法を利用して別売ではあるが、外字のフォントと音声詳細読みを提供しているのは、PC-Talker、VDMW系の画面読み合成音声ソフトウェアである。  OSレベルでは、新しいフォントを利用することにより三療における文字不足はほぼ解消されたが、合成音声を利用する場合は依然として解決されないことは技術革新が急速な今日では残念な事である。 3.3 合成音声の読み  合成音声エンジンの問題で重要なものに読みの問題がある。合成音声では、文字の読みについて、その文字の読み(音読み・訓読み)と詳細読み、文字コードの4つが必要となる。渡辺等[1]は、合成音声の詳細読みについて現在販売されているものについて検討している。しかし、現在販売されている合成音声エンジンは、文字の読みとしては8,000文字程度でしかない。Adobe-Japan 1-5程度の約20,000文字に対応した合成音声エンジンはないが、もし存在すれば、20,000文字以上の文字の読みが必要となる。これは一企業で行える作業量を超えるのではないかという危惧がある。  また、本来合成音声の読みは、学年進行で変更されるべきものである。例えば、小学校向けのワープロとしてはJustsystem社のジャストスマイル3の市場占有率が高いが、この製品の特徴として、小学校の学年進行別の漢字変換辞書がある。  つまり、小学校の各学年進行で学習する漢字に対応して、漢字変換が行えるようになっている。したがって、小学校で『憂鬱』などという漢字が変換できることは不自然である。小学校ではこの漢字は習わない。同様に合成音声の読みもこのような系統に準じるべきであると考える。しかし、全盲では、文字情報を得ることは困難であるため、「へん」と「つくり」による説明が妥当と思われるが、現在のJIS第一水準・第二水準以上の漢字について合成音声の読みを与えることは、小学校レベルでは逆に不自然である。したがって、学年進行に応じて合成音声の読みも進化させる必要があるのではないだろうか。  現実問題として、盲学校専攻科の生徒にJIS第一水準・第二水準・第三水準・第四水準合わせて20,000字以上の合成音声の読みを理解させることは不可能なため、必要な文字だけ教えることが望ましいが、合成音声の製品としては欠陥となる。  JIS第一水準・第二水準以外の13,000字を一から作成するのは至難の業と言わざるを得ない。  長期的な視野に立って、Unicode 3.2程度の文字について視覚障害者が利用する合成音声の読み(文字読み・音読み・訓読み・詳細読みの4種類)をインターネット上の会議録などを利用して少しずつ作成していけば、すばらしい成果となるものと思われる。 4.教科書・参考書における表記方法と外字  教科書・参考書における文字コードについて調査を行った。以前に教材作成を行うために、盲学校や視力障害センターなどで鍼灸や理学療法で使用する教科書・参考書について文字の表記方法を調査した。実際に検討したのは盲学校校長会選定教科書や東洋療法学校協会選定教科書と、参考書類である。また、柔道整復関連の教科書・参考書と理学療法・作業療法関連の教科書・参考書も合わせて検討した。 4.1 俗字・略字  字画が多くなり複雑な字形の場合、一部を簡略化した形に変えることで見栄えをよくする目的で採用されたと思われる字体である。国語審議会では、これを「簡易慣用字体」と規定し、康煕字典に採用されている字体ではないが、印刷文化に定着しているとして認めている。  また、例1にあるような文字の場合、画数が多いために視覚障害者には判別しにくいと言う著者や出版社の判断から、使用される場合もある。 4.2 包括基準  JIS0213:2000から適応された文字の形における包括基準である。「表外漢字字体表」平成12年12月8日国語審議会答申によって文字コードとは別に文字の形についての基準が定められた。例えば、部首である「しんにゅう」では、点が1つのしんにゅうと点が2つのしんにゅうがある。これらは、印刷文字として定着しているとして本来は2点しんにゅうが正しいが、1点しんにゅうでも認めると言うものである。これには、3部首(しんにゅう,しめすへん,しょくへん)が該当している。 4.3 Unicode外字  現在Unicode 5.0.0[2]公表されている。しかし現実には日本でもこの規格に追いついておらず、Unicode 4.1.0がよく知られている。このUnicode 4.1.0[3]は漢字として扱われている文字数が71,226文字であり、中国・日本・朝鮮で利用されている漢字(CJK漢字)の総数である。  Unicodeが、JISで制定された1.0から順にバージョンが上がるごとに収録文字数が増加していくが、このバージョンが上がるたびに収録されていく文字が、収録される前は外字となり、教科書・参考書で使われている。これらの多くが東洋医学関連で、古典などで利用されていることが多いものである。しかし、これらの文字はUnicodeのバージョンを更新する際に登録されていくものと思われるが、その数が非常に多いため、最終的にいつUnicodeに登録されるかは不明な場合が多く、包括基準の別の漢字で対応する出版社も見受けられる。 4.4 創字  中国の周期律表の漢字の元素記号などがこれに当たる。いわゆる金属なら金へんに音読み、気体なら気に音読みを組み合わせて元素を作成する。この例では、Unicodeに登録も事実上不可能である。 4.5 国家試験における表記方法と外字  鍼師、灸師、あん摩・マッサージ・指圧師国家試験や柔道整復師国家試験、理学療法士・作業療法士国家試験などにおいて、普段見慣れない字体が印刷されている。国家試験問題の多くが国立印刷局で印刷されており、利用されている電算写植機が写研のものと推察される。そのため字体がワープロ出力のものと少し異なっていることがある。国家試験においては視覚障害者向けの拡大文字においても同様の字体が利用されているため、受験生は普段見慣れた字体とは異なる字体に違和感を感じるものも少なくない。しかし、国語審議会の規定では、これらの字体の違いは包括基準に含まれるものとしているため、事実上問題はないが、試験問題を再現するには包括基準に相当する別の漢字を割り当てる必要がある。 5.現実の対応  前章までで述べた様々な問題を含めて、視覚障害者が利用する情報システムとしてどのように対応すればよいのであろうか。  現時点では、合成音声エンジンの制限から、画面読み合成音声ソフトウェアの外字問題を解決することは事実上不可能である。したがって、合成音声関係については現状のソフトウェアを利用するのが実際的な対応と思われる。  次にOSに対応するフォントについて検討すると、そのパソコンの中で統一するのが望ましい。Windows XP標準搭載のMS明朝・MSゴシック体では、現時点でAdobe-Japan 1-4程度の文字数が収録されているため、視覚障害者を対象とした三療従事者では、文字数が不足する。[4][5]  Windows Vista搭載のMS明朝・MSゴシック体では、Adobe-Japan 1-5以上の文字数が収録されているため有効である。文字の字形さえ気にしなければ、このWindows Vista搭載のJIS2004字形対応したMS明朝・MSゴシック体は、Microsoft社からWindows XP用としても無償配布されているため、導入することは容易である。MS明朝・MSゴシック体以外の様々な日本語フォントについてもJIS2004対応の字形にするのが望ましい。  また、教材作成用の機器では、文字環境を統一することが、作業の効率化を向上させ必要不可欠と思われる。学校現場では、MS明朝・MSゴシック体以外に、丸ゴシック体や極太明朝体、極太ゴシック体なども必要で、さらに教科書体も必要となるであろう。そこで、フォントごとに字形が異なると問題である。 6.おわりに  重度視覚障害者にとって合成音声の利用は不可欠な条件である。しかし、利用する情報機器の文字環境と合成音声が同期しないことは非常に残念なことである。今後、OSやOffice製品、グラフィック製品などは非常な速度で進化を続けると思われるが、合成音声の問題はなかなか改善が技術的に難しいため、一歩一歩の進歩を積み重ねるしか特効薬がないのが悔やまれる。 例1 例2 例3 例4 文献 [1] 渡辺 哲也,視覚障害児・者のコンピュータ利用における理解しやすい漢字詳細読みに関する研究,平成16年度~平成18年度科学研究費補助金(基盤研究(B))研究成果報告書(課題番号:16300191)研究代表者:渡辺 哲也,2006 [2] The Unicode Consortium,The Unicode Standard Version 5.0,Addison-Wesley Professional; 5th edition,2006 [3] Tony Graham(乾、海老塚共訳),Unicode標準入門,翔泳社,2001 [4] 村上 佳久他,外字について,筑波技術短期大学テクノレポート,Vol.5, 111-116 [5] 村上 佳久,外字について2,筑波技術短期大学テクノレポート,Vol.12, 33-39 External Characters 3 MURAKAMI Yoshihisa Division for General Education for the Visually Impaired Research and Support Center on Higher Education for the Hearing and Visually Impaired Tsukuba University of Technology Abstract: An external character refers to a character that is not specified in the JIS kanji code. Recently, the JIS code was revised extensively. The Windows OS and Mac OS font typefaces and glyphs have been changed. This revision affects the education of visually impaired persons. Moreover, caution is required when using personal computers or voice synthesis. Here, external characters under the latest OS environment when using voice synthesis and the technical problems of Unicode, which is a new character code system, are examined. Keyword: External character, Glyph, Typeface, Windows Vista, Windows XP