視覚障害者のための電子図書館その2-電子録音図書- 視覚部 一般教育等 村上 佳久 鍼灸学科 上田 正一 要旨:視覚障害者のための電子図書館に収録されるデータとして、電子墨字図書、電子点字図書そして、電子録音図書がある。電子録音図書はコンピュータ機器の発達に伴って急速に進化した分野であり、デジタル化によって録音図書の長期保存による情報欠損をかなり低減させることや聞き手にとって最も利用しやすい音質や再生速度を選択できるなどの利点も多い。ここでは、電子録音図書について説明する。 キーワード:視覚障害、電子図書館、録音図書、MPEG、MP3 1.はじめに  視覚障害者が利用するメディアとして、点字や録音図書がある。昨今、中途失明者などの増加により点字を利用できない重度視覚障害者である全盲が増加していることが深刻な社会問題となり、新聞報道などにも取り上げられている。彼らにとって必須のメディアといえば録音図書である。  カセットテープに吹き込まれた各種の録音図書が、社会適応するための重要な情報源であり、鍼・灸・按摩・マッサージ・指圧などのいわゆる三療の資格を取るためにも必要不可欠なメディアである。  しかし、アナログ録音である現在の録音図書は以下のような問題点を抱えている。 ・テープ媒体なので、ランダムアスクスが不適(頭出しなど) ・再生速度変更による音ピッチ変化(改善されている機器もある) ・長期保存の保磁力低下によるデータ欠損(おおよそ3年) このような欠点をデジタル化することにより改善すべ<、全世界標準の録音図書規格として現在進められており、DAISYの(Digital Audio Information System, 略称デイジー)と呼ばれているが、急速なコンピュータ機器の進歩が規格を陳腐化し、製品が出る前に更に新規格を制定せざるを得ない状況がある。  ここでは、視覚障害者のための電子図書館に利用されるメディアの1つとして、現在のデジタル技術を利用し、さらに広範囲な利用を実現すべくインターネットやイントラネットを媒介とした、新しい電子録音図書について検討を行う。 2.新しいデジタル音声技術  昨今、デジタル技術の進歩のより地上波テレビもデジタル化されるという時代を迎えているが、ここにはデータをいかに少なくして高品質で提供するかという問題を解決すべく、新たな規格が利用されている。その1つにMPEG規格がある。  MPEGとは、Mortion Picture Expert Groupの略であり、画像や音声をデジタル化した情報を扱うための規格の1つである。国際標準機関のISOとIECの共同活動機関である、ISO/IEC JTC1で、動画の圧縮技術の検討を行うグループとして、MPEG委員会が策定してISOで標準化されたものがMPEG規格である。 略称 標準化年 正式名称 MPEG1 1993年 ISO/IEC11172-1~3 MPEG2 1994年 ISO/IEC13818-1~3 MPEG-4 1999年 ISO/mC14496-1~3予定 MPEG-7 2001年予定未定  MPEG1の正式名称は「転送レートの上限をおよそ1.5Mbit/sまでとした、デジタル保存メディアのための動画と音声に適合した符号化」である。  MPEG2の正式名称は、「限られた帯域幅において、非常に低いビットレートを要求するアプリケーションのための、低いサンプル周波数の拡張」となっている。  通常の音楽CDでは、1411.2kbit/secの帯域幅を必要とするが、MPEG-1では、96~256kbit/sec程度まで削減できる。MPEG2では、32kbit/sec以下の転送レートでとなるためさらに高圧縮となる。  MPEG規格には、動画の部分と音声の部分に分けられるが、音声の部分は、MPEGAudioと呼ばれる。これには、データの圧縮技術も含まれており、人間の聴覚の「最小可聴限界」と「マスキング特性」の2つを利用してデータを削ることによりデータサイズを劇的に低減することができるが、この圧縮は非可逆圧縮であり、圧縮したデータを元に戻すことは出来ない。  また、データ転送速度も圧縮に大きく影響するが、MPEG-1Audio Layerでは、32~448kbit/secの転送速度であり、MPEG-2Audio Layerでは、8~24kbit/secの転送速度を想定している。MPEG-1とMPEG2の違いは、このデータ転送速度にあるといって良い。Audio Layerには、その用途に応じていくつかに細分化されているが、MPEG-1 Audio Layer3の規格が音楽(音声)だけの規格としてインターネット上などで事実上標準となりはじめている。(現在、MP3と呼ばれている)  一般的な、MP3規格では、転送速度128kbit/sec、サンプリング周波数44.1kHzで圧縮率は、1/11程度である。通常の音楽用CD(44.1kHz,16bit,StereoPCM)のデータは非常に巨大で、CD-ROM1枚630MBで60分程度のデータしか収録できないが、MP3では、その約1/11の58MB程度で収録できる。  このようなMPEG技術を最大限に利用したものが衛星デジタル通信テレビであり、地球周回軌道上の人工衛星を利用して、MPEG技術で圧縮し、専用デーコーダで再生することによって、非常に劣化の少ないデジタル画像と音声を提供している。 3.電子録音図書への応用  前述のようにMPEG規格のデータを用いると非常に高圧縮で音質の良いデータを提供することが出来、またデジタル録音の特徴である、メディアの経時変化による劣化が少ないことやランダムアクセスの容易さなど、利用者に福音となるであろう。さらにデータを様々なデータで提供でき、市販の音楽再生用CDなどでも再生可能なCD-ROMで提供することも可能であろう。 3.1実際のMPEGファイル  音楽用CDと電子録音図書でMPEG圧縮データの作製方法は異なるが、おおよそ次の通りである。 ・音楽用CD 1)内部のデータをWAVファイルに変換する(44.1kHz,16bit,StereoPCM) 2)WAVをMPEGエンコードする(128kbit/sec44.1kHz) 3)MPEG再生ソフトウェアでデコード再生する。 例:ALIVE, SPEED, TOY'S FACTORY,98.7.1, TFDC-28087,5:05 53231kB(44.1kHz,16bit,StereoPCM:WAV File) 4818kB(128kbit/sec44.1kHz:MPEG-l Audio Layer-3)圧縮率:1/11 ・電子録音図書 1)カセットテープなどで録音されたデータをパソコンに取り込む WAVファイル:44100Hz,16bit,StereoPCM,(CD音質) WAVファイル:22050Hz,16bit,StereoPCM,(FMラジオ音質) WAVファイル:22050Hz,8bit,StereoPCM,(FMラジオ音質) 2)WAVをMPEGにエンコードする(MPEG-1 Layer3) 場合により、圧縮WAVファイル形式(MPEG-2 Layer3)にエンコードする 3)MPEG再生ソフトウェアでデコード、再生する。 例:脳死と臓器移植(視覚部一般教育教材:朗読ボランティア録音) 第1章部分(1156)(全量:90分用カセツトテープ2本と片面) WAV:30874kB(22050Hz,16bit,MonoPCM,11:56) 圧縮WAV:2,788kB(MPEG2 Layer 3,32kbit/sec, 22050Hz, Mono)圧縮率:1/11  圧縮率が低いのは元々のカセットテープの録音をパソコンに取り込んだ段階ですでに転送レートやサンプリング周波数が低く設定されているので、これ以上の圧縮率を求めると音質に影響するため。STEREOのCD音質でパソコンにWAVファイルで取り込んだ場合、データ量は4倍の123496kBとなり巨大なデータになってしまう。  全世界規格の録音図書規格であるDAISY形式で圧縮する場合は、2)以降がDAISY専用のソフトウェアを利用することになる。但し、19993.10現在で、MPEGを利用した高圧縮用のDAISY録音エンコーダは、公開されていない。 3.2圧縮された音質  圧縮には、前述のように「最小可聴限界」と「マスキング特性」の2つの音響心理学的効果を利用しているが、圧縮に伴う「ブリーチング現象」(息継ぎのように音が微妙に途切れる)が問題となる。また、「サンプリング周波数」により最高再生周波数が決定されるため、高域の音データが無くなってしまう。例えば、「サンプリング周波数」22050Hzでは、最高再生周波数は、11025Hzである。つまり、11kHz以上の高音は成分として含まれていない。したがって、やや含みのある音質なる。  MPEGを利用した電子録音図書では、データを圧縮することが前提となるが、聴感上、どの程度まで圧縮が可能かを検討するためにヒアリング調査を以下の条件で行った。 再生スピーカ: 1)パソコンの内蔵のスピーカ(3cm×2) 2)SONYSRS-150EX(13cm低音十3cm高音) 3)三菱DS-25(25cm低音十5cm中音十3cm高音) 4)JBL4433StudioMonitor(38cm低音十ホーン) 再生距離:スピーカ前 1)約40cm,2)約50cm,3)約2m,4)約3m 再生音質: 1)44100Hz,128bit/sec,Stereo,MPEG-1Audio Layer3 2)44100Hz,128bit/secJointStereo,MPEG1Audio Layer3 3)22050Hz,48bit/secJointStereo,MPEG-2Audio Layer3 4)22050Hz,24biUsec,Mono,MPEG-2Audio Layer3 5)11025Hz,24bit/secJointStereo,MPEG-2Audio Layer3 6)11025Hz,12bit/sec,Monq,MPEG-2Audio Layer3 7)上記条件と同じく作成されたWAVファイル群 再生音: 1)ALIVE,SPEED,TOY'S FACTORY,98.7.1, TFDC-28087,5:05,CD音楽 2)脳死と臓器移植 (視覚部一般教育教材:朗読ボランティア録音) 第1章部分(11:56)朗読 WAV,MPEGエンコーダー: Opticom社 mp3 Producer“Professional”ver2 エンコードパソコン: Pentium Ⅱ 400MHz, 256MB_RAM, Windows95 再生デコーダ: SCMPX mpeg audio player for Windows(MPEG) Windows Sound Recorder(WAV) 被験者:視覚部学生(全員にアイマスク着用)8名 結果: 1)サンプリング周波数では、小型スピーカでは、(再生スピーカ1、2)44100Hzと22050Hzの区別が出来ないが大型スピーカでは可能 3)ビットレートの違いは、再生スピーカ4以外では検出不可能 3)Stereo, Joint Stereoの区別は不可能 4)11025Hzの音質は、電話程度で音質が悪い 4)朗読では、44100Hzと22050Hzの差はない。(再生スピーカ4以外では検出不可能) 5)Joint Stereo, Monoの区別は出来るが、実用上Monoで音質的に不満はない。 6)MPEGとWAVに関し同じ程度のサンプリング周波数や転送速度は、両者の区別は出来ない。  以上から、朗読や音訳などの電子録音図書では、22050Hz,48-24bit/sec Joint Stereo-Mono, MPEG-2 Audio Layer3の規格で十分に対応できることが判明した。この規格では、CD音質に対して圧縮率は、1/30-1/60となり1枚のCD-ROMに約50時間程度の電子録音図書を収録できることになる。 3.3その他の規格  MPEGなどのデータ圧縮規格以外にも、NTTヒューマンインターフェイス研究所で開発された、TwinVQ(変換領域重み付きインターリーブベクトル量子化)がある。圧縮率はMPEGよりもよく、次世代のMPEG-4の低ビットレート用のフォーマットの1つとして採用が検討されているものである。 Realaudioは、RealNetworks社が開発した規格で現在インターネット上の様々なサイトで利用されている。MPRGに比べて圧縮率が低いのが難点であるがバージョンアップごとに改善されている。 その他にも様々な規格が存在するが、電子録音図書として利用可能な規格はあまり多くはなく、映像データに関するものが多い。 2.4電子録音図書再生装置  MPEG Audio Layer-3を専用に再生できるコンパクトな装置が各社から販売されている。  再生専用のMDやカセットデッキよりもコンパクトであり、機械的部分がないために、機器を揺らす事による音飛びなどは発生しない。 ・MPMAN:Saihan Information Systems ・Rio PMP300: Diamond MultiMedia Systems などがあり、32-64MBのメモリを内蔵している。  また、MPEGファイルではなく、TEXTファイルを内蔵の合成音声チップで発音し、再生する機器も試作されており、(とー君:RICOH)合成音声による電子録音図書も考えられる。  DAISY規格の電子録音図書の再生装置としては、PLEXTALKPlextorがあり、すでに多くの利用者がある。メディアとしてCD-ROMを利用するので大きさは視覚障害者向けのカセットデッキと同じ大きさである。DAISY規格の電子録音図書は、作成がやや複雑であるのが難点である。 4.著作権  現在、インターネット上で展開されている違法なMP3音楽ファイルが新聞報道などで大きく取り上げられている。MP3規格のデジタル録音は、その性質上CDと音質が大差ないので著作権保護の立場から違法なコピーが簡単に作成できることが最も大きな問題である。CDのような音楽データには著作権法上問題があるが、電子録音図書に利用される場合、点字図書館や視覚部図書館のように著作権法で録音図書を作成することを政令指定された施設では、自由に電子録音図書を作成できる。  この場合、録音図書作成を認められているのは、視覚部図書館であり、教育方法開発センターではない。したがって、視覚部図書館でこれらの録音図書を作成・運用しなければ著作権法違反に問われることとなる。視覚部図書館では、政令指定を受けた際の条件により、学内のみのデータ公開となっている。したがって視覚部図書館で作成した電子録音図書は、学外の利用者に提供することは出来ない。これらの条件は、著作権者の権利を保護するためのものであるが、インターネット時代を迎え、情報データが全世界を巡る時代に著作権保護をも含めた新しい対応が迫られており、電子録音図書もその流通がやがてインターネットを通じてと言う時代が来るであろう。その時のために更なるデータ圧縮技術を利用してデータをコンパクトにする研究と共に特定の利用者しか利用できない仕組みが必要になってくるであろう。 5.おわりに  デジタル技術を用いた電子録音図書はその研究が始まったばかりであり、これから研究の積み重ねが必要である。特に全盲のような重度視覚障害者が自由に利用できる環境を整えることが必要不可欠であり、その意味では、電子録音図書として先行しているDAISYが簡便で有利である。しかし、インタネットなどを利用した新しい録音図書の配布などを考慮するとMPEG規格による電子ファイルの方が有利である。  このような新しい技術が世間に還元されることは非常に素晴らしいことであるが、いわゆる「ハイテク」故にその利用方法の教育が一番の問題となることは間違いのないところであろう。  利用者教育。これが電子録音図書を普及させる最も重要な要因である。しかし、その教育方法はまだ確立されておらずこれからの課題である。 謝辞:この研究を行うに当たって、新潮社から録音図書作成の許諾を、またPLEXTOR社から機器等の支援を受けた。この場を借りて感謝する次第である。  この研究は平成9~10年度文部省科学研究費「視覚障害者のための電子図書館構築に関する研究」研究代表者:村上 佳久によるものである。 参考文献: ISO 11172-1~3 ISO 13818-1~3 ISO 14496-1~3 デジタル新世代MP3,Zantei箸,エーアイ出版 著作権法:(点字による複製等) 第三十七条公表された著作物は、盲人用の点字により複製することができる。 2点字図書館その他の盲人の福祉の増進を目的とする施設で政令で定めるものにおいては、もっぱら盲人向けの貸出しの用に供するために、公表された著作物を録音することができる。 ○平成五年文化庁告示第五号  著作権法施行令(昭和四十五年政令第三百三十五号) 第二条第一項第五号の規定に基づき、著作権法(昭和四十五年法律第四十八号)第三十七条第二項の著作物等の録音が認められる施設として次に掲げるものを平成五年四月一日付けで指定したので、同令第二条第二項の規定に基づき告示する。 平成五年四月一日文化庁長官 内田 弘保 筑波技術短期大学視覚部図書館 参考事項: 転送レート:時間あたりのデータの転送量 サンプリング周波数:音を符号化・復号化する際の時間軸方向の解像度 (転送レートにより時間あたりのデータサイズが固定されるので選択可能なサンプリング周波数も限定される) チャンネル:独立した音データ単位(Mono, Stereo Joint Stereo) Joint Stereoは、音の差分データを利用してデータ量を圧縮したもの