ハイレゾ音源の教材化の試み 村上佳久筑波技術大学 障害者高等教育研究支援センター 障害者基礎教育部要旨:ハイレゾと呼ばれる音楽の高解像度データを利用した教材化の試みとして,CDやmp3データと共に試聴比較実験を行った。楽器演奏経験のない学生は,これら3つの音源の区別が出来なかったが,ピアノ演奏経験のある学生は,区別が可能であった。この実験結果は,良い音の意味を改めて考えさせられるものとなった。 キーワード:ハイレゾ,CD,mp3,良い音 1.はじめに「ハイレゾ」とは何か。最近,ハイレゾという言葉を聞くようになった。本来,ハイレゾとは,"High Resolution"で,日本語ではよく高解像度と訳されている。しかし,最近は,音楽の超高解像度データを指しているものと思われる。多くの音楽雑誌などで「ハイレゾ」と言う言葉が取り扱われている。「ハイレゾ」に対して,音楽を聴く環境として,CDやmp3と言ったメディアもある。そこで,本研究では,この「ハイレゾ」とCD,mp3の3つの音源を比較試聴することにより「,ハイレゾ」の持つ音の高解像度について理解するための教材化の試みを行ったので紹介する。 2.音楽を聴くための環境近年の音楽を楽しむ環境を考えてみよう。今から20年ほど前は,レコードで音楽を聴くのが一般的であった。レコード盤をレコード・プレイヤーに乗せて,レコード針のついたアームをレコードに下ろし,レコード盤に刻まれた音の信号の溝をレコード針でトレースして,その振動をアンプで増幅して,スピーカーから聞いていた。その後,レコードからCD(Compact Disk)と呼ばれるメディアに変化した。直径12cm,厚さ1.2mmのポリカーボネイト製のディスクに書き込まれた,Digital Dataをレーザー光でトレースし,読み取るものである。音楽はデジタル処理され,ビット情報でCDに書き込まれる。また,音楽を持ち運びする動きも,音楽メディアの変更を刺激した。レコードをカセットテープに録音して利用するユーザが増え始めると,画期的な持ち運びの可能なSONY製の「ウォークマン」と呼ばれる野外用カセットデッキが登場した。この「ウォークマン」によって,音楽メディアが携帯型の移動メディアとして利用されるようになった。 その後,携帯型の移動メディアは,CDの登場によりカセットテープから8cmのCDやMDに変化し,さらにDigital Dataのみを扱うmp3プレイヤーに進化していった。mp3とは,"MPEG-1 Audio Layer-3"の略で,元々はビデオとオーディオの圧縮技術から生まれたものであるが,現在では音楽データを扱うための圧縮技術の一つである。一般にファイルの拡張子は「.mp3」が利用される。CDのデータを約11分の1に圧縮することが可能で,1枚のCDに約100曲分のデータを収録することが出来るため多くのユーザが利用することになった。その後,CDを利用せずにメモリーのみの携帯型mp3プレイヤーが登場すると,爆発的に人気を博し,多くのユーザに利用されることとなる。このため,メモリタイプの携帯型mp3プレイヤーでは,1000曲以上も音楽データを収録して利用できるものもあり,2015年現在でも多くの利用者がいる。この技術は,視覚障害者用の電子録音図書である"DAISY"にも利用されており,長時間に及ぶ朗読録音図書がCD 1枚に数タイトルも利用できる利点がある。[1]また,このようなDigital Dataのメディアが変化し,ダウンロードと呼ばれる実メディアを伴わない,音楽データで音楽を楽しむ環境が増加している。一方で,このmp3による音楽データに対して,物足りなさや違和感を覚える利用者も少なからず存在していた。3.アナログからデジタルへの変換ここで,アナログからデジタルに変換する方法について簡単に説明する。Analogl Dataとは,「数や量を連続的な物理量で表現する方式」であり,音の場合は時間軸に対する音の強弱と,振動数の変化によって示されている。つまり,音のAnalogl DataからDigital Dataに変換する場合は,音の強弱と振動数の変化をDigital Dataに変換する。3.1 量子化音の強弱の変化をアナログからデジタルに変換することを量子化という。CDの場合は,16bitで量子化されている。つまり,2の16乗=65,536段階でデジタル化している。言うなれば,音量=0から最大限の音量までを65,536段階で分けていると言うことである。24bitの場合は,2の24乗=16,777,216段階でデジタル化している。16bitに比べて256倍も細かい段階で量子化されることになる。 3.2 サンプリング一方,音の振動数を時間軸で分断して,その値を得ることをサンプリングという。CDの場合は,サンプリング周波数が,44,100Hzに設定されている。シャノンの定理からこのサンプリング周波数の半分の22,050Hzまで再生可能となる。この周波数は,人の可聴限界域(20〜20,000Hz)を超えている。図1, 2 にアナログからデジタルへの変換の様子を示す。 図1 サイン波のデジタル化時間軸13分割,強度軸11分割 図2 サイン波のデジタル化時間軸37分割,強度軸41分割 一周期の正弦波(サイン波)のデジタル化を考える。図1は,横軸が13段階,縦軸が11分割で,図2は横軸が37段階,縦軸が41分割でより細かい。それだけデータ量も多くなるが,よりサイン波に近づいていることがわかる。横軸がサンプリングに相当し,縦軸が量子化に相当する。 3.3 ハイレゾの定義「ハイレゾ」とは,一般にCD音質のデータよりも高解像度のものを指す。したがって,サンプリング周波数44,100Hz以上かつ,量子化16bit以上のものである必要がある。一般には,96kHz/24bitや192kHz/24bit等のものが「ハイレゾ」と呼ばれる。CDの44.1kHz/16bitに比べて,情報量は3.3倍や6.5倍となる。 4.ハイレゾの音源の教材化「ハイレゾ」音源の教材化を考えると,まず様々な音楽データの比較試聴が考えられる。前に述べたような,ハイレゾ音源・CD音源・mp3音源の比較である。これは,人の可聴音域の中で広帯域なデータと狭帯域なデータとの比較でもある。また,アナログからデジタル化した場合に起こるAnalogl Dataとの誤差,つまり量子化ノイズ(量子化による誤差)とサンプリングノイズ(サンプリングによる誤差)という2つのノイズがどのように耳に聞こえ分別できるかと言う人の感性を測るものである。(図1,2のサイン波との誤差)さらに,五感の中で視覚に障害のある本学学生が,聴覚の感受性が向上しているのかどうかと言う点も興味深いところである。これは,キーボード入力の練習の時に,アイマスクをして,視覚情報を遮断して,合成音声だけを頼りにキーボード練習を行うと非常に短時間でタッチタイピングが習得できるという報告を行ったが,その逆バージョンとも言えるものである。[2]比較試聴実験の前に,レコード・CD・mp3の各種データの区別や意味を座学で事前学習した。 4.1 音源の準備音源は,CD・「ハイレゾ」・mp3の3種類準備し,ジャンルは,洋楽,邦楽,ジャズ,エレクトリック・ポップ,クラシックの5系統を用意した。4.1.1 使用したCD音源全て,44.2kHz/16bit1. Led Zeppelin W,Led Zeppelin,1971,Atlantic Record, 20P2-20262. Silhouette,松田聖子,1981,Sony Record, SRCL 18543. Somethin' ELSE, Cannonball Adderley, 1999, Blue Note, 7243 4 95329 2 24. Picture at an Exhibition, Emerson, Lake & Palmer, 1972, Atlantic Record, 20P2-20495. Tchaikovsky Symphonies Nos.4.5.6, Leningrad Philharmonic Orchestra. Mravinsky, 1961, Polydor, F60G 20129/30 4.1.2 使用したハイレゾ音源1-1. Led Zeppelin W,Led Zeppelin,2014,Atlantic Record, mora,96kHz/24bit2-1. Silhouette,松田聖子,2014,Sony Record, mora, 96kHz/24bit2-3. Somethin' ELSE, Cannonball Adderley, 2014, Blue Note, e-ONKYO, 192kHz/24bit2-4. Picture at an Exhibition, Emerson Lake & Palmer, 2015, Atlantic Record, HD-Music, 192kHz/24bit2-5. Tchaikovsky Symphonies No.5, Leningrad Philharmonic Orchestra. Mravinsky, 2014, Universal Music, PROC-4012, Blu-ray Audio, 192kHz/24bit 4.1.3 使用したmp3音源mp3データは,WAVデータをmp3用の以下のソフトウェアを利用して変換した。Opticom社 mp3 Producer Professional V2このソフトウェアは,mp3開発元のFraunhofer IISの初期のエンコーダーを利用しており,変換効率よりも音質に重点が置かれており,電子録音図書の研究でも利用した実績がある。[3]ビットレート:128bit/secサンプリング周波数:44.1kHzチャンネルカップリング:stereo圧縮比:11分の1(WAVデータに対して) 4.1.4 実際に試聴に利用した楽曲音源のアルバム全てを聞くと時間が掛かるため,アルバム中の代表的な楽曲を取り上げて,比較用の音源とした。1. "Stairway to Heaven"前半3分,ギターの前奏と歌い出しの部分2. 「夏の扉」前半2分,前奏から「フレッシュ・フレッシュ・フレッシュ」と3回繰り返し部分3. "Autumn Leaves" シャンソンの世界からジャズに持ってきたもので全曲4. "Promenade" 2回分 クラシックの有名曲のロック版で冒頭部分と中間部分5. 第4楽章第4楽章冒頭から5分程度これらの場所は,ハイレゾ音源とCD音質音源,mp3音源の3つが比較的分かりやすいとされる部分で,初めて聞く被験者にも比較し易いと思われる。 4.2 ハイレゾの再生本研究で問題となったのは,ハイレゾ音源の再生である。今回のハイレゾ音源は,96kHz/24bit,192kHz/24bitであり,高域は48kHzまで再生可能であるが,再生装置が対応している必要がある。そこで,ハイレゾ音源に対応した再生装置について検討した。ハイレゾ音源は,CD音源に比べて高域の再生音域が広いため,最低でも60kHz程度まで,位相変化が少なく再生できるアンプが必要であり,スピーカーについても同様である。しかし,一般に市販されているメーカー製のアンプは,出力にスピーカー保護のため,コイルやリレースイッチなどが挿入されており,位相変化に対して問題がある。そこで,自作のDCアンプのスピーカーの保護回路を省略し,Li-ion電池の内部インピーダンスのみでスピーカー保護回路とした。ただし,そのため出力は,スピーカー8Ωに対して8W程度である。 また,スピーカーとして,JBL社のスタジオモニター4430を使用した。このスピーカーは,38cmの低音用スピーカユニットとバイラジアルホーンを装着した1インチ振動板のホーンドライバーからなり,高域は30kHz程度まで再生可能で,全体的な周波数特性として,30Hz〜30kHz(-3dB)を得ている。さらに,DAコンバーターについても同様にアナログ回路部をDCアンプ構成として位相変化をなくし,周波数特性も1MHz程度の広帯域とした。一方,各種音源を再生するための装置として,YAMAHA社のBD-A1040のユニバーサル・プレイヤーを使用し,デジタル出力を光ファイバー経由でDAコンバーターに接続した。使用した機器類を以下の写真1〜4に示す。 写真1 Universal Player:YAMAHA BD-A1040 写真2 DA Converter:自作 写真3 再生アンプ:自作DCアンプ(Li-ion battery) 写真4 Speaker:JBL 4430 4.3 再生実験 その1実験は,大学会館講堂で行った。スピーカーの配置の様子を写真5に示す。 写真5 大学会館講堂でのスピーカーセッティング この状況下で,CD音質のWAVデータ,ハイレゾ・データ,mp3データの3種類を比較試聴する。音量は,比較的大きめの平均で90dB/mレベルとした。バッテリーアンプの出力が8W程度のため,100dB/mを超える音量を出すことは出来ないが,一般的なスピーカーに比べて,大型のスタジオモニターであるため,被験者には経験のない音量であったかもしれない。また,CDやmp3データでは,22kHz以上の音がスピーカーから出ていないことをTechnics製のSH-8000 オーディオ・アナライザーで確認した。 4.4 視聴手順@ mp3,CD,ハイレゾの順番で聞かせ,耳を馴染ませる。A 順不同で3つの音源を聞かせる。B mp3,CD,ハイレゾの順番で聞かせる。C 順不同で3つの音源を聞かせる。ここで,AとCの順不動の順番を記述してもらう。したがって,2回分となる。被験者:本学学生1年生 8名(全員音楽演奏経験なし)(全盲1人,弱視7人) 4.5 結果全く想定外であったが,8人とも全て外れてしまった。偶然とはいえ,1つも正答がないという状況は,信じられない結果である。感想を出させたところ,「順番に聴くと,3つの違いはわかる」「順不同だとわからない」「順不同だと,全て同じ音に聞こえる」「CDの音は悪いの」等様々であった。一番多かった感想は「,良い音って何?」と言うものであった。4.6 再生実験 その2同様の実験をピアノ演奏経験のある学生4名で再実験を試みた。(全盲2人,弱視2人)前回と全く同様の視聴手順で実施した。 4.7 結果 24名中3名が「ハイレゾ」,CD,mp3の順番も含めて全問正解である。1名が,2.の「夏の扉」で,mp3データとCD音質データを間違えただけであった。それ以外は全て正解であった。感想を出させたところ,「mp3データとCD音質データは分かりにくかった」「mp3データは音がこもる」「ハイレゾは明らかに違う」と明快な感想であった。 4.8 考察この2つの結果から何が言えるのであろうか?ピアノ演奏経験がある学生は,ピアノを幼少期から習っており,ピアノの原音をよく知っている。つまり,音楽の響きなどを熟知している。それに対して,音楽演奏経験のない学生は「,良い音とは何か」と言う問題から考えなければならない。オーケストラや吹奏楽の生の音や演奏をほとんど聴いたことのない学生にとっては,この問題は難しいかもしれない。一方,生演奏を知っている学生にとっては,音の伸びや音の余韻,空間に広がる音の雰囲気などで簡単にわかったと感想で述べている。この違いは,脳の生演奏に対する感受性の違いであろうか?心理量を物理量に変換することは難しいが,今回の結果は,音楽演奏経験の違いが引き起こしたものと考えることに異論はないと思われる。 5.さいごに良い音とは何であろうか?例えばクラシック音楽では,カール・ベーム指揮のウィーン・フィルハーモニー管弦楽団,ヘルベルト・フォン・カラヤン指揮のベルリン・フィルハーモニー管弦楽団,エフゲニー・ムラヴィンスキー指揮のレニングラード・フィルハーモニー管弦楽団といった1970〜1980年台の世界の超絶オーケストラのレコード,CDは多くの人に感銘を与えるであろう。実際に これらのオーケストラの実演に接したが,感銘を覚える素晴らしいものであった。このような高名なオーケストラの演奏を再生するには,ある程度の規模のスピーカーを用意して,そのスピーカーに見合ったアンプなどでレコードやCDを聞けば,実演とは行かないまでも,それなりの感動をレコードやCDから得ることは困難なことではない。しかし,クラシック音楽を聴くためのオーディオ装置を用意することは最近の住宅事情では難しいかもしれない。では,住宅事情に合わせた装置では良い音は聞けないのであろうか?一方,ジャズなどのライブの実演を楽しむ人も多いが,オーケストラなどの大編成とは異なり,小編成のジャズならばライブの感動を自分の家のオーディオ装置で再現することは,容易なのであろうか?このように良い音とは何であろうか? 音楽を聴くためには,音楽を聴くための装置や場所が必要である。音楽を聴くための装置も様々であり,場所も同様である。ジョギングをしながら,イヤフォンで携帯型音楽プレイヤー聞く場合や机の上に置いた小型のスピーカーで「コンポ」と呼ばれる小型の音楽再生アンプで聴く場合や30〜40cmの大型サイズの低音用スピーカー等を有する本格的なオーディオ再生装置でレコードやCDを聞く場合,高級ヘッドフォンなどで聞く場合等,様々である。音楽を聴いていい音かどうかは,個人的な感想であり,心理的な量と言えよう。これを客観基準として判断するためには,心理量から物理量へ変換する必要がある。しかし,この変換は容易ではない。有史以来様々な心理量から物理量への変換が行われてきたが,多くが統計的データに基づく判定に過ぎない。したがって,音が良いという評価は,レコードやCD,mp3や「ハイレゾ」と言ったメディアの問題ではなく,音楽を聴いた個人が有する心理学的な評価が判定を下すこととなる。これが,2000年位までの一般的な音響学における評価基準であった。しかし,レコードの時代から,可聴音を超える音にも人は反応し,それによって脳も活性化されるという意見もあったのは事実であり,レコードとCDの違いをデータで示した研究者も存在したが,具体的な根拠を示すことが困難なことで,レコードに代わるメディアとして,CDが商業的に成功を収め ることとなった。しかし,「ハイレゾ」時代になって,本当にCDがレコードよりも良いメディアなのか,また,mp3や定額制ストリーミングの音楽が良い音なのかどうかは疑問がある。大橋らは,人の可聴域上限を超える高周波成分が,脳に影響を与えることを研究し,ハイパーソニック・エフェクトと 名付けている。[4]大橋らの言うハイパーソニック・エフェクトとは,「人間の可聴域上限をこえる超高周波成分を豊かに含み高度に複雑に変化する音が,基幹脳−脳幹・視床・視床下部など,美しさ・快さ・感動を司る報酬系の拠点となるとともに体の恒常性や防御体制を司る自律神経系・免疫系・内分泌系の最高中枢をなす領域−を活性化する現象に基づく複合的な心身賦活反応の総称」としている。このハイパーソニック・エフェクトは,fMRIなどを利用し,実際に超高周波成分を含む音を聞かせた場合と含まない場合で比較検証され確認されており,定藤らによって論文も発表されている。[5]したがって,CDとは異なり,人の可聴音上限を超える高周波成分を有する「ハイレゾ」音源では,脳に対する反応が異なると考えられている。けれども,ピアノを弾いたり,ギターを弾いたりなどの生の音に接している人や高級と言われるオーディオ装置などで音楽を楽しんでいるマニアと呼ばれる人たち以外の一般の人たちが,「ハイレゾ」音源とCDやmp3の音を区別できないのは,高級料理店において高級料理と言われる料理の味がわかるかどうかと同じで難しいのではないだろうか。今回の実験結果から,「良い音とは何か」と言う問題について改めて,考え直すこととなったと共に,心理量を物理量に変換することの難しさを再認識した事をご報告する次第である。 参考文献[1] 村上佳久,上田正一.視覚障害者のための電子図書館 その2 電子録音図書.筑波技術短期大学テクノレポート.1999; 6: p.119-123.[2] 村上佳久,上田正一.視覚障害者の情報基礎能力 キーボード入力について.筑波技術短期大学テクノレポート.1999; 6: p.145-149.[3] 村上佳久,上田正一.視覚障害者のための電子図書館 その3 “Voice on Demand”.筑波技術短期大学テクノレポート.2000; 7: p.109-113.[4] 八木玲子,仁科エミ,大橋 力.可聴域をこえる超高周波成分の信号構造が音の受容反応に及ぼす影響の複合評価指標による検討.日本バーチャルリアリティ学会誌.2003; 8(2): p.213-220.[5] Sadato. N, Oohashi. T, Nishina. E, et al. Neural networks for generation and suppression of alpha rhythm.Neuro Report.1998; 9(5): p.893-897. Trial Application of High-Resolution Sound Sources in Education PracticeMURAKAMI Yoshihisa Division for General Education for the Hearing Impaired and Visually Impaired,Research and Support Center on Higher Education for the Hearing and Visually Impaired,Tsukuba University of TechnologyAbstract: This study attempted the educational application of high-resolution sound sources. An auditory comparison experiment was conducted using high-resolution sound sources, CDs, and mp3 data. Student with experience in piano performance were able to distinguish the three sound sources compared with those without experiences in performing any musical instrument performance. The results confirmed the definition of “good sound.”Keywords: High Resolution, CD, mp3, Good sound