ニューラルネットワークと遺伝的アルゴリズムの障害者教育への適用 筑波技術短期大学電子情報学科情報工学専攻 小池 将貴 要旨:ニューラルネットワークと遺伝的アルゴリズムは、共に革新的な切り口による非線形問題の解決手法として有用であり、その適用を障害者教育の問題解決に試みた。最初の適用事例は、聴覚障害に対する共感度を表す指標をニューラルネットワークによって作成したケースである。次は、プロジェクト選定問題をとりあげ、遺伝的アルゴリズムによる解決が従来の解決法に対して優れていることを実証したケースである。 キーワード:障害者教育 数量化理論Ⅲ類 ニューラルネットワーク 遺伝的アルゴリズム 1.はじめに  脳神経細胞の信号伝達系をモデル化してパターン認識を行うニューラルネットワーク[1]と進化論的なアプローチで最適値探索を行う遺伝的アルゴリズム[2]は、共に革新的な切り口による非線形問題の解決手法として期待され、実際に半世紀にわたる幾多の成功事例の積み重ねによって歴史的な評価が定まったといえる。そこで両手法の適用を障害者教育問題に試みた。 2.ニューラルネットワークの適用 2.1 職域の就労卒業生評価のインパクト  就職卒業生の直属上司が、受け入れた聴覚障害者の就労状況を実に率直に批判して今後に託した要望意見を入手した[3]。このような要望意見に対処していくことは、聴覚障害学生が社会参加していくときに避けて通れないことであり、中には見当違いな意見も混じっているかもしれないが、今後の聴覚障害者教育に生かしていくべきであろう。そこで、卒業生の母校である筑波技術短期大学の在校生と教官に就労上の要望意見(86項に集約[4])を示し、そのいずれからインパクトを受け、いずれからはさほどでもなかったかを回答してもらった。 2.2 問題提起  在校生(聴覚障害)・聴覚障害教官・健聴教官から成る90名の回答者が86項の意見に反応したアンケートデータが、上述の経緯で入手できた。回答者が、どれとどの意見から強烈なインパクトを受けたのかというインパクト・パターンは、同じ学生同士でも聴覚障害の程度によっては異なるかもしれない。ましてや、学生(聴覚障害)と健聴教官とでは大いに異なることが想定される。  さらに一歩を進めて考えて、このようなインパクト・パターンには何らかの潜在概念が内包されているのではないかという問題意識を持つに至った。まず、それを何とか顕在化してみたい。もしも顕在化することができれば、その概念上における回答者の位置付けのようなものを、インパクト・パターンに基づいて取り出してみたい。 2.3 インパクト・パターンが内包する潜在概念の抽出  アンケートデータは、回答者90名の各々が意見86項のそれぞれについて強烈なインパクトを受ければそれに対しては1を対応させ、さもなければ0を対応させた90行×86列のデータ行列である(以降では、原データ行列と呼ぶ)。この原データ行列に数量化理論Ⅲ類を適用した。この手法は、行要素(回答者)と列要素(意見)それぞれについて、似ているもの同士は近くに、さもないもの同士は遠くに位置付けるという構造を原データ行列から引き出してくれる。その構造は、寄与率の高い成分を取り出して、行要素、列要素それぞれについて成分スコアをキーにして並べ替えを行い、序列化すれば見えてくる。そこで、まず寄与率最大の第1成分に基づいて、回答者と意見それぞれを並べ替えて序列化してみた。 2.4 潜在概念の明確化  潜在概念がいかなるものかは、序列の両極端の意見を読み取ることによって明確化される。序列化された86項の意見のうち、両極端の10 件ずつを以下に列挙してみる。 <成分スコア値のプラス側の極端に序列された意見> 「会社で手話講習会を自ら開け。」 「グループ内でのコミュニケーションがうまくとれていないのに他人事のような態度をとるな。」 「他の部署との折衝の仕事は任せられない。」 「わかりましたという返事は良いが、仕事の結果がまるで違う。」 「入社から1年間、頭痛・寝坊による欠勤が多い。」 「熱心ではあるが長続きしない。」 「注意するのが良いとわかっていても、コミュニケーションが億劫なので目をつぶって見過ごす。」 「朝礼・会議で話のスピードについていけないようだ。」 「コミュニケーションが億劫なので、緊急を要しない仕事だけを頼む。」 「手話通訳無しなので社外講習会に参加させられない。」 <成分スコア値のマイナス側の極端に序列された意見> 「自分の意見を持ち前向きに行動する。」 「ハキハキと自分を表現せよ。」 「コツコツと取り組み、小さなことでくじけない。」 「仕事の期限を守れ。」 「休日や定時後の活発さを昼間の仕事に回してほしい。」 「文章力を身につけよ。」 「時間厳守・他社と競争等会社常識を早く身に付けよ。」 「電子メイルを活用せよ。」 「書類の文章に話し言葉を入れるな。」 「自分でわからない点は納得いくまで尋ねてほしい。」  読み取ればわかるように、プラス側の意見は、聴覚障害者特有の問題点を突いている。それに対して、マイナス側は、健聴の四年制大学生にも共通する要望事項である。  これらを勘案して、「プラス側の意見に直面して強烈なインパクトを感じ取るということは、聴覚障害者と同じ視線で内側から見ている。」と考えた。  逆に「マイナス側の意見に対してなるほどと感じるということは、聴覚障害者を外側から見ていて、もっとしっかりしろという立場に立っている。」と考えた。  そこで、潜在概念を、「聴覚障害に対する共感度」と名づけることにした。この潜在概念の指標としては、数量化理論Ⅲ類による第1成分のスコア値を利用する。その値がプラスで大きいほど、聴覚障害者に寛容になり、マイナスの方向に進むほど健聴者側の厳しさが現れることになる。 2.5 序列化された回答者  同じく、数量化理論Ⅲ類による第1 成分によって回答者を序列化した。  プラス側には「聴覚障害に対する共感度」の高い者が並ぶはずである。実際、プラス側の先頭10名は、9名の聴覚障害学生と、1名の聴覚障害教官から成っていた。  マイナス側は、「聴覚障害に対する共感度」の低い者(健聴者側の立場に共感する)が並ぶはずである。実際、マイナス側の先頭は、健聴教官10名とそれに混じって大企業の係長を勤める聴覚障害の非常勤講師4 名、難聴の学生3名が含まれていた。マイナス側に聴覚障害者が混じっているのは奇異のようであるが、「社会の現実を熟知していて単に聴覚障害に対する共感度が高いだけでは済まされない。」と考えている者が聴覚障害者のなかにもいるということであろう。 2.6 実用上の問題点  これからの議論は、顕在化された概念としての「聴覚障害に対する共感度」を中心にして進める。  この概念を定量的に表現した指標が、数量化理論Ⅲ類による第1成分の行スコアと列スコアである。もちろん、前者が回答者の位置付けを示し、後者が意見の位置付けを示してくれる。その値がプラスの回答者や意見は「聴覚障害に対する共感度」が高いと解釈する。  さて、この方法を一般的に活用しようとすると、実用上で問題が生じることがある。幸い今回のケースでは問題を回避したが、列側の意見総数に対して、行側の回答者数が少ない場合に問題が起こる。意見群のサイズは大きいほど内包される概念の意味付けが深まるので、できるだけ多くの意見を採択しようとする。その意見群サイズに、回答者数が追いついていけないのである。その場合には、新たにアンケートに回答した者の位置付けを示す行スコアが簡単には得られなくなる[5]。その新たな回答データを追加して、あらためて数量化理論Ⅲ類の計算をやり直さねばならないのである。これでは煩雑で実用に適さない。 2.7ニューラルネットワークによる代替指標の作成  回答者の「聴覚障害に対する共感度」に応じた位置を示す数量化理論Ⅲ類の行スコア値は、前節で論じたように、必ずしも常に簡便に得られるとは限らない。そこで、代替指標をニューラルネットワークによって作成することを試みた。  プラス側の先頭10名(9名の聴覚障害学生と、1名の聴覚障害教官)とマイナス側の先頭10名(健聴教官10名)をまず採り上げた。彼ら20名をニューラルネットワークの教師として利用するのである。彼ら20名がインパクトを受けた意見を調べたところ、86意見のうち特定の23意見については誰もそこからインパクトを受けていなかった。そこで残りの63意見をニューラルネットワークの入力層へのインプットデータとして利用することにした。つまり、回答者を、63次元のベクトルとして表現し、ベクトルの要素として彼がインパクトを受けた意見に対応して1を入れ、インパクトを受けない意見に対応して0を入れるようにするのである。  ニューラルネットワークの計算は、プラス側の10名とマイナス側の10名の63次元反応データを入力教師データとし、出力教師データとしては、プラス側10名を1としマイナス側10名を0として行った。結果として得られた20名の出力値をみると、プラス側の10名は1.0であり、マイナス側10名の出力値は0.0のように再現されたので、再現性の高い荷重行列が得られたと考えた。  この荷重行列を用いて、あらためて回答者90名について、ニューラルネットワークによって計算し、その出力値を代替指標として利用することにした。すなわち、その出力値が1.0に近いほど「聴覚障害に対する共感度」の位置が聴覚障害者側にあり、0.0に近いほど健聴者側にあるとするのである。 2.8 ニューラルネットワーク計算結果に対する考察 (1)回答者の数量化Ⅲ類による序列化は、ニューラルネットワークによっても再現された。両手法の相互補完性は保たれている。 (2)学生という分類に基づくニューラルネットワークによる出力値を見ると、52名中21名は0に近い。つまり学生の40%は実は0なのである(共感度が健聴者側にある)。 (3)外部から来ている聴覚障害の非常勤講師は、0.1が2名、0.5 が2名でありその他6名は0なのである。やや難聴の短大教官が0.3である。聴覚障害の非常勤講師は全員が大企業の管理職を勤め、やや難聴の短大教官も大企業の管理職経験者である。彼らの共感度がむしろ健聴者側であるのが興味深い。 (4)健聴教官では、県外から研修に来た養護学校教諭が0.9であった(障害教育に関する大ベテランであるので聴覚障害者側に位置するのであろう)。手話が巧みで聴覚障害学生の相談にもかかわっている健聴教官が0.4であった。 (5)更に新たに、前節で特定した63意見をニューラルネットワークの入力層へのインプットデータとして利用し、インパクトを受ければ1、受けなければ0で応答すると、聴覚障害への共感度が0.0(健聴者側)~1.0(聴覚障害者側)の間の値として出力値が得られる。それによって全体の中での自己の位置付けがわかる。 3.遺伝的アルゴリズムの適用 3.1 問題提起  制約条件に縛られながらもそのなかから少しでもよい教育補助装置システム、カリキュラム、プロジェクトなどを選びたいという状況は障害教育の現場では特に多い。具体的にここに20件のプロジェクトがある。当然のことであるが、予算の総額が決められているので全部を採用することはできない。その予算制約のなかで、どのプロジェクトを選定すべきかという問題を考えてみる。 3.2 プロジェクト選定問題  プロジェクト20件の各々には、選定された場合の教育上の効果と支払うべき費用とが定められている(表1参照)。効果の評点は、プロジェクト選定にかかわるメンバーが協議して1点~10点を各プロジェクトに割り振った。費用は10万円~100万円の金額で示されている。全体の予算は360万円である。予算総額の制約の中で効果の総和を最大にするには、どれとどのプロジェクトを選定すればよいのであろうか。 3.3 解決を難しくする付帯条件  ここまでは、整数計画法のナップザック問題と同じである。しかし、ナップザック問題そのままでは現場では役に立たない場合が多い。実は、今回の問題でも、「プロジェクト3番と14番とは互いに似通っているので同時に2つを選定するのは無駄遣いになる。」という禁止条件と、「プロジェクト14番を選定するならば、その場合には抱き合わせでプロジェクト15番も選定してほしい。」という要請条件が追加された。特に前者の禁止条件は、プロジェクト3番と14番とを選定するか否かを表す変数(1または0の値をとる)の論理積が0という制約条件式を入れて解かなければならない。これは変数に関する線形式ではなくなるので、この段階で整数計画法がそのままでは適用できなくなる。そこで、これを遺伝的アルゴリズムで解いてみることにした。 3.4 遺伝的アルゴリズムの特徴  遺伝的アルゴリズムの本質は、モンテカルロシミュレーションである。適合度が最高の地点を探索する問題を例示的に取り上げて説明すると、候補領域をランダムに動き回れば最適は無理としても少なくともよりよい地点にたどり着けるというのが、モンテカルロシミュレーションである。それに対してもう少し効率よく動き回る工夫を施しているのが、遺伝的アルゴリズムなのである。  すなわち、運悪く適合度の低い地点に着いたならば次は無駄足を踏む愚を犯さないようにし、運良く適合度の高い地点にたどり着いたならば次はさらに詳しく周りを歩き回るようにしようというのである。そのために、再生と交叉のアルゴリズムを取り入れている。しかし、それだけでは局所最適化に陥り、他にはるかによい地点があっても見えなくなるので、方向転換の手段として突然変異のアルゴリズムを取り入れているのである。 3.5 遺伝的アルゴリズムによるモデル化  個々のプロジェクトではなく、20件のプロジェクト全体を群として把握し、その中の個々について選定するか否かの決定を下したプロジェクト選定案を遺伝的アルゴリズムの個体とする。  次に、個体に関する遺伝子型を定義していく。まず、個体の染色体は、20次元のベクトルで表す。すなわち、染色体の第i遺伝子座は、ベクトルの第i要素に対応させ、そこにはi番目のプロジェクトを選定する場合は遺伝子1が入り、選定からはずす場合は対立遺伝子0が入る。  個体の適合度関数は、効果の総和として定める。これは、染色体と効果(具体的な数値は表1参照)との内積をとることにより計算される。ただし、次の3つの場合には、あらためて適合度関数値をゼロに設定し直す。第1は、染色体と費用(具体的な数値は表1参照)との内積により計算される費用総額が、予算360万円を超えた場合である。第2は、遺伝子座3と遺伝子座14との論理積が1の場合である。これは、表現型の禁止条件を遺伝子型でモデル化するためである。第3は、遺伝子座14の遺伝子が1でかつ、遺伝子座15の遺伝子が0の場合である。これは、表現型の要請条件を遺伝子型でモデル化するためである。以上の3つの場合が生じないときには、もちろん、適合度関数は効果の総和として定める。 3.6 遺伝的アルゴリズムの実行  個体群サイズを500とし、それらの染色体の初期値設定はランダムに定めた。この初期状態では、441個の適合度関数値がゼロであり、ゼロでない残り59個のうちの最高点でも55点であった。  これを初期値として、適合度関数の値が大きな個体は次世代に生き残り、小さな個体は次世代では淘汰されるようにシミュレーションを20世代繰り返した。ここで、1世代は、再生→交叉→突然変異のサイクルである。サイクルの先頭にある再生はルーレット方式によって適合度関数値が大きい個体ほど再生されやすくした。交叉の確率は0.6に設定し、交叉方式は一様交叉とした。すなわち、確率0.3で選ばれた父と同じく確率0.3で選ばれた母とからランダムなマスクを通して息子と娘が生まれるようにした。突然変異の確率は0.4と設定し、その確率で選ばれた個体の遺伝子座をランダムに選びそこの遺伝子を対立遺伝子に替えた。もちろん交叉の確率選定の段階や突然変異の確率選定の段階で選に漏れた個体はそのまま次世代に申し送った。  初期設定からの入れ替わりにより最終的に得られた500個の個体は、そのうち適合度関数値がゼロは25個にまで減っていた。そして、たった1個ではあるが、適合度関数値が最高で68点にまで上がった。  こうして、適合度関数値が68点という、プロジェクト選定案(1、2、3、5、7、9、10、11、12、18)が得られた。この選定案の費用総額は350 万円であり予算制限は守られている。そして、プロジェクト14番が選定されていないので禁止条件と要請条件は双方とも満たされている。 3.7 他の手法との比較  比較のために、モンテカルロシミュレーションによってこの問題を解いてみた。モンテカルロシミュレーションによるということは、個体群サイズを適当に決めて、そのなかで染色体の遺伝子をランダムに定め、それらの適合度関数値の最大を求めるということである。表2の結果は、例えば個体群サイズが100の場合に適合度関数値の最大が53点であったということを示す。  表2によれば、個体群サイズを大きくしても適合度関数値の増大は必ずしも保証されないことがわかる。  それに対して、実は、遺伝的アルゴリズムで初期の個体群サイズを1000に増やし、繰り返し世代数も100世代にしてシミュレーションしてみた。この初期状態では、880個の適合度関数値がゼロであり、ゼロでない残り120個の最高点は55点であった。ところが、最終結果として得られた100世代後の個体群は、そのうち944個の適合度関数値が68点になり、最小の1000番目の個体でもその適合度関数値は61点であった。遺伝的アルゴリズムでは、その規模を拡大すればそれに見合った結果がもたらされる。しかも、適合度関数の最大値が停留していることを提示してくれたので、最適状態にたどり着いたという手ごたえを得ることができる。  さらに、エクセルのソルバーでも同じ問題を解いたところ、ソルバーが最適解として返してきてくれたプロジェクト選定案は、(2、5、7、9、10、11、14、15、18)であり、得られた適合度関数値は66点であった。費用総額は360万円であり、予算ぎりぎりの案である。  以上の手法3種の結果を見る限り、遺伝的アルゴリズムによる解がいちばん良い選定案をもたらしてくれた。しかも予算も少なくて済んだ。さらに、試行規模の拡大に応じて最適状態に近づいていく手ごたえも得られた。 表1:プロジェクト20件の効果(点)と費用(万円) 表2:モンテカルロシュミレーションの結果 4.コンピュータプログラムについて  プログラムは、データ解析用言語S-PLUSで作製した。プログラムステップ数は、ニューラルネットワークが96ステップ、遺伝的アルゴリズムが205ステップである。 5.参考文献 1)坂和 正敏、田中 雅博:ニューロコンピューティング入門,第1版,森北出版,東京,1997. 2)坂和 正敏、田中 雅博:遺伝的アルゴリズム,第1版,朝倉書店,東京,1995. 3)川口 博:聴覚部卒業者の就労状況―職域の指導者に対するアンケート調査結果―、筑波技術短期大学就職委員会聴覚部分科会、1996. 4)小池 将貴:卒業生の就職先評価の分析、筑波技術短期大学テクノレポート7(1)、125-130、2000. 5)駒沢 勉:数量化理論,第1版,放送大学教育振興会,東京,1992. Application of Neural Networks and Genetic Algorithms to the Education for the Handicapped Masayoshi KOIKE Department of Information Science, Tsukuba College of Technology Abstract: The aim of this study is to show that neural networks and genetic algorithms are useful in managing the education for the handicapped. Two case studies were tried to clarify the above assertion. The first case is the application of neural networks to the problem of measuring the psychological distance between the hearing impaired and the normal hearing. The second case is the application of genetic algorithms to the problem of selecting the important projects among many candidates under the constrained conditions such as a budget and so on. Key Words: education for the handicapped; quantification method Ⅲ; neural networks; genetic algorithms