制約付き主成分分析法による障害教育問題の解明 聴覚部 電子情報学科 情報工学専攻 小池 将貴 要旨:障害教育分野において有用な知見(仮説)を探索する段階に,コンピュータを援用してみた。方法論の中心は,研究対象分野のデータに制約付き主成分分析法を施し,その計算結果が研究者を触発して仮説を考えつかせるところにある。実際に,障害教育に関連した作文評価のデータに適用したところ,多くの有用な仮説が得られた。 キーワード:障害教育 作文評価 科学的仮説 制約付き主成分分析法 S言語 マクロプログラム 1.目的  障害教育問題の複雑で多様な局面の中から研究者は重要と見なす一側面を切り取ってきて問題提起し(仮説の提示),その解明を試みる。問題の解明は科学的方法論に従う。科学的方法論の本質は,「仮説の提示」とその「実験検証」とにある1)。  ここで,科学的方法論の後段の「実験検証」については,繊密な実験計画と根気強い実験遂行を必要とするとはいえ,コンピュータと連動した精級な道具立ての援助が期待できる。  ところが,前段の「仮説の提示」については,研究者の直感にゆだねられてきたと言えよう。そこで,「仮説の提示」にもコンピュータの援用を試み,その有用性を実例によって示すことにした。  実例に用いたのは,前回のテクノレポートで用意した障害教育関連のアンケートデータに更に追加調査を施して補ったデータである。 Ⅱ.仮説提示のためのデータ解析技術  主成分分析法に外部情報の制約を付加した制約付き主成分分析法(Constrained Principal Component Analysis,略してCPCA法)が最近提示された2)。これを仮説提示に活用することを今回試みた。  このCPCA法は,データ行列を分解する方法である。データ行列とは,表側に標本(例えば受験生),表頭に変量(例えば国語・英語・数学・理科・社会などの入試成績)を配置した矩形型の数値データである。CPCA法は,このデータ行列(Z)に加えて,外部情報が必要である。外部情報は,標本側外部情報(G)(例えば,受験生の性別・出身校など)と変量側外部情報(H)(例えば,理数系科目・社会科学系科目など)とから成る。CPCA法は,まず,GとHとによりZを4つの項目に分解する(外部分析)。すなわち, 第1項:GとHとの双方に関連する項 第2項:Hのみに関連する項 第3項:Gのみに関連する項 第4項:GとHの双方に関連しない項 である。この分解は,GとHとのそれぞれが張る空間とその直交補空間への正射影3)によってなされる。  その次の段階として,外部分析によって分解された4項の各々について,主成分分析法を施す(内部分析)。  主成分分析法を各々の分解項に施して得られる計算結果(因子負荷量と主成分得点)の係数データの規則的変動に触発されて,研究者が仮説を考えだすことになる。  得られた仮説が成立するか否かは,元のデータ行列に戻って検証することができる。こうして,仮説の提示とその検証とが同時に完結する。  なお,CPCA法のコンピュータ.プログラムは,高根2)に従って,S言語4)で作成した。 Ⅲ.実例用のデータ行列  以降で仮説提示を例解するのに用いるデータ行列について,前回のテクノレポートの記述5)と一部重複するが,ここにまとめておく。 1.評価対象の作文  ビジネス文書作成の演習として,「米国留学の旭丘高校2年生服部 剛史君射殺事件をどのように考えるか,ワープロで1-2頁にまとめよ。」という課題で短大の情報工学専攻の3年生が作文を作成した6)。そのうちから,文章の分量が適正で,かつ,文法的誤りの比較的少ない作文4篇を選定した。  次いで,同一課題で作成させた健聴大学生の作文を4篇つけ加えた。  こうして,健聴大学生と聴覚障害短大生の作文それぞれ4篇ずつ,合計8篇の作文が得られたので,作文番号1~4を健聴大学生の作文に,作文番号5~8を聴覚障害短大生の作文に付番した。 2.作文の評価者  上述した8篇の作文に対する評価を,以下のような人々に依頼した。 グループD1:短大の情報工学専攻の1年生(19歳)10名。入学して,10カ月が経過した時点で,定員10名の全員が参加した。 グループD2:短大の同上・専攻の3年生(21歳)9名。卒業2ヶ月前の時点でこの調査に参加した。同じ3年生と言っても,作文作成者は第2期生で,このグループの評価者は第3期生であり,作文作成者と評価者とは重複していない。 グループD3:聴覚障害の教官11名。内訳は,1995年度に短大で教鞭を執る聴覚障害教官の全員5名と,聴覚障害の非常勤講師6名である。 グループH1:1996年度の筑波大学第2学類の1年生(19歳)10名。全員が健聴である。 グループH2:1996年度の筑波大学教育研究科修士課程学生(23歳)10名。全員が健聴である。 グループH3:短大の健聴教官15名。1995年度に短大で教鞭を執る健聴教官から約30%を無作為抽出した。  こうして合計65名の評価協力が得られた。以上の評価者の構成を表1にまとめて示す。 表1 評価者 3.評価方法  評価方法は,観点評価法(藤井,1993(7)を適用し,下記の5項目の評価観点を採り上げた。 ①題意適合性:作文の内容が課題に適切に答えているか。 ②表記正確度:誤字脱字・文法的誤りがないか。 ③論理展開力:順序を追って論理的に説明しているか。 ④独自発想力:自分独自の考えを持っているか。 ⑤将来展望力:将来展開にも自分の考えを持っているか。  作文1篇毎に,上記の5項目の評価観点の点数を1項目20点満点でつけることにした。  そして,評価者には,作文作成者の所属・氏名・聴能(聴覚障害・健聴)等を一切伏せて,単に作文番号との対応において作文内容を評価させた。さらに,8篇の作文を無作為抽出法により2組に分け,前半の組(作文番号1,2,5,6)を1週間で採点するように評価者に依頼し,それを回収した後で後半の組(作文番号3,4,7,8)の採点を依頼した。 4.採取されたデータ行列  こうして採取きれたデータの集計結果を表2に示す。 この表2において,表頭は,8篇の作文毎に5項目の評価観点について採点した結果(40変量)を表す。最初の20列(5評価観点×4篇)は,健聴大学生の作文4篇に対応し,データ行列後半の20列は聴覚障害短大生の作文4篇に対応する。表側は,評価者65名(標本)を表す。順番としては,グループD1(10名),グループD2(9名),グループD3(11名),グループH1(10名),グループH2(10名),グループH3(15名)である。  例えば,60行39列のデータが13とあるのは,評価者60番(グループH3の健聴教官)が作文8番(短大の聴覚障害学生の書いた作文)について,④独自発想力の評価観点から評価した点数が13点であったことを示している。 表2 実例用のデータ行列 Ⅳ.仮説提示の実際 1.制約付き主成分分析法の適用  前掲の表2のデータ行列に,外部情報として, *標本側に聴能(聴覚障害・健聴)及び世代(ジュニア学生・シニア学生・教官)の情報(G) *変量側に評価観点(①題意適合性;②表記正確度;③論理展開力;④独自発想力;⑤将来展望力)の情報(H)を与えて,制約付き主成分分析法の計算を施した。  その結果,データ行列は4項目に分解された。その第1項の寄与率はわずか3%であり,GとHとの相互関連はきわめて薄いことが判明した。第2項以降の寄与率は,それぞれ36%,8%,52%であり,対応するHのみに関する項目,Gのみに関する項目,HとG双方に無関係な項目については,さらに内部分析を施すことにした。 2.仮説の提示とその検証 2.1仮説1(評価の甘さと聴能)  寄与率36%の第2項(Hのみに関する項目)に内部分析として主成分分析法を施したところ,寄与率66%で第1主成分が得られた。その因子負荷量を表3に示す。  この表3を見ると,因子負荷量の係数がすべてプラスである。いずれの作文かを問わずに5つの評価観点にすべてプラスを付ける評価者は評価が甘いことが示唆される。こうして,第1主成分は評価の甘苔を表すと判断した。すると,対応する第1主成分得点は,プラスの場合は評価者が甘い,マイナスの場合は辛いことを示すことになる。そこで,この主成分得点データを,聴覚障害・健聴の分類基準で仕訳してみると,表4が得られた。  こうして,表3の第1因子負荷量と表4とから次のような仮説が導かれた。 仮説1:評価者には評点が甘い者や辛い者が混じっているが,聴覚障害と健聴とでは,その混じり方に差はない。 仮説の検証:データ行列から,8編の作文の評価平均点を各評価者について計算した。そのとき,全評価者平均より高い点を付けた者は甘く,低い者は辛いということになる。元のデータ行列から実際に計算したところ,聴覚障害の評価者については,甘い者13人;辛い者17人,健聴の評価者については,甘い者20人;辛い者15人であった。仮説1は成立していると判断できよう。 2.2仮説2(評価の甘さと世代)  同じ第1主成分得点を,次に世代という分類基準で仕訳してみると,表5が得られた。  こうして,表3の因子負荷量と表5とから次のような仮説が導かれた。 仮説2:評価者には評点が甘い者や辛い者が混じっているが,評価者の世代間では,その混じり方に差はない。 仮説の検証:仮説1の検証に用いたデータを援用すると,ジュニア学生では,甘い者11名;辛い者9名であった。 シニア学生では,甘い者10名;辛い者9名であった。教官では,甘い者12名;辛い者14名であった。これから,仮説2は成立していると言えよう。 2.3仮説3(聴障・ジュニア学生の作文選好)  寄与率8%の第3項(G自身に関する項目)をさらに内部分析するために主成分分析法を施したところ,寄与率42%,25%で2つの主成分が得られた。その主成分得点を表6に示す。  この表6の第1主成分を見ると,聴覚障害のジュニア学生のところのみ係数がプラスであり,他は0あるいはマイナスである。対応する因子負荷量を調べると,作文1,2,7がプラスであり,作文3,4,5,6,8はマイナスであった。これから次の仮説が導かれた。 仮説3:聴覚障害のジュニア学生は,他の評価者とは異なる作文選好を示し,作文1,2,7を好み,他の評価者は作文3,4,5,6,8を好む。つまり,聴覚障害のジュニア学生とその他の評価者とは正反対の作文選好を示す。 仮説の検証:元のデータ行列から,8篇の作文毎に,聴覚障害のジュニア学生(10名)の評点平均を計算した。同様に,その他(55名)の評価者の評点平均も計算した。結果を表7に示す。  この表7を見ると,聴覚障害のジュニア学生は,作文1,2,7を好み,その他の評価者は作文3,4,5,6,8を好む。仮説3は確かに成立している。 2.4仮説4(教官の作文選好)  次に,表6の第2主成分を見ると,聴覚障害の如何に関わらず,教官のところのみがプラスである。対応する因子負荷量を調べると,作文1,5,8がプラスであり,作文3,4,6,7がマイナスである。これから次の仮説が導かれた。 仮説4:教官と学生とは作文の好みが異なる。教官は,作文1,5,8を好み,学生は作文3,4,6,7を好む。 仮説の検証:元のデータ行列から,8篇の作文毎に,教官(26名)の評点の平均を計算した。同様に,学生(39名)の評点の平均を計算した。それを表8に示す。  この表8を見ると,教官は作文1,5,8を好み,学生は作文3,4,6,7を好む。仮説4は成立している。 2.5仮説5(評価提示順序)  寄与率52%の第4項(HとG双方に無関係な項目)にさらに内部分析として主成分分析法を施したところ,17%,10%の寄与率で2つの主成分が得られた。まず,第1主成分の因子負荷量を調べてみると,作文1,2,5,6がプラスであり,作文3,4,7,8がマイナスであった。この符号の差異に触発きれて気づいたことは,1週間ずつずらせて作文評価をさせるために8篇の作文をランダムに4篇ずつ2組に分けた時の,前半の組が作文1,2,5,6であり,後半の組が作文3,4,7,8であったことである。従って,第1主成分は,作文の提示順序を示唆している。そこで次の仮説が導かれた。 仮説5:作文の提示順序により,前半の週に甘く,後半で辛く採点する評価者と,その逆の評価をする評価者とが存在する。 仮説の検証:8篇の作文はランダムに2組に分けたので,どちらかの組のみに優れた作文が偏在することはないはずである。そこで,ある評価者が前半の週で作文1,2,5,6を評点(各作文100点満点)した平均値と後半の週に作文3,4,7,8を評点した平均値との差は,公平に評点している限り,0に近いはずである。  ところが,全評価者(65名)中に,プラス10点以上も離れている(前半に高い点を付け,後半に低い点を付ける)評価者が9名,その逆にマイナスで10点以上が14名もいることが元のデータ行列から判明した。 2.6仮説6(作文作成者の聴能)  次に,第2主成分の因子負荷量を調べてみると,作文1,2,3,4がプラスであり,作文5,6,7,8がマイナスであった。  これから触発されて気づいたことは,8篇の作文のうち作文1,2,3,4は健聴学生が書いたものであり,作文5,6,7,8は聴覚障害学生が書いたものであるということである。従って,第2主成分は,作文作成者の聴能(健聴か聴覚障害か)を示唆している。これから次の仮説が導かれた。 仮説6:健聴学生の書いた作文より聴覚障害学生の書いた作文を高く評価する者とその逆の評価をする者とが存在する。 仮説の検証:各評価者が,健聴学生の書いた作文(1,2,3,4)を評価した点数の平均値と聴覚障害学生の書いた作文(5,6,7,8)を評価した点数の平均値との差は,もしも作成者の聴能と作文の優劣とが無関係ならば,その差は0に近いはずである。ところが,元のデータ行列から計算してみると,その差がプラス(健聴学生の書いた作文を高評価する)者が46名いた。その差がマイナス(聴覚障害学生の書いた作文を高評価する)者は15名いた。従って,健聴学生の作文に高得点を与えた評価者が多いことを示していると同時に,マイナス側にも評価者が存在していることは,仮説6を裏付けるものである。 2.7仮説7(表記順序と内容評価との交絡)  実は,これまでデータ行列の変量を規準化(平均を減じて標準偏差で除算する)してからCPCA法を適用してきた。ここで,規準化をしないで制約付き主成分分析法を施してみた。すると,評価観点に関する因子負荷量が,表9のように得られた。  作文を評価する際の評価観点として,①題意適合性;②表記正確度;③論理展開力;④独自発想力;⑤将来展望力を採用したのだが,その因子負荷量が表9によると単調減少している。よって,次の仮説が導かれた。 仮説7:作文の評価観点に対する評点は,単調減少するようになされる。 仮説の検証:元のデータ行列から計算した評価観点の評点の実績値を表10に示す。仮説の主張はほぼ成立する。  ここで,評価観点の係数がほぼ単調に減少しているという計算結果に触発されて,アンケート調査で問題があったことに気づいた。実際では,作文毎に評価観点の表記順序はすべて固定されており,常に上述の①;②;③;④;⑤の順であった。そこで,評価者が順を追って採点していくうちに評点が辛くなる性癖の場合には,内容の評点と表記の順序とが交絡してしまう。 表3 因子負荷量 表4 主成分得点 表5 主成分得点 表6 主成分得点 表7 仮説の検証 表8 仮説の検証 表9 因子負荷量 表10 仮説の検証 Ⅴ.仮説提示上の注意点 (1)データ行列は-標本に過ぎない。仮説成立を確実にするためには,重ねての標本採取が必要である。 (2)CPCA法は,得られた仮説の価値を判断できない。その取捨選択は,研究者の判断にゆだねられる8)。 (3)有用な仮説が豊富に得られるか否かは,デー行列と外部情報(標本側外部情報・変量側外部情報)の与え方による。 (4)CPCA法のアウトプットである「仮説」を,次のCPCA法の「外部情報の再設定」に活用するという反復プロセスは本質的に重要である。 参考文献 1)Hempel,C.G.(1966)Philosophy of Natural Science, Prentice-Hall, Inc.,New Jersey.黒崎 宏訳(1967)自然科学の哲学.培風館,4-28. 2)高根 芳雄(1992)制約付き主成分分析法について.行動計量学,19(1),29-39. 3)柳井 晴夫・竹内 啓(1993)射影行列・一般逆行列・特異値分解.東京大学出版会,111-131. 4)Everitt,B.S.(1996)A Handbook of Statistical Analyses using S-PLUS Chapman & Hall,London,89-103. 5)小池 将貴(1996)聴覚障害及び健聴の大学生が書いた作文を素材とした短大生意識の解明.筑波技術短期大学テクノレポート3,163-170. 6)小池 将貴(1995)多様な評価者による聴覚障害学生の作文の評価.特殊教育学研究,33(3),23-31. 7)藤井 圀彦(1993)文章表現力の基礎指導.東洋館出版,219-288. 8)Koike,M.(1996)Evaluation of Essays by Both Hearing Impaired and Normal Hearing Students. The Fifth Asia-Pacific Congress on Deafness,Korea.