タラコの卵粒数の推定と集合知 筑波技術大学 障害者高等教育研究支援センター 加藤 宏 要旨:「素人の判断」もその代表値をとれば結構正しいという「集合知」の存在をタラコの卵の数の推定課題で確認した。ゴールトンの提起以来、集合知は広く知られているが、まだそのメカニズムは解明されたとはいえない。本研究では大学生を対象にタラコ片腹に含まれる卵粒数の推定課題と推定理由を調査した。平均値よりも中央値の方が実際の値に近い推定値が得られた。推定理由からは様々な方略や既有知識が用いられていることが明らかになった。推定値の正確さや推定方略は学生の専攻や障害とは関係なく、数理リテラシーや視覚イメージの利用と関係していることが示唆された。 キーワード:集合知,推論方略,イメージ,視覚障害 1.はじめに  「素人の意見」もその平均をとれば結構正しい[1,2]といういわゆる「集合知」により「正しい判断」がなされることが種々の場面で見られるという事実はゴールトンの報告[3,4]以来広く知られている。  本研究では、「タラコ片腹(一袋)には、何個の卵があるか」という、日常よく親しまれている食品に関するものでありながら単純には答えられない問題を出して、「集合知」の効果が見られるか検証した。また、素人は実際にどのような思考過程を経て解決に至っているのかを、推定方略を書かせることによって確認した。さらに、視覚に障害があり、卵一粒一粒とタラコ一袋の関係が感覚的にはとらえられにくいと考えられる視覚障害学生にも同様の課題を課して、集合知による平均値の推定と推定方略に特徴があるか調べた。 2.集合知とは  ゴールトンはダーウィンのいとこで自らは知的階層に属し、むしろ素人には正しい判断などできないと考えていた。民主主義にも反対で、優秀な人間のみが社会を指導していくべきであるという優生学的思考を抱いていた[5]。  彼は1906年自宅近くのプリマスの町で開かれていた家禽の見本市に出向いた。そこでは1頭の牡牛の精肉後の重量を当てる懸賞付きコンテストが行われていた。コンテストに参加していた800人弱は多彩な顔ぶれだった。畜産農家や食肉業者も含まれていた。しかし、家畜について全くの素人も多かった。  統計学者でもあったゴールトンはコンテストの後でチケットを譲り受け分析した。なんと全投票の平均は1197ポンドで実際の重量は1198ポンドだった。しかも専門家でこの平均値よりも近い値を言い当てていた者はいなかった[1]。不十分な情報しかもたない人々の集合の平均がなぜもっとも正しい判断をもたらしたのか。  しかし、同時にゴールトンは平均値が外れ値に左右されやすいことも承知していた。彼は中央値の優位性を主張しており[6,7]、一般にも分布の偏りや外れ値がある場合は標本平均よりも標本中央値の方が代表値としての頑健性が高いと考えられている[8]。 3.集合知の実証実験  平成23年及び24年度1学期の授業の一貫として、2つの大学で「心理学」他の授業中に、一般的にはその数値が知られておらず、かつ直観的にも推定値を求めにくいと考えられる特性値を求める課題を実施した。両大学とも実施に当たっては課題の結果は成績等には一切関係せず、心理学と教材研究の資料としてのみ使用することを説明した。データの使用については、自署による承諾書を取った。データ使用の承諾を得られなかった者1名については処理から除外した。  なお、本調査実施以前には授業中に「集合知」については説明していなかった。 3.1 被験者 (1)国立A大学1年生125名、学部は人文学部、教育学部、理学部、工学部、農学部にまたがっていた。 (2)視覚障害者のみ入学できる国立B大学保健科学部1年生15名、2年年生9名、4年生1名の計25名。うち点字使用4名、データ・ファイル使用1名であった。ここでデータ・ファイル使用者とは比較的最近に視力が低下したため学習用に点字等を使用できずテキスト・データを合成音声によって読んでいる者をさす。残りは全員拡大文字使用だった。学科・専攻は鍼灸学、理学療法学、情報システム学に渡っていた。 3.2 課題  A・B大学とも授業時に「タラコの片腹(1本)に含まれる卵の数は何個くらいだと思いますか。(1)あなたが考えた卵の個数:(2)上の推定値をどのように考えましたか。」と課題を出した。(1)、(2)とも自由記述形式とした。回答に当たっては、ネット等で検索しないこと、他人に相談しないこととした。B大学においては点字使用の学生は同級生が代筆した。ただし、うち1名はメールにて回答した。 4.結果 4.1 片腹(一袋)に含まれる卵の数の推定値  データの分析および作図にはフリーウェアの統計ソフトRを用いた。 A大学  回答は125名で、平均値は40,089,916個で約4千万個。最大値は30億個、最小値は180個。図1のヒストグラムに示すように10億台の推定は30億個と推定した者が1名のみで、これを除き1億以上が9名いた。外れ値として上限、下限からデータの25%を除外して計算した場合の平均は696,662となり、約70万個だった。一方、分布の偏りの影響を受けにくいとされる順序尺度系の代表地としての四分位数の第1四分位数(データの小さい方から数えて25%)は14,000、第3四分位数(データの小さい方から数えて75%)は100万で中央値(データの真ん中)は4万個だった。 B大学  25名中データ使用の不同意が1名あったので24名の回答を結果の処理に用いた。推定値の平均は444,262,154個で4億を超えており、最大値は8,589,934,592個で85億以上、最小値は12個だった。なお、この約85億という最大値には回答者の携帯電話の計算機能で表示できる最大値という理由が添えられていた。図2のヒストグラムに示すようにこちらも外れ値に引きずられて平均値が上昇した可能性があることがわかる。  四分位数でみると第1四分位数は2,750、第三四分位数は5,825万で中央値は10万個だった。  いずれの大学も極端に大きな推定値を求めた少数者に平均値は引き付けられて上昇していることが分かった。  図1・2でヒストグラムの階級の区切り幅が異なるが、ここでは区切り幅をそろえることではなく、両分布の全体にわたる概形をとらえる目的で、ヒストグラムの階級選択の適切化理論であるスタージェスの方法[15]を共通して適用したためである。  次に外れ値がある場合に視覚的に表現する方法として用いられる箱ひげ図を示す(図3)。箱ひげ図においても過大評価の方向で少数者の極端な外れ値が含まれていることが分かり、平均値を代表値とした場合、両大学のデータともに外れ値の影響が顕著となるであろうことが推測される。 4.2 推定に使用された知識・方略  次に推定の根拠についてA大学についてまとめる。推定値を求めた理由に示された自由記述を実験者が分類したものが表1である。方略分類のカテゴリーについては述べられている理由の内、主たる理由として採用された方略ひとつを選び、被験者ごとに割り当てたものである。ただし、「複合情報戦略」とは「視覚イメージ」+「空間充填」、あるいは「生存戦略」+「空間充填」のように複数の情報源に基づく推定方略を組み合わせて使用していて、代表方略ひとつに特定できないものを指す。  以下は各方略分類カテゴリーの内容の説明である。「直観・イメージ」とは「ただ、なんとなく」という直観的当て推量を理由としてあげているものと視覚イメージや食感からのイメージを挙げたものを含む。「生存戦略」とは、魚類の産卵数と繁殖戦略に関する知識を運用し、マンボウやサケの場合と比較してタラの産卵数を推定してものをさす。「空間充填」とは、タラコの片腹の大きさと卵粒1粒の大きさの比較から、何個の卵でタラコ一袋分を充填できるかという方略で推定値を算出している場合である。タラコの概形と容積を円柱や立方体として求め、これに球または小立方体としてモデル化した卵粒が何個充填できるかという問題として解を求めている。  上記3つが推定に用いられた主たる情報および方略であるが、「生存戦略」と「空間充填」など複数からの情報を組み合わせた「複合情報戦略」が上記3方略に続いて多く用いられた。その他「知っていた、聞いたことがある」という既有知識からの回答もあった(ただし、記憶している推定値が適切かは別)。「重量比」はタラコの片腹の重量の感覚と卵一粒の重量の感覚から充填されている個数を推計しようとしたものである。  推定のための方略は視覚に障害のあるB大学でも同様に多様な知識・情報をもとに推定値が求められていた。しかし、大半は直観やイメージの使用が多かった(20名、79%)。イメージには食感や数の位取りイメージといった視覚によらないイメージが含まれていた。用いられた既有知識は「生存戦略」ではなく、人間の全身の細胞数とタラコの大きさの体積比であった(2名)。その他は空間充填が1名(計算有り)、テレビからの情報が1名いた。 4.3 図や計算式の使用  次に推定値を算出する過程において、図や計算式を使用したかについて述べる。表2にA大学125名について図と計算式の使用をまとめた。  全体の約20%が図または計算式を使用しており、その多くが重複して使用していた。FisherのExact Test法による独立性の検定ではp値は5.676e-10で有意であり、明らかに図と計算は連関して使用されていた。つまり、推定に図を使用した者は単なる当て推量ではなくタラコの一袋の形と大きさと中に含まれる卵粒についての空間充填モデル等のモデルを想定し計算している傾向にあった。  B大学では図使用は1名のみで、計算式をあげた者は2名であった。図と計算の併用者はいなかった。計算過程を示した者1名は空間充填モデルを用いて推定値を算出していた。他の1名は携帯電話に入力できた最大の計算式と計算結果を用いていた。図と計算の連関については各セルの十分なケース数が得られなかったため検討しなかった。 4.4 推定方略別の推定理由の代表的記述  以下に推定の方略との推定理由の記述例である。カッコ内はA・B両大学回答者が実際に回答した推定値である。視覚障害の有無による差がなかった。 (1)直観・イメージ方略: 食感イメージ:「実際にタラコを食べた時の食感や見た目で考えました。(100万個)」 視覚イメージ:「東京マラソンで走る人々を連想した、スタート時。(3万個)」 直観:「なんとなく。(4万個)」 (2)空間充填方略 「卵を0.5mm、タラコを直径2cm、長さ10cmと仮定して推定。片腹の断面積/卵1個の断面積*片腹の長さで推定(4万個)」 「タラコ1本の容積を(8cm*2cm*1cm=16cm^3とする。16cm^3=16000mm^3.1立方ミリメートルの中の卵を4粒とすると16000*4=64000。(6万4千個)」 (3)生存戦略方略 「人間等の哺乳類と違って魚類は生存競争が激しく、親が子を育てることはほとんど行わないために、卵が大量でも成体になるのは多くて1腹から2~3匹。(1億5千万)」 (4)経験・知識方略 「確か高校の生物の授業で1腹約155,000位だと聞いたので、その半分の7500、だと思いました。(7万5千個、1ケタ計算間違い)」 (5)重量比方略 「卵1つを0.0001グラムとすると100万ぐらいあれば、もとのタラコの重さが現実的になるから。(100万個)」 5.考察 5.1 タラコ片腹の卵数の生物学的推定値と集合知による推定値  課題に関する特別な専門知識を持たず、インターネット検索などを利用できない条件での大学生集団の推定値の中央値は2集団で4万個と10万個であった。  では、実際のタラコ片腹の卵数についての推定値はどのように求められているのか。 (1)高校生物Ⅱの実験のテーマとして推定されたもの[10]。市販のタラコを用意し、卵巣の全重量を電子天秤で測定する。次に卵1個の重さを測定ずる。卵1個の重量の推定値を算出するための使用したサンプル数や卵巣のサンプル数についての記述はない。卵巣重は52.675g,卵1個は4.7×10-4g。よって1卵巣中の卵数を約11万2千個とした。これは重量比を用いた推定法といえる。 (2)イオンお客様サイトより[11] 一腹(2袋)の卵数を20万~150万粒としている。片腹では10万~75万ということになる。個体差が大きいことがわかる。推定値の出典と推定方法は示されていない。 (3)小学生が少量分(1g)だけを手分けして実際にカウントして、あとは全体重量から算出している例では6万9千個だった[12]。 (4)北海道立総合研究機構の水産研究本部のマリンネット北海道のページのスケトウダラの解説[13]では産卵数はタラの体長にもよるが20万個から30万個としている。片腹にすると10万から15万ということになる。  総合するとタラの大きさにもよるがタラコ片腹に含まれる卵は数万~数10万個というかなり幅のある値となった。1サンプルではあるが、推定値ではなく片腹に含まれる卵を人海戦術ですべてカウントしつくした例では1腹で318,017個あった。片腹では約15万6千個ということになる[14]。推定方法が示されている場合は、1gあたりの個数をカウントし、タラコ全体の重量数だけ乗じて求める方法が多かった。ただし、どの報告も複数回カウントを実行しその平均と分散を算出しているものはなかった。 5.2 障害の影響  B大学の回答者の推定値は中央値で見る限りA大学とともに生物学的に知られている卵数の範囲内であった。推定に用いられた情報や方略は直観やイメージが多く、視覚以外の食感イメージや数の大きさ(位取り)イメージも使用された。計算に基づく空間充填方略の使用は少なく、既有知識も晴眼大学生の生物繁殖戦略の知識ではなく、生理学的知識(ヒトの細胞数)が使用された。これは大学入学後の学習によると考えられる。 6.まとめ  「タラコ片腹に含まれる卵数」に関する集合知は中央値で見る限り確認された。回答者は様々な情報や方略を用いて答えを推定していたが、集団としては妥当な結論に達していた。視覚に障害のある回答者集団においても集合知の存在は確認され、回答にいたる推論においても健常者と同様多様な方略が使用されていることが明らかとなった。 参考文献 [1] ジェームズ・スロウィッキー:「みんなの意見」は案外正しい,小高 尚子 訳,角川書店,2009. The Wisdom of Crowds: Why the Many Are Smarter Than the Few and How Collective Wisdom Shapes Business, Economies, Societies and Nations, James Surowiecki, Anchor Books, New York, 2004. [2] スコット・ペイジ:「多様な意見」はなぜ正しいのか,水谷 淳 訳,日経BP,2009,Page, Scott E., “The Difference”, Princeton University Press, New Jersey, 2007. [3] Galton, Francis: Vox Populi(The Wisdom of Crowds), Nature,No.1949, Vol.75, 450-451, 1907A. [4] Galton, Francis: Letters to the Editor, Nature, 75, 509, 1907B. [5] The Wisdom of Crowds, www.comp.dit.ie/dgordon/.../crowdwisdom.ppt [6] Levy, David M., & Peart, Sandra J.: The Tale of Galton’s Mean: The Influence of Experts, 2007, http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.138.8660&rep=rep1&type=pdf [7] Levy, David M., & Peart, Sandra J: Galton’s Two Papers on Voting as robust Estimation, Public Choice, 113, 357-365, 2002. [8] 佐藤 郁郎:「最大値の分布について(その1)」http://www.geocities.jp/ikuro_kotaro/koramu/278_max.htm, 2012年8月20日閲覧 [9] 社会情報サービス統計調査研究室:「平均値と中央値の違い」,2009.11.27, http://software.ssri.co.jp/statweb2/column/column0911.html, 2012年8月20日閲覧 [10] 池田 博明:高校生物実験実習中心授業,タラの卵数調査:http://homepage3.nifty.com/~hispider/allskill.htm,2012年7月20日閲覧 [11] イオンお客様サイト,おさかな牧場おさかな学習館,http://www.aeon.jp/kodawari/osakana/school/tara_002.html,2012年8月20日閲覧 [12] 朝日新聞「花まる先生公開授業:魚の産卵数はなぜちがう」2010年9月13日,http://www.asahi.com/edu/student/teacher/TKY201009120116.html,2012年8月20日閲覧 [13] 北海道立総合研究機構の水産研究本部のマリンネット北海道,スケトウダラ,http://www.fishexp.hro.or.jp/exp/fish/kuwashii/27.pdf,2012年8月20日閲覧 [14] 身の回りのいろんなものを数えてみよう!,http://www.ntv.co.jp/shukudai/2005/005.html,2012年8月20日閲覧 [15] Sturges H. The choice of a class-interval. J. Amer. Statist. Assoc., 21, 65-66.1926. Use of the “Wisdom of the Crowds” to Estimatethe Number of Egg Grains in Cod Roe KATOH Hiroshi Research and Support Center on Higher Education for the Hearing and Visually Impaired, Tsukuba University of Technology Abstract: If “the judgment of the amateur” occupies the average position, then we confirmed that the “wisdom of the crowds” was correct when we asked students to estimate the number of eggs in cod roe. Galton’s concept of collective intelligence is widely accepted. However, the mechanism by which it operates remains unknown. To confirm the phenomenon, we created an estimation problem: We asked university students to estimate the number of egg grains contained in cod roe found on one side of a cod’s abdomen. We then asked them to provide the reasons for their estimations. The students’ estimated median value, rather than mean value, was almost equal to the biologically known number of eggs. Based on the students’ reasons for their estimations, we found that they relied on a variety of strategies and preexisting knowledge to make their estimations. We found that the types of mathematical science literacy or types of multiple sensory imagery the students employed were critical with respect to their accuracy estimation and the stratagems used for collective knowledge. In addition, we found that the fact that students had visually impairments was not a decisive factor in their abilities to estimate accurately. Keywords: Wisdom of crowds, Strategies of estimation, Imagery, Visual impairment