[PR]今日のニュースは
「Infoseek モバイル」

統計とコンピュータ

 新課程数学2B(数学II・数学B)の救世主との声もある統計とコンピュータです。 センター試験で数学2Bが必要な人は必見です。

 まずは基礎知識。
 大学入試センターの発表によると,数学2Bでは,「数列」「ベクトル」「統計とコンピュータ」「数値計算とコンピュータ」のうち,2項目以上学習したものに対応した出題であり,問題を選択解答するそうです。 これは去年までの旧課程数学2Bといっしょです。単元は違いますが。
で,そのうち「統計とコンピュータ」があからさまに簡単に見えるわけです。 学校で「統計とコンピュータ」を選択していない人がです。 試作問題というのがあるんですが,少し国語力がある人なら(2)の[シ].[ス]まで埋められます。 そして数学Cで「確率分布」を履修している人ならなんと,最後の設問以外すべて埋められます。 もう一度言いますが,学校で「統計とコンピュータ」を履修していない人が,です。 2005年の第2回全統マーク模試も最後の設問以外は埋められるようなものでした。
 大学入試センターがこれからどうでるか,それはわかりません。 しかし,試作問題どおりのような出題がなされるのであれば,明らかにほかの単元より労力が少なくてすみます。 いわば公民でいう倫理のようなものです。試験場で頭をひねる代わりに,少ない労力で高得点が狙えます。 食わず嫌いをせずに,一度検討してみるのが得策だと思います。

 以下,センター試験に出る部分という観点から見たまとめ。 ちなみに出題履歴がないので予想が入っています。 まあ多少でないところを覚えたところで,ベクトルとかよりも覚えることはよっぽど少ないので勘弁してください。


 まず細かい専門用語は説明しだすときりがないので,ある程度想像力で補いましょう。 センター試験ならそれほどきわどい出題はしない,と言うかできないでしょう。

 度数…ある値のデータの個数。とだけ覚えておけば十分。問題を何回か解けばわかります。
 相対度数その値のデータの個数が,全体の何パーセントを占めているかを示す割合。 また,無作為にデータを選んだとき,そのデータを選ぶ確率。 教科書にはいきなり公式として,「各値の度数を度数の和で割った値」と書いてあるんですが,それじゃイメージがわかなくて覚えにくいと思います。 ちなみに,相対度数は確率と同じように扱えます。詳しくは以下。

 以下説明上,あるデータ12,…,12,…,があるとします。
 平均値…説明する必要があるんでしょうか?まあ一応言っておくと,
_          12+…+
=(1/)Σ =―――――――――
      =1       

という,小学校で習ったような極当たり前の知識を用いて計算します。 また,相対度数が確率として扱えることを考えると,平均値は期待値として扱えるため,「{(各変量の値)×(相対度数)}の総和」は,平均値に等しくなります。 さらに,Σ演算の公式を用いれば,以下の公式が得られます。
_                        _____
=(1/)Σ =(1/)Σ()+) +
      =1       =1

これは皆さんが日常的に使っていることで,たとえば「100,101,104,107」の平均を求めるときに,皆さんは「0,1,4,7」の平均3を求めたあと,100+3=103という答えを出すでしょう? だから,ここで仰々しく書くまでもないんですが,一応,ね。

 メジアン(中央値)…データを小さい順に並べたとき,真ん中に来る値。 人によっては大きい順という人もいますが,真ん中なので大きい順でも小さい順でも変わりません。 データが奇数個の場合は問題がないのですが,データが偶数個だと,真ん中の数が2つ出てきます。 そのときはその2つの平均値をメジアンにしてください。
例を挙げます。「2,5,6,3,4,2,6」のメジアンは,「2,2,3,4,5,6,6」と並び替えたときに真ん中に来るです。
「2,4,3,1,5,2,5,7」のメジアンは,「1,2,2,3,4,5,5,7」と並び替えたとき真ん中に来る3と4の平均値3.5です。
メジアンはこれだけしかないので,いろいろ工夫して難しくしてあっても,ちょっと考えればわかります。

 モード(最頻値)…そのデータの中で,最も多く現れる変量。以上。これ以上の説明はない。
「1,1,1,1,1,1,1,2,2,2,3,4,5,5,6,7」というデータがあったら,モードは一番多く現れているです。

 レンジ(範囲)…そのデータの中の最大値と最小値との差。
「1,2,3,4,5,6,7,8,9」というデータがあったら,レンジは9−1=です。

 偏差…あるデータに対して,「(ある変量の値)−(その変量の平均値)」を偏差といいます。
「1,2,3,4,5,6,7」というデータがあったら,平均値が4なので,偏差はそれぞれ「−3,−2,−1,0,1,2,3」となります。

 分散…変量の分散をと表すことにします。
            _               _
=(1/)Σ( )=(1/)Σ −( )
       =1            =1

つまり分散とは,「(の偏差)の平均値」であり,「(の平均値)−(の平均値)」に等しいわけです。 さすがに統計で虚数を扱うことはないと思いますので,分散は常に正の値をとります。 分散を求めよといわれたら,機械的に計算するだけです。
分散を求めるときに楽をしたいなら,平均値と同じようにいくらかずつ減らして考えましょう。 分散の場合は,次の式が成り立ちます。
±
つまり「100,101,104,107」の分散と「0,1,4,7」の分散は等しいということです。ためしに計算してみると,
(前者の分散)=(10000+10201+10816+11449)÷4−10609=10616.5−10609=7.5
(後者の分散)=(0+1+16+49)÷4−9=16.5−9=7.5
となり確かに一致してます。証明したければ定義を用いて文字式でΣ演算すれば出ますが面倒なので割愛。

 標準偏差…普通σで表すのですが,教科書ではなぜかで表しています。
標準偏差とは,簡単に言うと分散の正の平方根です。 難しく言うと「σ1/2」です。 これ以上言うことないのですが…。

 共分散の共分散をxyで表すことにします。これも公式に代入するだけで,
             _      _
xy=(1/n)Σ( )( )
        =1

で求められます。また,xyの平均値が楽に求められる場合には,
               _ _
xy=(1/n)Σ  
        =1

を用いると楽です。 共分散という言葉は教科書にないので直接聞かれることはないと思いますが,次の相関係数を求めるのに必須です。

 相関係数で表します。 簡単に言うと,xy÷(σσ)」です。 難しく言っても「xy÷(σσ)」です。 これもとにかく代入すればでます。 しかしここまで来ると結構計算が大変です。 上で挙げた楽をするための公式を使って,少しでも計算量を減らしましょう。
 ちなみに,相関係数は,−1≦≦1の範囲にあります。 これに含まれていない数字が出た場合は計算ミスということになります。
 また,正の相関関係が強いほどは1に近づき,負の相関関係が強いほど,はー1に近づきます。 相関関係がなければ,は0に近づきます。 河合塾はこの事実を用いて答えさせるのが好きみたいですが,残念ながらセンター試験ではそのような定性的な問題よりも定量的な問題が出題される可能性のほうが高いです。


 「統計とコンピュータ」では表計算ソフトの利用が含まれているのですが,果たして出題されるのでしょうか? 新指導要領によれば,

(3) 統計とコンピュータ
統計についての基本的な概念を理解し,身近な資料を表計算用のソフトウェアなどを利用して整理・分析し,資料の傾向を的確にとらえることができるようにする。
ア 資料の整理
度数分布表,相関図
イ 資料の分析
代表値,分散,標準偏差,相関係数

とありますが,問題作りにくいし,第一ア,イのところにコンピュータという言葉がひと言もないというのがなんとも。 出題されたときは,標準以上の英語力で関数の意味を解読すれば解けないこともないと思います。 無理か。一応,教科書程度の関数の意味についてまとめておきます。 ちなみに関数はおそらくExcelを使ったものだと思われます。 思われますって言うのは,教科書に明示的に書いてないからです。 ちゃんと書いとけよ。
 と言うことで,表計算ソフトの部分まで極めたいという人は,Excelで入力しながらやることをお勧めします。 詳しいことはアシスタントのいるか君にでも聞いてください(←ダメ)。 面倒な人は,表計算ソフトが出たらあきらめるというのも一つの手です。

SUM
  総和。指定したセルに入ってる数字の和を示す。

SQRT
  正の平方根を求める。

FREQUENCY
  指定した複数のセルのうち,ある階級の区切り以下で,前の階級の区切りよりも大きいデータの個数を求める。

AVERAGE
  平均値。指定したセルに入ってる数字の平均値を示す。

MEDIAN
  メジアン。指定したセルに入ってる数字のメジアンを示す。

VARP
  指定したセルに入ってる数字の分散を示す。

STDEVP
  指定したセルに入ってる数字の標準偏差を示す。

CORREL
  指定したセルに入ってる数字の相関係数を示す。

 教科書も適当にごまかしているため,あまりきわどい出題はできないと思います。 命令の意味が分かっていれば解けると思います。


 以上です。多分これだけ覚えておけば大抵の問題は解けると思いますが,どうでしょう?

 黒本の第3回に,表計算ソフトをテーマにした問題があるんですが,一応高校生並みの国語力・英語力を持ってすれば解けると思います。 何事もやる前からあきらめずにやることも重要。

demile_passalan@yahoo.co.jp