〈解説〉平均値と偏差、平方和、分散

平均値

データを数直線上にプロットしたときの、重心の位置にあたる値が平均値です。数直線を重さのないてんびん棒、データを重さ1のおもりと考えたとき、てんびんがつり合う位置が平均値です。

偏差

データからある定数を引いた値を偏差といいます。通常は平均値を引いた値を指します。平均より小さいデータの偏差(負の偏差)の絶対値の総和と、平均より大きいデータの偏差(正の偏差)の絶対値の総和は等しくなり、足し合わせると0になります。

分散

偏差を二乗して総和をとった値を偏差平方和(偏差二乗和)といいます。偏差を計算するときのある定数をデータの平均値にすると、偏差二乗和は最小の値をとります。平均値からの偏差二乗和をデータ数(自由度)で割った値が分散で、分散が小さいほど、データが平均値のまわりに密集しており、分散が大きいほど、データが平均値から離れて散らばっていることを意味する指標です。

直感と計算とのずれを体感する

このシミュレーションでは、プロットの配置だけをたよりに、平均値の位置を探します。データが左右対称でない場合、平均の位置は直感と大きく異なる場合があります。直感に頼らず、偏差の和や偏差二乗の値に注目して、正しい平均値の位置を探してください。

〈使用方法〉仮平均を示す緑線を正しい位置に動かそう

黒い●でデータがプロットされています。データの平均値を予想し、仮平均値の位置を示す緑色の縦線を、正しい平均値の位置に動かしてください。動かし方は、次の2つの方法があります。

  1. 緑色のバー をクリックすると、クリックした位置に移動します。
  2. をクリックすると、少しだけ左右に移動します。

観察モード :仮平均値が自動的に変化します。偏差や偏差平方の和の変化を観察しよう。

答え合わせ :正しい重心=平均値の位置を赤い線で表示します。

なお、データの値はあえて表示していません。プロットの配置だけをたよりに平均値=重心を予想してみてください。

〈学習課題〉偏差の総和、偏差二乗和の変化のしかたに法則はあるか

  1. 答え合わせ後に表示されるローデータを用いて、仮平均値が変化すると、偏差の総和がどのように変化するかを計算してみてください。変化のしかたに、どんな法則があるかを考えてみましょう。
  2. ローデータを用いて、仮平均値が変化すると、偏差二乗和がどのように変化するかを計算してみてください。こちらは、変化のしかたに、どんな法則があるでしょう。
  3. ここには示していませんが、偏差の絶対値の平均(\(\frac1n \sum |x_i-\bar x|\))を、データの散布度の指標にするという考え方もあります。仮平均値が変化すると、偏差絶対値の平均はどのように変化するでしょう。何か法則は見つかるでしょうか。

設定と実行

データ数: