2017年3月16日木曜日

健康番組の統計の間違い

よく健康情報などで、ダイエットの統計をとり、「これを飲めば、このように痩せます」ということを言っています。これは正しいのでしょうか?統計学の観点から検証してみましょう。

まず、第一に論理的に成立していないものは除きましょう。例えば、無条件に「これを飲んだら痩せます」という表現で、入って来るカロリーをどのようにして減らすのか、出ていくカロリーをどのようにして増やすかという論理的なところですが、これはまあ、適当にしておきましょう。

統計学では、サンプルをとるときに、信頼度などを決め、正規分布より計算します。サンプルは、母集団より無作為に選ぶのが普通です。難しい計算は抜きにして、実例を見てみましょう。信頼度95%、許容誤差5%では必要サンプル数は下記の通りになります。ご存じとは思いますが、母集団とは全体の人数で、許容誤差とは「このぐらいなら外れてもいいや」という誤差です。

許容誤差が5%の場合
母集団:100人→必要なサンプル数:80人となります。

100人ダイエットした人がいるなら、その成果は95%の確率を求めるなら、100人の内80人のサンプルが必要だということです。母集団が大きくなると必要なサンプル数の割合が小さくなります。

  ・母集団:1,000人→必要なサンプル数:278人
  ・母集団:10,000人→必要なサンプル数:370人
  ・母集団:100,000人→必要なサンプル数:383人
  ・母集団:1,000,000人→必要なサンプル数:384人

信頼度95%というと100人に5人ぐらいは外れると言うことですね。
もっと正確な値を必要とするなら、母集団10,000人の場合は、

  ・許容誤差:10%→必要なサンプル数:96人
  ・許容誤差:5%→必要なサンプル数:370人
  ・許容誤差:1%→必要なサンプル数:4,900人

  ・信頼レベル:90%→必要なサンプル数:264人
  ・信頼レベル:95%→必要なサンプル数:370人
  ・信頼レベル:99%→必要なサンプル数:623人

となります。

さて、健康番組の話をしましょう。
「5人の人に〇〇ダイエットを1週間やってもらった結果、平均3kg痩せました」
というような話があります。対象とする母集団(性別・年代・体型・身長など)の人数が10,000人なら、信頼レベル95%、許容誤差5%あたりが常識的でしょうから、370人のサンプルが必要になります。

テレビの科学番組という名目で5人程度の被験者を使った実験をしていますが、これだけのサンプル数では誤差に結果が左右されるので、科学的に信用できる実験ではありません。

0 件のコメント:

コメントを投稿

一括査定