科学論文で使われる統計学的概念p値を解説

科学論文には頻繁にp < 0.05やp < 0.01などの記号が登場します。

これらの記号には一定の理解があるかもしれませんが、その背後にある本質を深く理解している研究者はどれくらいいるでしょうか。

この記事では、p値の概念とその使用法について詳細に解説します。

いつ使われるのか

仮に、分子Xの阻害に関する従来の薬Aと新薬Bを考えてみましょう。

一般的に、私たちが注目するのは、新薬Bが薬Aに比べてどれだけ効果的なのかです。

言い換えれば、科学者たちはAとBの間の差を分析したいと考えています。

このような場合には、AとBの間の差を判断するためにどのような手法が用いられるのか、

その指標としてp値がしばしば用いられます。

どのように使用されるのか

p値は統計学において、自分が立てた仮説が正しいかどうかを判定するための指標です。

仮説を立てるとき、基本的には2つの種類があります。

例えば、A群とB群を比較する場合、「A群とB群には差がない」という仮説を立てることを帰無仮説と呼びます。

一方、「A群とB群には差がある」という仮説を立てることを対立仮説と呼びます。

通常は、「A群とB群には差がない」という帰無仮説を立て、その仮説を棄却することで対立仮説を証明することが一般的です。

順番が前後しましたが、仮説を立てる前に、有意水準の決定が必要です。

有意水準は帰無仮説を棄却するかどうかの目安となります。

簡単に言えば、p値が設定した有意水準よりも小さい場合、帰無仮説を棄却し、対立仮説が正しいことが示されます。

一般的には、有意水準は0.05(5%)に設定されます。

具体例

サイコロを使った具体例で、有意水準やp値の概念を説明します。

サイコロを10回振って1の目が6回出た場合「そのサイコロがイカサマではないか?」という疑問が生じます。

これを統計学的に検証するために、有意水準を0.05として、サイコロがイカサマではないという仮説を立てます。これが帰無仮説です。

次に、反復試行の確率を考えます。つまり、サイコロを10回振って1の目が6回出る確率を計算します。その確率は、二項分布を使って計算され、約0.0022(0.2%)となります。

次に、p値を計算します。p値は、サイコロを10回振って1の目が6回以上出る確率です。

具体的には、1の目が6回から10回までの確率を合計した値がp値となります。

計算するとp=0.0023となります。

そして、p値が0.05よりも小さい場合、帰無仮説が棄却されます。

つまり、サイコロを10回振って1の目が6回出た場合、このサイコロはイカサマであるという結論に至ります。

ここで注意したいのが、統計学上p値は、サイコロを10回振って6回以上1の目が出る確率であるため、1の目が6回~10回までの値を合計した値となります。

p値を計算する際には、帰無仮説の下で観測されたデータまたはそれよりも極端なデータが得られる確率を求めます。

そして、その確率がある基準値(通常は有意水準)よりも小さい場合、帰無仮説を棄却し、対立仮説を支持することになります。

注意点

注意したいポイントとして、統計的に有意であっても、結果が意味のあるものかどうかは別の話であるということです。

具体例を挙げて説明します。

たとえば、サイコロを10回振って1の目が6回以上出る確率を計算し、統計的に有意な結果が得られたとしましょう。

つまり、帰無仮説が棄却され、サイコロがイカサマである可能性が高いという結論です。

しかし、これはあくまで統計的な解釈であり、実際の意味とは異なる場合があります。

例えば、サイコロの製造過程で微細な不均一性が生じ、1の目に偏りやすいとした場合、この偏りが実際のゲームプレイにおいて重要であるかどうかは別の議論が必要です。

ゲームプレイにおいては、微小な偏りが統計的に有意であっても、実際にプレイヤーに影響を与えるかどうかは、ゲームのルールやプレイヤーに依存します。

つまり、統計的な解析はあくまでデータとの一致を評価するものであり、その結果が実際の意味を持つかどうかは別途検討する必要があります。

今後も、有用な知識を発信していきますので、ぜひフォローしてチェックしてください。

コメント

タイトルとURLをコピーしました