統計と確率の基本公式一覧

統計と確率の基本公式一覧

統計と確率の分野において、基本的な公式は理解の基盤となります。本記事では、確率と統計の基本公式をわかりやすく解説します。

確率の基礎

確率とは

確率は、ある事象が起こる可能性の度合いを表す数値です。0から1までの値で表され、0は起こらない可能性、1は必ず起こる可能性を示します。例えば、コインを投げたときに表が出る確率は1/2、裏が出る確率も1/2です。

条件付き確率

条件付き確率は、ある事象Aが起こったという条件のもとで、別の事象Bが起こる確率です。例えば、サイコロを2回投げたときに、1回目の目が偶数であるという条件のもとで、2回目の目が奇数である確率を求める場合、条件付き確率を用います。

ベイズの定理

ベイズの定理は、条件付き確率を用いて、事象の確率を更新するための公式です。例えば、ある病気にかかっている確率が事前にわかっている場合、検査の結果が陽性だった場合に、実際に病気にかかっている確率を計算することができます。

データ整理の基本

一次元データの整理

一次元データとは、身長や体重など、一つの変数で表されるデータです。一次元データの整理には、度数分布表やヒストグラムなどが用いられます。度数分布表は、データの値を階級に分け、各階級に含まれるデータの個数をまとめた表です。ヒストグラムは、度数分布表をグラフで表したものです。

二次元データの整理

二次元データとは、身長と体重など、2つの変数で表されるデータです。二次元データの整理には、散布図や相関関係などが用いられます。散布図は、2つの変数の関係をグラフで表したものです。相関関係は、2つの変数の間の関係の強さを表す指標です。

統計量の基本

平均値と分散

平均値は、データの代表値の一つで、データの総和をデータの個数で割ったものです。分散は、データのばらつきの度合いを表す指標で、各データと平均値との差の2乗の平均値です。

標準偏差

標準偏差は、分散の平方根で、データのばらつきの度合いを表す指標です。標準偏差が大きいほど、データのばらつきが大きくなります。

確率分布とその種類

離散分布と連続分布

離散分布は、データが離散的な値をとる分布です。例えば、サイコロの目の数は1から6までの離散的な値をとります。連続分布は、データが連続的な値をとる分布です。例えば、身長は連続的な値をとります。

正規分布

正規分布は、統計学において最も重要な分布の一つで、多くのデータが正規分布に従うことが知られています。正規分布は、平均値を中心とした左右対称の釣鐘型の分布です。

統計的推定と検定

点推定と区間推定

点推定は、母集団の未知のパラメータを一点で推定する方法です。例えば、母集団の平均値を一点で推定する場合、標本平均値を用いることができます。区間推定は、母集団の未知のパラメータを含むと考えられる範囲を推定する方法です。例えば、母集団の平均値を含むと考えられる範囲を推定する場合、信頼区間を用いることができます。

仮説検定

仮説検定は、統計的な仮説を検証する方法です。例えば、ある薬の効果を検証する場合、薬の効果がないという帰無仮説を立て、その仮説が正しいかどうかを検証します。

まとめ

本記事では、統計と確率の基本的な公式について解説しました。これらの公式を理解することで、データ分析の基礎を固めることができます。