相関関係

相関とは

相関とは、 2つのもの、人またはアイデア間の類似性または関係を意味します。 それは、2つの異なる仮説、状況または対象の間に存在する類似性または等価性です。

統計学および数学の分野では、相関とは、2つ以上の関連する変数間の尺度を指す。

相関という用語はラテン語の相関語に由来する女性名詞です

相関という言葉は、関係、方程式、関連性、対応、類推、接続などの同義語で置き換えることができます。

相関係数

統計学では、積率相関係数とも呼ばれるピアソン相関係数 (r)は、同じメトリックスケール内の2つの変数間の関係を測定します。

相関係数の機能は、既知のデータまたは情報セット間に存在する関係の強度を決定することです。

相関係数の値は-1から1の間で変化し、得られた結果は相関が負か正かを定義します。

係数を解釈するには、1は変数間の相関が完全に正であることを意味し、-1は完全に負であることを意味することを知っておく必要があります。 係数が0の場合は、変数が互いに依存していないことを意味します。

統計学では、統計学者チャールズスピアマンに敬意を表してこの名前を冠したスピアマン相関係数もあります。 この係数の機能は、2つの変数が線形であるかどうかにかかわらず、2つの変数間の関係の強度を測定することです。

スピアマン相関は、分析された2つの変数間の関係の強度が単調関数(初期の順序関係を保存または反転する数学関数)によって測定できるかどうかを評価するのに役立ちます。

ピアソン相関係数の計算

方法1)共分散と標準偏差を使用したピアソン相関係数の計算

どこで

S XYは共分散です。

S xS yは、それぞれ変数xとyの標準偏差を表します。

この場合、計算では、まず変数間の共分散とそれぞれの標準偏差を求めます。 次に、共分散は標準偏差の乗算で除算されます。

多くの場合、ステートメントはすでに式を適用することによって、変数の標準偏差またはそれらの間の共分散のいずれかをすでに提供しています。

方法2)生データを用いて(共分散または標準偏差なしで)ピアソン相関係数を計算する。

この方法では、最も直接的な式は次のとおりです。

たとえば、グルコースレベル(y)と年齢(x)の2つの変数の観測値がn = 6のデータがあると仮定すると、計算は次の手順に従います。

ステップ1)既存のデータ(i、x、y)を使ってテーブルを作成し、xy、x²、およびy²に空白の列を追加します。

ステップ2: "xy"列を埋めるためにxとyを掛けます。 たとえば、1行目では、x1y1 = 43×99 = 4257となります。

ステップ3:列xの値を上げて、結果を列x²に記録します。 たとえば、最初の行では、x 1 2 = 43×43 = 1849となります。

ステップ4:ステップ3と同じように、今度はy列を使用して、y 2列に値の2乗を記録します。 たとえば、最初の行では、y 1 2 = 99×99 = 9801となります。

ステップ5:すべての列番号の合計を求めて、結果を列フッターに入れます。 たとえば、Age X列の合計は、43 + 21 + 25 + 42 + 57 + 59 = 247です。

ステップ6:上記の式を使って相関係数を求めます。

したがって、我々は持っています:

スピアマンの相関係数

スピアマンの相関係数の計算は多少異なります。 そのためには、次の表にデータを整理する必要があります。

1. 2対のデータを宣言したので、それらを表に入れなければなりません。 例えば、

2. "Ranking A"列で、 "Date A"にある観測値を増加する方法で分類します。 "1"が列の最小値、en(観測値の総数)、 "Date A"列の最大値です。 " この例では、

3.列「ランキングB」を取得するために同じことを行います。列「データB」の観測値を使用します。

4.列 "d"に、2つのランキング(A - B)の差を入力します。 ここで信号は関係ありません。

5.列 "d"の各値を上げ、列d²に記録します。

6.列 "d²"からすべてのデータを追加します。 この値はΣd²です。 この例では、Σd²= 0 + 1 + 0 + 1 = 2

7.今度はSpearmanの式を使います。

私たちの場合、データの行数(観測数に対応する)を見ると、nは4です。

8.最後に、前の式のデータを置き換えます。

線形回帰

線形回帰は、他の変数(x)の値がわかっているときに変数(y)の可能な値を推定するために使用される式です。 "x"の値は独立変数または説明変数、 "y"は従属変数または応答です。

線形回帰は、 "y"の値が変数 "x"の関数としてどのように変化するかを検証するために使用されます。 分散チェックの値を含む線は、線形回帰線と呼ばれます。

説明変数 "x"が単一の値を持つ場合、回帰は単純線形回帰と呼ばれます。