回帰判別分析法の説明

回帰判別分析法による統計解析

回帰判別分析法は順序カテゴリーデータの統計解析を行う解析手法の一つです。
目的変数yが単なる分類尺度ではなく、１級品、２級品、３級品というように順序づけられている場合に用います。
このページでは１級品、２級品、３級品・・・にあたるものをそれぞれクラス１、クラス２、クラス３と呼んでいます。

各クラスの説明変数の値から計算が行われ、解析が行われたサンプルごとに合成得点zと呼ばれるものが計算されます。
この合成得点zは各クラスに含まれるデータ同士が似たような値をとるように計算されます。
また、各クラスに含まれるデータがどのような値をとるかはクラス値と呼ばれる値によって決まります。

例：クラス値を１、２、４としたとき、
クラス１に含まれるデータの合成得点zは１
クラス２に含まれるデータの合成得点zは２
クラス３に含まれるデータの合成得点zは４
となるように計算されます。

クラス値は解析を行う際、解析者が最適と考える値を入力することになっています。
このページでは、最適なクラス値が不明な場合は、クラス１、クラス２、クラス３、・・・、に対するクラス値を
それぞれ１、２、３、・・・として解析を行っています。
そして、求められた合成得点zに対して、ある値以下のものはクラス１とする、といった境界線を決めることによって
クラスが判別されます。

例：各クラスに含まれるデータが以下のような合成得点zを与えられた場合

クラス１

サンプルNO.	得られた合成得点 z
1	1.1
2	1.2
3	1.8

クラス２

サンプルNO.	得られた合成得点 z
1	2.3
2	1.4
3	2.4

クラス３

サンプルNO.	得られた合成得点 z
1	4.0
2	4.1
3	4.3
4	2.8

境界線を以下のように決定したとすると、
クラス１、２の境界線：1.5
クラス２、３の境界線：3
各サンプルは次のように判別されたことになります。

クラス１

サンプルNO.	得られた合成得点 z	判別されたクラス
1	1.1	1
2	1.2	1
3	1.8	2

クラス２

サンプルNO.	得られた合成得点 z	判別されたクラス
1	2.3	2
2	1.4	1
3	2.4	2

クラス３

サンプルNO.	得られた合成得点 z	判別されたクラス
1	4.0	3
2	4.1	3
3	4.3	3
4	2.8	2

このようにそれぞれのサンプルが判別されます。
赤い文字で示されたクラスは正しく判別できているクラスです。

境界線は解析を行う際、解析者が最適と考える値を入力することになっています。
このページでは、最適な境界線が不明な場合は、各クラスの合成得点zの値から
回帰判別分析法に一般的に用いられる境界線である重み付き平均を求め、境界線としています。

解析へ戻る