回帰判別分析法による統計解析


回帰判別分析法は順序カテゴリーデータの統計解析を行う解析手法の一つです。
目的変数yが単なる分類尺度ではなく、1級品、2級品、3級品というように順序づけられている場合に用います。
このページでは1級品、2級品、3級品・・・にあたるものをそれぞれクラス1、クラス2、クラス3と呼んでいます。

各クラスの説明変数の値から計算が行われ、解析が行われたサンプルごとに合成得点zと呼ばれるものが計算されます。
この合成得点zは各クラスに含まれるデータ同士が似たような値をとるように計算されます。
また、各クラスに含まれるデータがどのような値をとるかはクラス値と呼ばれる値によって決まります。

例:クラス値を1、2、4としたとき、
クラス1に含まれるデータの合成得点zは1
クラス2に含まれるデータの合成得点zは2
クラス3に含まれるデータの合成得点zは4
となるように計算されます。

クラス値は解析を行う際、解析者が最適と考える値を入力することになっています。
このページでは、最適なクラス値が不明な場合は、クラス1、クラス2、クラス3、・・・、に対するクラス値を
それぞれ1、2、3、・・・として解析を行っています。
そして、求められた合成得点zに対して、ある値以下のものはクラス1とする、といった境界線を決めることによって
クラスが判別されます。

例:各クラスに含まれるデータが以下のような合成得点zを与えられた場合

クラス1
 サンプルNO.  得られた合成得点 z 
1
1.1
2
1.2
3
1.8

クラス2
 サンプルNO.  得られた合成得点 z 
1
2.3
2
1.4
3
2.4

クラス3
 サンプルNO.  得られた合成得点 z 
1
4.0
2
4.1
3
4.3
4
2.8

境界線を以下のように決定したとすると、
クラス1、2の境界線:1.5
クラス2、3の境界線:3
各サンプルは次のように判別されたことになります。

クラス1
 サンプルNO.  得られた合成得点 z  判別されたクラス 
1
1.1
1
2
1.2
1
3
1.8
2

クラス2
 サンプルNO.  得られた合成得点 z  判別されたクラス 
1
2.3
2
2
1.4
1
3
2.4
2

クラス3
 サンプルNO.  得られた合成得点 z  判別されたクラス 
1
4.0
3
2
4.1
3
3
4.3
3
4
2.8
2

このようにそれぞれのサンプルが判別されます。
赤い文字で示されたクラスは正しく判別できているクラスです。

境界線は解析を行う際、解析者が最適と考える値を入力することになっています。
このページでは、最適な境界線が不明な場合は、各クラスの合成得点zの値から
回帰判別分析法に一般的に用いられる境界線である重み付き平均を求め、境界線としています。

解析へ戻る