SPMで複数の群の比較を行いたい時のDesign Matrix

SPM-MLに勉強になる話題が流れていたので、共有します。

出典はこちら。
https://www.jiscmail.ac.uk/cgi-bin/webadmin?A2=SPM;a65dd354.1307

コントロールAと疾患B、疾患Cという3群がある時、Design Matrixに全部を入れてしまった方がいいのか、
もしくは、コントロールと疾患A、コントロールと疾患Bというように、別々にDesign Matrixを作った方がいいのかという質問です。

これに対し、Cyril Pernetが非常にわかりやすいたとえを使って説明をしています。
ただ、少しだけtypoがあったのでそこを補足して説明します。

以下はMatlabを実際に動かしてみながらやってみるといいでしょう。

非常にわかりやすくするために、各群3人だとします。
そして、あるボクセルのデータが以下のようになっているとします。

A=[9; 10; 11];
B=[19; 20; 21];
C=[29; 30; 31];

3群を全部ひとつのモデルに入れることにしましょう。
この時、GLMで考えると、Yはデータ行列になりますので、以下のようになります。

1	`Y=[A; B; C]`

この時、Design Matrixは次のようにあらわされます。（今はわかりやすく共変量はすべて1としています。）

1	`X=[kron(eye(3), ones(3,1)) ones(9,1)]`

X =
     1     0     0     1
     1     0     0     1
     1     0     0     1
     0     1     0     1
     0     1     0     1
     0     1     0     1
     0     0     1     1
     0     0     1     1
     0     0     1     1

GLMでは、Y=XB+Eであらわされます。
そして、Bを求めたい時は、Matlabで以下のコマンドを叩くことで簡単に求まります。
ただ、今、上でBという変数を使ってしまっているので、わかりやすくBETAとします。

1	`BETA=pinv(X)*Y`

そうすると、BETAは以下のように表示されます。

今、BETAは上からAの平均値、Bの平均値、Cの平均値、そして定数となります。

なので、AとBの差の絶対値は10となりますし、AとCの差の絶対値は20となります。

それでは、次にAとBの2群をモデルしてみましょう。

今の場合、Yは以下のようになります。

Y=[A;B]

このときのDesign Matrixは以下のようになります。

1	`X = [kron(eye(2), ones(3,1)) ones(6,1)]`

X =
     1     0     1
     1     0     1
     1     0     1
     0     1     1
     0     1     1
     0     1     1

同じようにBETAを求めましょう。

1	`BETA=pinv(X)*Y`

BETA =
   -0.0000
   10.0000
   10.0000

今の場合、BETAは上からAの平均値、Bの平均値、定数となります。

Aの平均値とBの平均値の差の絶対値は10となります。上のモデルと同じです。

では、AとCの場合はどうでしょうか。

Y=[A;C]

Xは同じものが使えますので、BETAを求めます。

1	`BETA=pinv(X)*Y`

BETA =
   -3.3333
   16.6667
   13.3333

今の場合、BETAは上からAの平均値、Cの平均値、定数となりますので、
Aの平均値とCの平均値の差の絶対値は（約ではありますが）20となります。

つまり、このような場合、Design Matrixを複数作るよりも、1つのDesign matrixを作ってしまった方がエレガントだということになります。

今までいつも迷っていたことだったので、すっきりしました。

月	火	水	木	金	土	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

SPMで複数の群の比較を行いたい時のDesign Matrix

関連

コメントを残すコメントをキャンセル