F1分析・F2分析

心理言語学の分野では、実験参加者が複数の刺激項目に対して反応する時間をミリ秒単位で測定する実験デザインが多く計画されます。例えば、有生と無生の名詞を提示し、それぞれのanimacyを判断する語彙性判断課題を実施したとします。高頻度語彙であれば反応時間が短く、低頻度語彙であれば反応時間が長いと予測されます。一般的に、1 つの条件に対して刺激を1つのみで設定することはありません。そのため、1人の参加者が複数の刺激に対して反応する時間がデータとして得られます。具体的には、以下のようなデータセットが得られます。

Participant	Item	Animacy	Frequency	ResponseTime
1	apple	inanimate	6987	567.98
1	flower	inanimate	6109	549.76
1	rabbit	animate	4987	698.46
1	tiger	animate	4356	625.96
…	…	…	…	…
30	habit	inanimate	1345	863.63
30	mouse	animate	3856	753.65

このデータセットの並べ方はRで基本的なロングフォーマットです。SLA研究でも、複数の文の読解時間や複数のスピーチの評定など、上記のデータの並べ方ができます。

ANOVAを解説したテキストの多くでは、1人の参加者から得られるデータ (観測値) は1つに限定されます。例えば、以下のように特定のテストの点数が並べられていることでしょう。

Participant	Score	Condition
1	68	A
2	98	B
3	67	C
4	86	A
…	…	…
29	79	B
30	58	C

最初に示した心理言語学的なデータセットはParticipantにItemがネストされており、目的変数が2つ目のデータセットよりも多く示されています。t検定やANOVAを実行する際には、観測値の独立性が重要な前提の一つとなっていました。これは級内相関によってタイプ1エラーの可能性が高まるためです。具体的には、1人の参加者が複数の項目に回答するような語彙性判断課題、自己ペース読み課題、fMRIによるROI解析、複数のスピーキング課題の評定など、いずれも観測値の独立性を満たしていません。

観測値の独立性を満たしていないデータセットに対応するため、F1分析とF2分析が用いられてきました。F1分析は参加者ごとの平均反応時間に対してANOVAを実行するものであり、項目ごとの平均反応時間に対してANOVAを実行するものはF2分析と呼ばれています。F1分析では下の左、F2分析では下の右のデータセットを分析することとなります。

Participant	Animacy	ResponseTime
1	inanimate	678.98
1	animate	737.67
2	inanimate	689.57
2	animate	759.08
…	…	…
30	inanimate	639.68
30	animate	796.65

Item	Animacy	Frequency	ResponseTime
apple	inanimate	6987	657.78
flower	inanimate	6109	639.67
rabbit	animate	4987	709.65
tiger	animate	4356	715.09
…	…	…	…
habit	inanimate	1345	674.90
mouse	animate	3856	694.67

参加者ごとに平均反応時間を測定するF1分析ではFrequencyの情報が失われてしまっています。これはFrequencyの情報がItemと結びついているためです。F1分析とF2分析の両方の結果について、興味のある説明変数であるAnimacyが目的変数であるResponse Timeに影響を与えていれば、Animacyの影響は頑健であると判断されます。

このF1およびF2分析は多くの心理言語学の論文で報告されている方法ですが、以下の点で問題があります。

F1分析で得られた効果量とF2分析で得られた効果量のどちらを使ってメタ分析をするべきか判断が難しい
F1分析ではAnimacyの間で有意な差が見られ、F2分析では有意な差が見られなかった際の結論を出しにくい
M±3SDを超える値を外れ値として除外する場合、F1分析とF2分析で一貫しない除外方法となってしまう

これらの問題点に対応することができる方法として着目されているのが混合効果モデルです (Brysbeart & Stevens, 2018)。

混合効果モデル

混合効果モデルでは、ParticipantとItemの両方を1つの分析で扱うことができます (Rでの具体的な実装方法についてはこちらも参照)。つまり、以下のようなデータセットを直接扱うことができる分析手法であると言えます。

Participant	Item	Animacy	Frequency	ResponseTime
1	apple	inanimate	6987	567.98
1	flower	inanimate	6109	549.76
1	rabbit	animate	4987	698.46
1	tiger	animate	4356	625.96
…	…	…	…	…
30	habit	inanimate	1345	863.63
30	mouse	animate	3856	753.65

混合効果モデルでは固定効果 (実験で一貫している値の効果) と変量効果 (実験に潜在的に変動を与える要因) の両方を扱います (DeBruine & Barr, 2021)。ここでは、Animacyが固定効果、ParticipantとItemが変量効果です。現実世界には多くの言語使用者がいる中で、実験に参加したのは特定の人であり、名詞は無数にある中で、実験で使用されたのは特定の項目であるため、これらが変量効果として扱われています。