心理言語学の分野では、実験参加者が複数の刺激項目に対して反応する時間をミリ秒単位で測定する実験デザインが多く計画されます。例えば、有生と無生の名詞を提示し、それぞれのanimacyを判断する語彙性判断課題を実施したとします。高頻度語彙であれば反応時間が短く、低頻度語彙であれば反応時間が長いと予測されます。一般的に、1 つの条件に対して刺激を1つのみで設定することはありません。そのため、1人の参加者が複数の刺激に対して反応する時間がデータとして得られます。具体的には、以下のようなデータセットが得られます。
Participant | Item | Animacy | Frequency | ResponseTime |
---|---|---|---|---|
1 | apple | inanimate | 6987 | 567.98 |
1 | flower | inanimate | 6109 | 549.76 |
1 | rabbit | animate | 4987 | 698.46 |
1 | tiger | animate | 4356 | 625.96 |
… | … | … | … | … |
30 | habit | inanimate | 1345 | 863.63 |
30 | mouse | animate | 3856 | 753.65 |
このデータセットの並べ方はRで基本的なロングフォーマットです。SLA研究でも、複数の文の読解時間や複数のスピーチの評定など、上記のデータの並べ方ができます。
ANOVAを解説したテキストの多くでは、1人の参加者から得られるデータ (観測値) は1つに限定されます。例えば、以下のように特定のテストの点数が並べられていることでしょう。
Participant | Score | Condition |
---|---|---|
1 | 68 | A |
2 | 98 | B |
3 | 67 | C |
4 | 86 | A |
… | … | … |
29 | 79 | B |
30 | 58 | C |
最初に示した心理言語学的なデータセットはParticipantにItemがネストされており、目的変数が2つ目のデータセットよりも多く示されています。t検定やANOVAを実行する際には、観測値の独立性が重要な前提の一つとなっていました。これは級内相関によってタイプ1エラーの可能性が高まるためです。具体的には、1人の参加者が複数の項目に回答するような語彙性判断課題、自己ペース読み課題、fMRIによるROI解析、複数のスピーキング課題の評定など、いずれも観測値の独立性を満たしていません。
観測値の独立性を満たしていないデータセットに対応するため、F1分析とF2分析が用いられてきました。F1分析は参加者ごとの平均反応時間に対してANOVAを実行するものであり、項目ごとの平均反応時間に対してANOVAを実行するものはF2分析と呼ばれています。F1分析では下の左、F2分析では下の右のデータセットを分析することとなります。
Participant | Animacy | ResponseTime |
---|---|---|
1 | inanimate | 678.98 |
1 | animate | 737.67 |
2 | inanimate | 689.57 |
2 | animate | 759.08 |
… | … | … |
30 | inanimate | 639.68 |
30 | animate | 796.65 |
Item | Animacy | Frequency | ResponseTime |
---|---|---|---|
apple | inanimate | 6987 | 657.78 |
flower | inanimate | 6109 | 639.67 |
rabbit | animate | 4987 | 709.65 |
tiger | animate | 4356 | 715.09 |
… | … | … | … |
habit | inanimate | 1345 | 674.90 |
mouse | animate | 3856 | 694.67 |
参加者ごとに平均反応時間を測定するF1分析ではFrequencyの情報が失われてしまっています。これはFrequencyの情報がItemと結びついているためです。F1分析とF2分析の両方の結果について、興味のある説明変数であるAnimacyが目的変数であるResponse Timeに影響を与えていれば、Animacyの影響は頑健であると判断されます。
このF1およびF2分析は多くの心理言語学の論文で報告されている方法ですが、以下の点で問題があります。
これらの問題点に対応することができる方法として着目されているのが混合効果モデルです (Brysbeart & Stevens, 2018)。
混合効果モデルでは、ParticipantとItemの両方を1つの分析で扱うことができます (Rでの具体的な実装方法についてはこちらも参照)。つまり、以下のようなデータセットを直接扱うことができる分析手法であると言えます。
Participant | Item | Animacy | Frequency | ResponseTime |
---|---|---|---|---|
1 | apple | inanimate | 6987 | 567.98 |
1 | flower | inanimate | 6109 | 549.76 |
1 | rabbit | animate | 4987 | 698.46 |
1 | tiger | animate | 4356 | 625.96 |
… | … | … | … | … |
30 | habit | inanimate | 1345 | 863.63 |
30 | mouse | animate | 3856 | 753.65 |
混合効果モデルでは固定効果 (実験で一貫している値の効果) と変量効果 (実験に潜在的に変動を与える要因) の両方を扱います (DeBruine & Barr, 2021)。ここでは、Animacyが固定効果、ParticipantとItemが変量効果です。現実世界には多くの言語使用者がいる中で、実験に参加したのは特定の人であり、名詞は無数にある中で、実験で使用されたのは特定の項目であるため、これらが変量効果として扱われています。