Rのコードはこちら

因子分析.R

主成分分析.R

コレスポンデンス分析.R

多重因子分析.R

はじめに

学習指導要領では高校卒業までに約5,000語の語彙を指導することが示されています。中高生は毎週ある単語帳の小テストに向け、電車内で一生懸命に暗記しているかもしれません。授業の中ではリスニングやライティングなど、コミュニケーション活動が中心となっていることから、語彙指導だけに時間を割いているわけにはいきません。そのため、中高生は様々な学習方略を用いて自律的に語彙を増やしていくこととなります。

語彙学習方略に関する先行研究は主に5件法のアンケートを使って、学習者が使用している方略を同定したり、学習方略と関係する個人差などを検討しています。例えば、Tseng and Schmitt (2008) はいくつかの潜在変数を仮定し、その潜在変数を測定すると考えられる項目を作成しています。例えば、Vocabulary Learning Self-Efficacyでは (a) I feel I can memorize words faster than other people. (b) I feel my vocabulary is larger than others. のような項目を作成しています。これらの項目に対して、6段階 (1 = “strongly disagree” to 6 = “strongly agree.”) で評定しています。

このように複数の間隔尺度あるいは比率尺度の変数セットによって得られたデータ (観測変数) に対し、潜在変数をモデリングする手法に因子分析と主成分分析があります。目的変数が観測変数で説明変数が潜在変数であるモデリングは因子分析、目的変数が潜在変数で説明変数が観測変数であるモデリングは主成分分析です。

それでは因子分析から見ていきましょう。

因子分析

因子分析は大きく探索的因子分析 (explanatory factor analysis; EFA) と確認的因子分析 (confirmatory factor analysis; CFA) があります。EFAは先行研究で因子が仮定されていない場合、CFAは因子が仮定されている場合に用います。例えば、語彙知識を測定するために新しくテストを作成したとします。この語彙テストでは拘束形態素である接頭辞と接尾辞の知識を測定することを目的としています。接頭辞と接尾辞の知識は異なる構成概念であるのか、それとも同じ拘束形態素に関する知識であるかを検討したいと思います。先行研究では接頭辞と接尾辞の知識を測定するテストは開発されていないことから、EFAを使って、接頭辞と接尾辞の構成概念は弁別されるのか (弁別的妥当性)、それとも拘束形態素という構成概念に収束するのか (収束的妥当性) を検討することができます。一方、先行研究では接頭辞と接尾辞は異なる構成概念をなしている (弁別的妥当性が示されている) 場合には、今回対象とした受験者層でも同じように弁別的妥当性が示されるかをCFAで検討することとなります。

まずはEFAを見ていきましょう。

探索的因子分析 (Explanatory Factor Analysis)

EFAでは解釈の容易な固有ベクトルの組み合わせ (因子) を求めます。これらの因子は単純構造を満たすために、直交 (無相関) あるいは斜交 (相関) のいずれかの手段で回転させます。多くの場合は斜交回転を用います。

EFAの基本的な仮定は、全分散が3つの異なる種類の分散の和を反映していると捉えます。この3つは共通分散、特殊分散、誤差分散です。共通分散は分析に用いられる他の変数と相関する分散の全体を反映しています。特殊分散は他の変数と相関しない分散の全体を反映しています。つまり、共通分散と特殊分散の和は、その変数の信頼性と言えます。一方、誤差分散は信頼できない分散を反映しています。EFAでは説明される共通分散の総量を最大化する因子を見つけようとする分析です。

EFAにおいて重要な概念に、独自性と共通性があります。変数の独自性は全分散のうち、他の変数と無関係な部分です (独自性 = 特殊分散 + 誤差分散)。変数の共通性は1から独自性を引いたものとなります。変数の共通性は、変数の負荷量平方和と一致しており、因子のセットによって説明される変数の分散の比率と言えます。

EFAは相関行列を構成する因子 (主成分分析では次元) に分解することが本質です。主成分分析では相関行列の対角項 (左上から右下への斜めの線) には1が並びます。なお、この相関行列で得られる因子 (固有ベクトル) は観測値をうまく再現することができますが、これは因子に含まれる共通性と特殊性の分散に加えて誤差分散を反映しているためです。