对于那些定量研究初学者很有帮助。包括怎么收集数据,如何用SPSS进行数据分析。采用什么分析方法等等,都有详细介绍。例子也浅显易懂,都是有关外语教学的。对学文科的外语教师们真的是很有用。
秦晓晴,湖北浠水人,1961年出生,南京大学外国语学院应用语言学博士、博士后,现为华中科技大学外语系教授、硕士生导师、外语教育研究所副所长和中国英语研究会理事。1996年以来先后赴香港、美国和英国多所大学进行研究和访问。自1995年以来先后四次获得华中理工大学和南京大学教学和科研奖励,还获得过2001年度宝钢教育基金优秀教师奖。目前已经参与完成了一项国家“九三”社会科学基金科研课题,并负责教育部人文社会科学基金科研课题,并负责教育队人文社会科学研究“十五”规划项目、全国教育考试“十五”科研规划重点课题和国家留学基金委回国人员科研启动基金项目各一顶。近年来先后在《外语教学与研究》、《现代外语》、《外语教学与研究》等期刊上发表学术论文20余篇,主编及参编著作四部。
第5章 效度和结构效度分析
5.1 测量工具的效度
效度是指测量工具对测量对象的测量能力,也就是说,测量工具可以在多大程度上测量所要测量的东西。在社会科学研究中,通常使用两种方法确立测量工具的效度:逻辑证据和统计证据。用逻辑证据来确立效度就是证明测量工具中的问题与研究目的是否合适,而用统计证据来确立效度则是通过一定的计算提供硬证据来证明问题与研究目的的关系。
在问题与研究目的之间建立逻辑联系既易又难。容易的是,研究者自己就可以判断它们之间的联系。难的是这种判断必须有更多的支持,如别的研究者和统计数据,即是说,这种联系不是凭空而来。如果需要测量的东西比较具体,或比较直观(如年龄或收入等),在测量问题和研究目的之间建立联系并不难。但是如果测量的是个人态度或教学方法的有效性,要确立测量工具的效度难度就大一些。对于比较抽象的概念或者是不易直接观察的事物,测量工具中就需要更多的问题,才可以覆盖它们的不同方面,才可以证实所问的问题测量的就是此概念或事物。
5.2效度的种类
效度可以分为内在效度(internaI validity)和外在效度(external validity)。内在效度是指存在于测量工具本身的效度,它包括内容效度(content validity)和结构效度(construct validity)。外在效度是指利用测量工具以外的标准,即外在标准验证而得以证实的效度,它包括预示效度(predictive’validity)和共时效度(concurrent validity)。预示效度的判断是根据测量工具能在多大程度上预示结果,而共时效度的判断则是根据一种测量工具与另外测量工具同时使用时进行的比较。
内容效度涉及量表项目或问题的关联性以及量表的覆盖范围。
上面讲过,判断测量工具是否测量了想要测量的东西,主要依据是问题与研究目的之间的逻辑联系。量表的每个项目和问题必须与研究目的之间有逻辑联系,这种联系的建立有人称之为表面效度(face validity)。项目和问题必须涵盖需要测量的事物或态度的整个范围,从这点来评判测量工具的项目就是内容效度(Kurear,1999)。此外,对测量的事物或态度的覆盖必须平衡,也就是每一个方面必须用类似的、足够的问题或项目来呈现出来。一个研究者判断内容效度必须像其他研究者所判断的一样,也依据项目或问题在多大程度上表现了要测量的东西。内容效度的保证就是项目和问题与研究目的之间的联系分析,以及它们对所测量对象的覆盖分析,即设法获得逻辑证据,这方面没有什么验证公式或统计程序可供使用。
结构效度不是指测量工具的结构,而是指它以之为基础的理论结构。结构效度的确立依赖于统计方法,它是由每一结构对观测现象的整个方差的贡献来决定的。比如,前面几章讲到了研究不同受试者的焦虑感程度,可以把语言运用焦虑、课堂焦虑和评价焦虑看作是焦虑感的三个最重要的因素或结构。我们可以通过统计程序来确定这三个因素(结构)对于整个焦虑感方差的贡献。这些因素对整个方差的贡献就表明了焦虑感问卷效度的程度。这些结构解释的方差越大,说明问卷的效度就越高。相关分析、因子分析方法和多维量表方法(multidimensional scaling)等统计方法常被用来检验结构效度。
5.3 结构效度分析——因子分析
在社会科学领域中,人们常用因子分析来进行结构效度分析。因子分析通过研究众多原始变量(往往是问卷中的问题)之间的内部依赖关系,探讨观测数据中的基本结构,将彼此相关的原始变量转化成少数有概念意义、彼此独立性大、能反映众多原始变量所代表的主要信息的基础变量,即因子(factor)。因子分析就是研究在丢失信息最少的情况下,如何把众多的原始变量浓缩为少数几个因子。
在多元统计分析中,往往原始变量的数量较多,而且它们之间存在着较强的相关关系。如果进行多元回归分析,而自变量之间高度相关,就会出现多重共线性现象,也就是说,这些变量之间的高度相关说明它们所反映的信息高度重合。这就会给研究者使用多元回归等统计方法带来困难,而且也难以对原始变量进行分析和描述。但是,如果通过因子分析就可以找到较少的几个因子,这些因子代表了数据的基本结构,反映了信息的本质特征,就可以较好地对其加以分析和描述。
因子分析的另一个特点是进行数据简化。通过因子分析把一组变量化为少数几个因子后,可进一步将原始变量的信息转换成这些因子的因子值,利用因子值可直接对样本进行分类和综合评价,还可用这些因子值代替原始变量进行其他统计分析,如回归分析、路径分析等等。
因子分析分为探索性因子分析(exploratory factor analysis)和验证性因子分析(confirmatory factor analysis)。如果研究者事先对观测数据背后存在多少个基础变量(即因子)一无所知或知之甚少,因子分析用来探索基础变量的维数,就是探索性因子分析。进行探索性因子分析,最好使用主成分分析法,并通过碎石图确定提取因子的数目。如果研究者根据研究文献或其他的先验知识对因子的数目或因子结构作出了假设,而用因子分析来检验假设,就是验证性因子分析(参见Kumar,1999;郭志刚,1999)。关于将因子分析用于结构效度检验,以下各节要详细讲解具体的作法,读者还可参阅Wintergerst等人(2001)进行的学习风格测量工具的结构效度研究。
5.3.1 因子分析的基本概念和步骤
5.3.1.1 因子分析中的基本概念
(1)因子分析模型
因子分析模型中,假定每个原始变量由两个部分组成:共同因子(common factors)和唯一因子(unique factors)。共同因子是各个原始变量所共有的因子,解释变量之间的相关关系。唯一因子顾名思义是每个原始变量所特有的因子,表示该变量不能被共同因子解释的部分。原始变量与因子分析时抽出的共同因子的相关关系用因子负荷表示(fact:or loadings)。
(2)因子负荷
因子负荷作为因子分析模型中的重要统计量,表明了原始变量和共同因子之间的相关关系。因子负荷的绝对值越大,表明共同因子与变量之间的关系越紧密。一般说来,负荷量为0.3或更大被认为有意义。所以,当要判断一个因子的意义时,需要查看哪些变量的负荷达到了0.3或0.3以上。
(3)共同性和特征值
共同性(communality)就是指每个原始变量在每个共同因子的负荷量的平方和,也就是指原始变量方差中由共同因子所决定的比率。变量的方差由共同因子和唯一因子组成。共同性表明了原始变量方差中能被共同因子解释的部分,共同性越大,变量能被因子说明的程度越高,即因子可解释该变量的方差越多。共同性的意义在于说明如果用共同因子替代原始变量后,原始变量的信息被保留的程度。
……