协方差分析 论文案例|用协方差分析开展实证研究
在《教你用SPSS做协方差分析》中,我分享了协方差分析的方法和案例操作的演示。该方法广泛应用于教育评估、医学统计等领域。为了让大家对它有更多的了解,并熟练地运用到论文写作中,我找到了一篇应用协方差分析进行实证研究的论文——《协方差分析原理及其实证研究》,在这篇论文中,我对本文的数据进行了拆解和分析,希望对大家有一定的参考价值。
纸质案例数据
为了研究轻度运动组、中度运动组和重度运动组的睡眠效果,将36人随机分为每组,每组测量一段时间,测量初始正常睡眠时间和运动后睡眠时间增量。试分析三种运动对人的睡眠增量的影响是否相同。运动对睡眠影响的研究数据截图如下:
将上图中的数据以长表的形式输入到SPSS中,包括三个变量:“运动量”、“平均睡眠时间”和“睡眠时间增量”。
本文要研究的指标是“睡眠时间增量”,控制变量是“运动量”。除了控制变量,“正常睡眠时间”变量也可能影响“睡眠时间增量”。如果数据满足协方差分析的条件,则应使用“正常睡眠时间”这个变量作为协变量来尝试协方差分析。
在对数据进行协方差分析之前,通常需要检查数据是否满足协方差分析的条件:
线性测试
平行假设检验
方差齐性检验
正态性检验
线性测试图
画一个简单的散点图
首先绘制“睡眠时间增量”和“正常睡眠时间”的散点图,分析协变量和因变量是否符合线性关系。
1.选择图形>图形生成器,从图库中选择散点图/点图>双击简单散点图。
2.如下图所示,将“正常睡眠时间”和“睡眠时间增量”两个变量拖动到图形框中的X轴和Y轴,然后单击“确定”。
3.在输出界面获取散点图。双击散点图,进入图形编辑器,选择元素>总拟合线,得到带有趋势线的简单散点图。
绘制群组散点图
然后以“运动量”为分类变量,用颜色区分不同运动量下“睡眠时间增量”和“正常睡眠时间”的分组散点图,并加入分组拟合线。
1.选择图形>图形生成器,从图库中选择散点图/点图>双击分组散点图。
2.将“正常睡眠时间”、“睡眠时间增量”和“运动量”三个变量拖动到图形框中的X轴、Y轴和“设置颜色”框中,点击确定。
3.在输出界面获取散点图。双击散点图,进入图形编辑器,选择元素>子组拟合线,得到带有趋势线的散点图。
从上面的散点图可以看出,每组中的协变量和因变量之间存在线性关系。但轻度运动组与中度运动组有明显的交集,说明坡度存在差异;然而,这种差异是否具有统计学意义仍需要进一步的假设检验,以检验各组的整体斜率是否相同。我们可以通过并行性测试进一步判断。本文还通过绘制散点图和建立线性回归方程进行了线性检验。
方差齐性检验
1.选择分析>一般线性模型>单变量。
2.选择“睡眠时间增量”作为因变量,“运动量”作为固定因子。
3.单击选项。在对话框中选择均匀性测试。单击继续,然后单击确定。
方差齐性检验的结果主要看。表格显示,在方差齐性检验中,F=0.438,P=0.649>0.05,说明各组均满足方差齐性检验的条件。
莱文的同质性检验也应该在论文中进行,但在论文中并没有提到太多,所以在分析中最好不要省略这一步。
平行度测试
检验不同组的斜率在不同水平上是否相同,就是检验协变量与因变量的回归线是否平行,即固定因子与协变量之间是否存在交互作用。之前,我们通过绘制散点图来研究协变量和因变量之间的线性关系是否一致。现在,我们通过平行性检验进一步判断它们之间的线性关系是否有统计学意义。
1.选择分析>一般线性模型>单变量。
2.选择“睡眠时间增量”作为因变量,“运动量”作为固定因子,“正常睡眠时间”作为协变量。
3.单击模型。在指定的模型中,单击构造项。
4.在构造项中,选择主要效果。在这些因素和协变量中,“运动量”和“正常睡眠时间”被选入模型。
5.在构造项目中选择交互。在因子和协变量中,按住Ctrl键,同时选择“运动量”和“睡眠时间”,一起选入模型生成交互项。单击继续,然后单击确定。
并行性测试结果主要看。根据“运动量*正常睡眠时间”的测试结果,其F=0.141,P=0.869>0.05,说明运动量与正常睡眠时间的交互作用没有统计学意义,即正常睡眠时间对睡眠时间增量的影响不随运动强度而变化。因此可以认为三种运动强度的线性斜率相同,数据满足协方差分析的适用条件。
正态性检验
首先,本文利用“探索”函数检验了“睡眠时间增量”和“正常睡眠时间”两个变量的正态性,发现两个变量均呈正态分布。我们最好检查一下数据残差是否满足均值为0的正态分布。
1.根据上一步的操作,单击保存。检查对话框中的非标准残差。单击继续,然后单击确定。
完成此步骤后,一个新的变量列表,即residual RES_1,将被添加到数据视图中。
选择分析>描述统计>探索,在因变量列表中选择残差RES_1,选择输出直方图和带测试的正态图,点击继续,点击确定。
正常测试的结果如下:
根据残差正态性检验的结果,残差的均值为0,正态显著性P值为0.360,说明残差满足均值为0的正态分布。
配对比较的结果
从前面的测试来看,数据满足协方差分析的适用条件。接下来,我们可以在去除“平时睡眠时间”的协变量后,看看不同运动强度对“运动后睡眠时间增量”影响的差异。
1.根据步骤的操作,单击EM平均值。在“显示以下项目平均值”框中选择“运动量”,勾选“比较主要效果”,置信区间调整方法默认选择“LSD”。单击继续,然后单击确定。
这一部分是本文主要研究的内容。我得到的测试结果与文中具体数据略有不同,但测试结论完全一致。
从测试结果可以看出,轻度运动组和中度运动组在睡眠时间增量效应上没有显著差异,但轻度运动组和重度运动组在睡眠时间增量效应上有显著差异。
论文分析
总体而言,《协方差分析的原理与实证研究》一文中呈现的数据分析逻辑和结果清晰,能够清晰再现作者的研究思路和分析结果,适合初学者对协方差分析方法的借鉴和模仿。
在这篇论文规划之初,我想对《贵州省区域经济差异协方差分析》这篇论文进行分析,但在查阅这篇论文的数据时,发现它的数据质量并不好,与论文的描述有些不同,所以我选择了另一篇论文来分享。但是本文遇到了数据不满足并行性测试的问题,应用了数据转换的思想,具有一定的参考作用。
因此,最后附上“贵州省区域经济差异协方差分析”案例数据截图。感兴趣的读者可以将数据输入SPSS进行分析,调查发现数据中可能存在哪些问题。如果你发现了,说明你基本掌握了协方差分析方法。
——————