数据准备 · 信效度 · 差异检验 · 回归 · 规范
高频问题 · 点击展开数据准备缺失值怎么处理?先看缺失比例和缺失机制,再决定删除还是填补——别一上来就删。›
先判断缺失多不多、是不是随机缺失,再选方法,不要一律删除:
- 缺失 < 5% 且随机:可直接整列删除(listwise),影响很小。
- 缺失 5%–15%:建议均值 / 中位数填补,或更稳妥的多重插补(MI)、EM 算法。
- 某个变量缺失 > 20%:考虑放弃该变量,或在文中说明并做敏感性分析。
- 量表题项零星缺失:可用同维度其他题的均值替代。
「报告里务必写清楚你的处理策略和最终有效样本量 N——这是审稿人必看的。」
看完整说明与 SPSS 操作 →信效度Cronbach's α 信度多少算合格?总量表 ≥ 0.8 较好,各维度 ≥ 0.7 可接受,0.6 以下要警惕。›
常用判断标准如下(针对 Likert 量表的内部一致性信度):
| α 值范围 | 判断 |
|---|---|
| ≥ 0.9 | 非常好(但过高可能题目冗余) |
| 0.8 – 0.9 | 良好,总量表理想区间 |
| 0.7 – 0.8 | 可接受,各分维度的常见底线 |
| 0.6 – 0.7 | 勉强,探索性研究可放宽 |
| < 0.6 | 偏低,需检查反向题、删低区分度题项 |
若 α 偏低,先看“项已删除的 α 值”:若删某题后 α 明显上升,说明该题拖后腿,可考虑删除。
用在线工具算我的 α →信效度KMO 值不足、做不了因子分析怎么办?KMO < 0.6 通常不宜做 EFA,可增样本、删低共同度题或换方法。›
KMO 衡量数据是否“适合做因子分析”。一般 KMO ≥ 0.7 较好,< 0.6 不建议做 EFA。若不足,可尝试:
- 增大样本量:题项数 × 5~10 是经验下限,样本太小会拉低 KMO。
- 删除共同度(communality)< 0.4 的题项,再重跑。
- 检查 Bartlett 球形检验:若 p ≥ 0.05,说明变量间几乎不相关,本就不该做因子分析。
- 若结构已知,改做验证性因子分析(CFA)而非探索性。
数据准备反向计分题怎么处理?分析前必须先反向重编码,否则会严重拉低信度和因子载荷。›
反向题(如“我经常想离职”与“我打算长期留在公司”方向相反)必须在做信度、因子分析之前先反向编码,统一所有题的方向。
5 点量表的反向公式:新值 = 6 − 原值(7 点则 8 − 原值)。SPSS 里用 RECODE 或“转换→重新编码为不同变量”完成。
「忘了反向编码,是量表分析里最常见也最致命的错误——信度会莫名其妙偏低。」
看 RECODE 操作步骤 →差异检验ANOVA 显著之后,要不要做事后比较?要。ANOVA 只说“组间有差异”,事后比较才告诉你“哪两组之间差”。›
单因素方差分析(ANOVA)整体 F 检验显著,只说明“至少有两组不同”,但不知道具体是哪几组之间。这时需要事后多重比较(Post-hoc):
- 方差齐(Levene p > 0.05):常用 Tukey HSD 或 Bonferroni。
- 方差不齐:改用 Games-Howell 或 Dunnett's T3。
- 若 F 检验不显著,则不需要也不应做事后比较。
报告规范回归结果怎么报告成规范三线表?只留顶/中/底三条线,无竖线,表头加粗,下方加注 R²、F、显著性说明。›
中文论文(GB/T 7714 习惯)的三线表要点:
- 只保留三条横线:顶线、表头下的栏目线、底线,不要任何竖线。
- 表头加粗,表序与表题置于表上方(如“表 1 核心变量回归结果”)。
- 回归表通常列:变量、
B、SE、β、t、p。 - 表下加注:因变量、
R²、F值与显著性,并标*** p<0.001 / ** p<0.01 / * p<0.05。
「析语交付的报告已经是成稿三线表,也可以用在线工具把你已有的 SPSS 结果一键转成三线表。」
用结果转 Word 三线表工具 →回归分析多重共线性怎么判断和处理?看 VIF:均小于 5(严格 < 10)即可,过高则删、合并或用岭回归。›
多重共线性指自变量之间高度相关,会让回归系数不稳定。判断主要看方差膨胀因子 VIF:
VIF < 5:基本没问题(较严格标准)。VIF 5–10:存在一定共线性,需留意。VIF > 10:严重共线性,必须处理。
处理方法:删除冗余变量、合并高度相关变量、做中心化(含交互项时),或改用岭回归 / 主成分回归。
看多元回归详解 →中介调节检验中介效应,为什么推荐用 Bootstrap?Bootstrap 不要求间接效应正态,置信区间不含 0 即显著,比传统 Sobel 更稳。›
传统的逐步回归法(Baron & Kenny)和 Sobel 检验假设间接效应服从正态分布,但实际上常常不满足,检验力偏低。
Bootstrap 法(如 PROCESS 宏 Model 4)通过反复抽样估计间接效应的置信区间:只要 95% 置信区间不包含 0,就说明中介效应显著,不依赖正态假设,是目前主流做法。
看中介效应方法详解 →