统计知识库 · 真实高频问题

做数据分析卡住了?这里可能有答案。

缺失值怎么处理、信度多少算合格、KMO 不够怎么办……论文分析里最常被问倒的问题,我们都用大白话写清楚了,还告诉你“规范上该怎么报告”。

热门:缺失值怎么处理信度多少合格KMO 不足反向题事后比较三线表怎么报告

数据准备 · 信效度 · 差异检验 · 回归 · 规范

高频问题 · 点击展开
数据准备缺失值怎么处理?先看缺失比例和缺失机制,再决定删除还是填补——别一上来就删。

先判断缺失多不多、是不是随机缺失,再选方法,不要一律删除:

  • 缺失 < 5% 且随机:可直接整列删除(listwise),影响很小。
  • 缺失 5%–15%:建议均值 / 中位数填补,或更稳妥的多重插补(MI)EM 算法
  • 某个变量缺失 > 20%:考虑放弃该变量,或在文中说明并做敏感性分析。
  • 量表题项零星缺失:可用同维度其他题的均值替代。

「报告里务必写清楚你的处理策略和最终有效样本量 N——这是审稿人必看的。」

看完整说明与 SPSS 操作 →
信效度Cronbach's α 信度多少算合格?总量表 ≥ 0.8 较好,各维度 ≥ 0.7 可接受,0.6 以下要警惕。

常用判断标准如下(针对 Likert 量表的内部一致性信度):

α 值范围判断
≥ 0.9非常好(但过高可能题目冗余)
0.8 – 0.9良好,总量表理想区间
0.7 – 0.8可接受,各分维度的常见底线
0.6 – 0.7勉强,探索性研究可放宽
< 0.6偏低,需检查反向题、删低区分度题项

若 α 偏低,先看“项已删除的 α 值”:若删某题后 α 明显上升,说明该题拖后腿,可考虑删除。

用在线工具算我的 α →
信效度KMO 值不足、做不了因子分析怎么办?KMO < 0.6 通常不宜做 EFA,可增样本、删低共同度题或换方法。

KMO 衡量数据是否“适合做因子分析”。一般 KMO ≥ 0.7 较好,< 0.6 不建议做 EFA。若不足,可尝试:

  • 增大样本量:题项数 × 5~10 是经验下限,样本太小会拉低 KMO。
  • 删除共同度(communality)< 0.4 的题项,再重跑。
  • 检查 Bartlett 球形检验:若 p ≥ 0.05,说明变量间几乎不相关,本就不该做因子分析。
  • 若结构已知,改做验证性因子分析(CFA)而非探索性。
看 EFA 方法详解 →
数据准备反向计分题怎么处理?分析前必须先反向重编码,否则会严重拉低信度和因子载荷。

反向题(如“我经常想离职”与“我打算长期留在公司”方向相反)必须在做信度、因子分析之前先反向编码,统一所有题的方向。

5 点量表的反向公式:新值 = 6 − 原值(7 点则 8 − 原值)。SPSS 里用 RECODE 或“转换→重新编码为不同变量”完成。

「忘了反向编码,是量表分析里最常见也最致命的错误——信度会莫名其妙偏低。」

看 RECODE 操作步骤 →
差异检验ANOVA 显著之后,要不要做事后比较?要。ANOVA 只说“组间有差异”,事后比较才告诉你“哪两组之间差”。

单因素方差分析(ANOVA)整体 F 检验显著,只说明“至少有两组不同”,但不知道具体是哪几组之间。这时需要事后多重比较(Post-hoc)

  • 方差齐(Levene p > 0.05):常用 Tukey HSDBonferroni
  • 方差不齐:改用 Games-HowellDunnett's T3
  • 若 F 检验不显著,则不需要也不应做事后比较。
看单因素方差分析详解 →
报告规范回归结果怎么报告成规范三线表?只留顶/中/底三条线,无竖线,表头加粗,下方加注 R²、F、显著性说明。

中文论文(GB/T 7714 习惯)的三线表要点:

  • 只保留三条横线:顶线、表头下的栏目线、底线,不要任何竖线
  • 表头加粗,表序与表题置于表上方(如“表 1 核心变量回归结果”)。
  • 回归表通常列:变量、BSEβtp
  • 表下加注:因变量、F 值与显著性,并标 *** p<0.001 / ** p<0.01 / * p<0.05

「析语交付的报告已经是成稿三线表,也可以用在线工具把你已有的 SPSS 结果一键转成三线表。」

用结果转 Word 三线表工具 →
回归分析多重共线性怎么判断和处理?看 VIF:均小于 5(严格 < 10)即可,过高则删、合并或用岭回归。

多重共线性指自变量之间高度相关,会让回归系数不稳定。判断主要看方差膨胀因子 VIF

  • VIF < 5:基本没问题(较严格标准)。
  • VIF 5–10:存在一定共线性,需留意。
  • VIF > 10:严重共线性,必须处理。

处理方法:删除冗余变量、合并高度相关变量、做中心化(含交互项时),或改用岭回归 / 主成分回归。

看多元回归详解 →
中介调节检验中介效应,为什么推荐用 Bootstrap?Bootstrap 不要求间接效应正态,置信区间不含 0 即显著,比传统 Sobel 更稳。

传统的逐步回归法(Baron & Kenny)和 Sobel 检验假设间接效应服从正态分布,但实际上常常不满足,检验力偏低。

Bootstrap 法(如 PROCESS 宏 Model 4)通过反复抽样估计间接效应的置信区间:只要 95% 置信区间不包含 0,就说明中介效应显著,不依赖正态假设,是目前主流做法。

看中介效应方法详解 →