统计学笔记

Posted by Peiqi on December 9, 2022

选择什么统计方法解决问题

统计方法选择流程图Ⅰ

Wilcoxon秩和检验 改为Mann-Whitney U检验

统计方法选择流程图Ⅱ

Wilcoxon秩和检验 改为Kruskal-Wallis H 检验

统计方法选择流程图Ⅲ

统计方法选择流程图Ⅳ

统计学&流行病学概念混淆与误用

  • 发病率和患病率傻傻分不清
  • 病死率与死亡率“纠缠不清
  • 生存率与生存概率分不清楚
  • 构成比代率,比与率的陷阱

总结:分类资料的一般处理原则

总结:两组连续变量比较的统计学方法选择

秩和检验为万金油

总结:多组连续变量的比较

统计结果不恰当报告的表现

P小于0.05的正确表述 由于统计检验不能得出差别的大小,因而结论不能说“有明显差异”或“有显著差异”,也不能说“差异非常显著”,更不能说“差异明显”。在国外的统计书籍上的英语表达为significant, 它的正确意义应当是“有意义的、有重要性的”。国内只有极个别的英汉词典把”significant”误译为“显著的”。正确的说法应当是“差异有统计学意义或差异有高度统计学意义”等

几个重要的统计学概念Ⅰ: 样本与总体 变异与同质 分类变量与有序变量 离散变量与连续变量 频率与概率 抽样误差与系统误差

几个重要的统计学概念Ⅱ: 均数与中位数 率与构成比 标准差与四分位数间距 标准误与可信区间 方差与标准差

统计数据&临床资料的一般分类 统计资料分类与统计方法选择直接相关 数据

  • 计量资料
    • 正态:血钾、血红蛋白
    • 偏态:肿瘤标志物、血脂、肝酶
  • 分类资料
    • 无序:血型、性别、民族
    • 等级:肿瘤分期,Child-Pugh分级

分类资料–四格表统计方法选择 四格表统计分析 一般四格表:X^2检验、Fisher精确检验 配对四格表:MeNemar检验、Kappa检验

分类资料–列联表统计方法选择 列联表的统计分析方法

变量的统计性质及其专业属性 列联表分类 可选用的统计方法
X,Y皆为分类变量且属性不同 双向无序表 X^2检验,Fisher精确检验
X为分类变量,Y为有序变量 单向有序表 秩和检验,Ridit分析,有序变量的Logistic回归
X,Y皆为有序变量且属性不同 双向有序表 关心组间差别,按单向有序的列联表处理;是否相关,用Spearman秩相关或典型相关分析;是否存在直线变化,用线性趋势检验
X,Y皆为有序变量且属性相同 双向有序表 一致性检验(即Kappa检验)

注:几乎所有列联表资料都可以用对数线性模型或Logistic回归模型来分析

散打回归如何选择

回归分析 因变量(结果变量) 自变量(解释变量)
多重线性回归 连续变量 存在多个变量,可以为连续变量、等级变量和
Logistic回归 二分类变量、多分类变量或等级变量 分类变量,分类变量转换为哑变量进行处理,
Cox回归 时间变量和二分类变量 等级变量按连续变量或哑变进行处理

两组连续变量比较的统计学方法选择

回归分析方法选择流程图

知道统计方法,如何在统计软件中实现

软件计算结果如何解释

Logistic回归

  1. 用enter法把所有自变量全纳入
  2. 用逐步回归筛选自变量
  3. 先做单因素Logistics回归,p<0.1纳入最后的回归方程(优先推荐使用此方法) 分析»回顾»二元logistic,因变量选择一个性别,点保存,若最后一个表方程式中的变量 第一行性别显著性 p<0.1 ,则纳入

Case-1 低体重或者正常体重2元化结果,选择 分析»回顾»二元logistic

因变量选择是否焦虑,剩下的选入协变量,若为非等级资料,比如黄种人、白种人、黑种人,需要点分类,把非等级选入,参考类别选择第一个,保存。 点选项,选中exp(B)的CI95%(OR值的95%可信区间) 在输出文档中,主要看显著性,<0.05的表示有显著差异 Exp(B)表示每增加一个等级,风险提升多少倍。

黑头发、白头发、黄头发多种结果,选择 分析»回顾»多项logistic