选择什么统计方法解决问题
统计方法选择流程图Ⅰ
Wilcoxon秩和检验 改为Mann-Whitney U检验
统计方法选择流程图Ⅱ
Wilcoxon秩和检验 改为Kruskal-Wallis H 检验
统计方法选择流程图Ⅲ
统计方法选择流程图Ⅳ
统计学&流行病学概念混淆与误用
- 发病率和患病率傻傻分不清
- 病死率与死亡率“纠缠不清
- 生存率与生存概率分不清楚
- 构成比代率,比与率的陷阱
总结:分类资料的一般处理原则
总结:两组连续变量比较的统计学方法选择
秩和检验为万金油
总结:多组连续变量的比较
统计结果不恰当报告的表现
P小于0.05的正确表述 由于统计检验不能得出差别的大小,因而结论不能说“有明显差异”或“有显著差异”,也不能说“差异非常显著”,更不能说“差异明显”。在国外的统计书籍上的英语表达为significant, 它的正确意义应当是“有意义的、有重要性的”。国内只有极个别的英汉词典把”significant”误译为“显著的”。正确的说法应当是“差异有统计学意义或差异有高度统计学意义”等
几个重要的统计学概念Ⅰ: 样本与总体 变异与同质 分类变量与有序变量 离散变量与连续变量 频率与概率 抽样误差与系统误差
几个重要的统计学概念Ⅱ: 均数与中位数 率与构成比 标准差与四分位数间距 标准误与可信区间 方差与标准差
统计数据&临床资料的一般分类 统计资料分类与统计方法选择直接相关 数据
- 计量资料
- 正态:血钾、血红蛋白
- 偏态:肿瘤标志物、血脂、肝酶
- 分类资料
- 无序:血型、性别、民族
- 等级:肿瘤分期,Child-Pugh分级
分类资料–四格表统计方法选择 四格表统计分析 一般四格表:X^2检验、Fisher精确检验 配对四格表:MeNemar检验、Kappa检验
分类资料–列联表统计方法选择 列联表的统计分析方法
变量的统计性质及其专业属性 | 列联表分类 | 可选用的统计方法 |
---|---|---|
X,Y皆为分类变量且属性不同 | 双向无序表 | X^2检验,Fisher精确检验 |
X为分类变量,Y为有序变量 | 单向有序表 | 秩和检验,Ridit分析,有序变量的Logistic回归 |
X,Y皆为有序变量且属性不同 | 双向有序表 | 关心组间差别,按单向有序的列联表处理;是否相关,用Spearman秩相关或典型相关分析;是否存在直线变化,用线性趋势检验 |
X,Y皆为有序变量且属性相同 | 双向有序表 | 一致性检验(即Kappa检验) |
注:几乎所有列联表资料都可以用对数线性模型或Logistic回归模型来分析
散打回归如何选择
回归分析 | 因变量(结果变量) | 自变量(解释变量) |
---|---|---|
多重线性回归 | 连续变量 | 存在多个变量,可以为连续变量、等级变量和 |
Logistic回归 | 二分类变量、多分类变量或等级变量 | 分类变量,分类变量转换为哑变量进行处理, |
Cox回归 | 时间变量和二分类变量 | 等级变量按连续变量或哑变进行处理 |
两组连续变量比较的统计学方法选择
回归分析方法选择流程图
知道统计方法,如何在统计软件中实现
软件计算结果如何解释
Logistic回归
- 用enter法把所有自变量全纳入
- 用逐步回归筛选自变量
- 先做单因素Logistics回归,p<0.1纳入最后的回归方程(优先推荐使用此方法) 分析»回顾»二元logistic,因变量选择一个性别,点保存,若最后一个表方程式中的变量 第一行性别的显著性 p<0.1 ,则纳入
Case-1 低体重或者正常体重2元化结果,选择 分析»回顾»二元logistic
因变量选择是否焦虑,剩下的选入协变量,若为非等级资料,比如黄种人、白种人、黑种人,需要点分类,把非等级选入,参考类别选择第一个,保存。 点选项,选中exp(B)的CI95%(OR值的95%可信区间) 在输出文档中,主要看显著性,<0.05的表示有显著差异 Exp(B)表示每增加一个等级,风险提升多少倍。
黑头发、白头发、黄头发多种结果,选择 分析»回顾»多项logistic