PI值
先说说「具有统计学显著性」PI值,在科研论文和数据分析中,「p<0.05」几乎是一条默认的「及格线」—— 当结果满足这个条件时,我们说它「具有统计学显著性」。
为什么不是 0.01 或 0.1?
0.01:更严格,减少假阳性,但会增加漏判的概率。
0.1:更宽松,降低漏判风险,但假阳性概率上升。
0.05因「风险折中、简洁易记」成为科研界默认标准,但并非绝对 , 例如基因组学研究常采用更严格的 p<0.001(因多重检验需校正)。
p<0.05 仅说明结果「非随机」,不代表效应强度(如新药可能仅降低 1mmHg 血压,但仍满足 p<0.05)。
0.05 不是绝对真理:部分领域已开始推行更严格的标准(如心理学领域建议 p<0.005),或结合效应量、置信区间综合判断。
置信区间CI
置信区间CI的概念是由原籍波兰的美国统计学家耶日·奈曼提出的。
假设你想知道美国有多少人热爱足球,为了得到100%正确的答案,你可以做的唯——件事是向美国的每一位公民询问他们是否热爱足球。根据维基百科,美国有超过3.25亿的人口。与3.25亿人谈话并不现实,因此我们必须通过问更少的人来得到答案。
我们可以通过在美国随机抽取一些人(与更少人交谈)并获得热爱足球的人的百分比来做到这一点,但是我们不能100%确信这个数字是正确的,或者这个数字离真正的答案有多远。所以,我们试图实现的是获得一个区间,例如,对这个问题的一个可能的答案是:「我95%相信在美国足球爱好者的比例是58%至62%」。
这就是置信区间名字的来源,我们有一个区间,并且我们对它此一定的信心。
风险比HR
HR风险比是流行病学和临床研究中一个常用的统计量,用于比较两组患者发生事件(如死亡、复发等)的风险。HR 用于评估治疗组与对照组之间的风险差异,通常通过生存分析方法(如Cox回归模型)计算得出。
- HR = 1:表明两组之间的风险相等。
- HR > 1:表明治疗组的风险高于对照组。例如,HR = 1.5 表示治疗组发生事件的风险是对照组的 1.5 倍。
- HR < 1:表明治疗组的风险低于对照组。例如,HR = 0.7 表示治疗组发生事件的风险是对照组的 70%。
假设我们进行了一项研究,评估一种新药对心血管事件(如心脏病发作或中风)的影响。研究随机将200名患者分为两组:一组接受新药治疗(治疗组),另一组接受标准治疗(对照组)。在这项研究中,我们收集了随访期间所有患者发生心血管事件的情况。
经过分析,我们计算得出治疗组的风险比(HR)为0.75,且95%可信区间为[0.55, 1.00]。
解读结果
1. HR = 0.75:这个数值表明接受新药的患者发生心血管事件的风险比接受标准治疗的患者低25%。换句话说,新药的效果优于标准治疗。
2. 可信区间:[0.55, 1.00]:
下限0.55:新药组的风险与标准治疗相比,最少也会低55%。
上限1.00:这也意味新药组的风险最大可能会与标准治疗相当。
因为可信区间的上限(1.00)恰好是1,说明新药与标准治疗之间的效果可能没有统计学上的显著性(即不能完全排除新药和标准治疗效果相当的可能性),但由于下限小于1,我们可以认为新药相对于标准治疗是有效的。实际临床决策时,可能会关注这项结果在医学上是否具有意义。
总结
HR 的数值代表了风险的相对差异,有助于我们理解新药的效果。 可信区间提供了结果的可靠性评估,通常用来判断结果的统计显著性和临床意义。理解和解读HR不仅需要关注单一的HR值,还要结合可信区间以及研究背景进行全面分析。
如果你对上面HR的解释还是很清楚,看下面的实例。
多因素Cox回归分析显示,与不活动相比,上午(6:00~12:00)、下午(12:00~18:00)或混合时间进行中高强度身体活动与房颤风险降低相关,其中上午活动显示出最大的房颤风险降幅(HR=0.79;95%CI:0.70~0.89)。
分层分析显示,65岁以下的成年人从上午锻炼中受益最大(HR=0.60)。对于糖尿病患者,上午和下午进行中高强度身体活动具有保护作用(HR分别为0.66和0.77)。而在非糖尿病患者中,晚上(18:00~23:59)活动可带来最大的益处(HR=0.76)。对于非高血压人群,进行中高强度身体活动的时间对房颤风险几乎没有影响。然而,在高血压患者中,任何时间的身体活动都与降低房颤风险相关,其中上午活动的获益最大(HR=0.74)。
咱们用「生活场景类比」+「原文例子对照」,一看就懂:
一、先懂 HR(风险比):比的是 “两组人的风险差多少”
HR 的全名叫「风险比」,核心作用就一个 ——拿 “做了某件事的人” 和 “没做某件事的人” 比,看前者的风险是高了还是低了。
咱们用原文的场景举例,研究里把人分成两组:
• 一组是 “上午做中高强度活动的人”(简称「活动组」);
• 一组是 “不活动的人”(简称「不活动组」)。
HR 就是这两组人「得房颤的风险」的比值。
怎么看 HR 值?记住 3 个关键点:
1. HR<1:「活动组」比「不活动组」风险低(好事,说明这件事能护着你)。
比如原文里 “上午活动的 HR=0.79”,意思是:上午活动的人,得房颤的风险是不活动的人的 79% —— 相当于风险直接降了 21%(100%-79%)。再比如 “65 岁以下人群上午活动 HR=0.60”,就是 “风险只有不活动的 60%,直接降了 40%”,保护效果更强。
2. HR=1:「活动组」和「不活动组」风险一样(这件事没效果)。
比如原文里 “非高血压人群,不管哪个时段活动,HR 都接近 1”,意思是:“非高血压的人,动不动、什么时候动,得房颤的风险差别不大”。
3. HR>1:「活动组」比「不活动组」风险高(这件事可能有害,不过原文里没这种情况)。
二、再懂 CI(置信区间):看 HR 的 “结论靠谱不靠谱”
CI 的全名叫「95% 置信区间」,你可以把它理解成HR 的 “靠谱范围” —— 它告诉我们:“这个 HR 值不是绝对准的,真实的风险比,有 95% 的可能在这个范围里”。
还是用原文的例子说:
原文里 “上午活动的 HR=0.79,95% CI:0.70~0.89”,意思是:“我们算出来上午活动能降房颤风险(HR=0.79),但真实的效果不会差太远 —— 有 95% 的把握,真实的 HR 在 0.70 到 0.89 之间”。
怎么看 CI 靠谱不靠谱?就看 “范围里有没有 1”:
1. 如果 CI 的整个范围都<1:结论靠谱!
比如上面的 0.70~0.89,不管真实 HR 是 0.70 还是 0.89,都小于 1—— 说明 “上午活动能降房颤风险” 这件事,不是瞎猜的,是真的。
2. 如果 CI 的范围里包含 1:结论不靠谱!
比如原文里 “非高血压人群”,假设它的 CI 是 “0.90~1.10”(包含了 1),意思是:“真实的 HR 可能是 0.90(降风险),也可能是 1.10(升风险),我们没法确定活动到底有没有用”—— 所以研究说 “非高血压人群,活动时间对房颤风险没影响”。
3. 如果 CI 的整个范围都>1:结论也靠谱(但这是 “有害” 的靠谱,原文里没有)。
最后总结一句话:
• HR是 “比风险”:看 “某个行为(如上午活动)能不能降风险”,数字越小越好;
• CI是 “验靠谱”:看 “HR 的结论是不是瞎编的”,范围里没 1 才靠谱。