HR(风险比)、OR(比值比)、RR(相对风险)是统计学中衡量 “暴露因素” 与 “疾病结局” 关联强度的核心指标,但三者适用场景完全不同,错用会导致结论偏差。
一、“暴露因素” 和 “结局”
在所有例子里,我们先统一两个概念:
暴露因素:你想研究的 “某个行为 / 特征”(比如 “上午活动”“吸烟”“高血压”);
结局:你关注的 “疾病或事件”(比如 “房颤”“肺癌”“心梗”)。
二、RR、OR、HR
1. RR(Relative Risk,相对风险):队列研究里的 “直接风险对比”
相对风险RR 是最直观的指标,核心是直接对比两组的绝对风险,算倍数关系, 只适用于「队列研究」。
在流行病学中,队列研究(Cohort Study) 是一种用来验证 “暴露因素” 与 “疾病结局” 之间因果关系的核心研究方法,本质是 “按‘是否暴露’分组,追着看未来谁会生病”—— 就像 “跟踪两群人,一群接触了某个因素(比如吸烟、运动),另一群没接触,看几年后哪群人生病更多”,以此判断这个因素是否会导致疾病。“队列(Cohort)” 是指具有相同特征或共同经历的 “一群人”。
研究场景:
想知道 “每天吃 1 份水果(暴露因素)是否能降低未来 5 年中风风险(结局)”,于是做了一项队列研究(先分组,再追踪结局)。
研究设计:
招募 2000 人,按 “是否每天吃水果” 分成两组,随访 5 年,记录每组中风人数:
暴露组(每天吃水果):1000 人,5 年里有 20 人中风;
非暴露组(从不吃水果):1000 人,5 年里有 50 人中风。
计算 RR:
RR 的核心是 “两组的‘绝对风险’之比”,步骤如下:
算两组的 “中风绝对风险”(某组发病数 / 该组总人数):
暴露组风险 = 20/1000 = 2%(100 人里有 2 人中风);
非暴露组风险 = 50/1000 = 5%(100 人里有 5 人中风)。
算 RR:RR = 暴露组风险 / 非暴露组风险 = 2% / 5% = 0.4。
结果解读:
“每天吃水果的人,5 年内中风的风险是‘从不吃水果的人’的 0.4 倍(即 40%)”—— 换句话说,每天吃水果能让中风风险降低 60%。
RR>1:暴露会升高结局风险;
RR<1:暴露会降低结局风险。
当结局发生率很低时(比如罕见病,风险<5%),RR≈OR(后面会讲)。
2. OR(Odds Ratio,比值比):病例对照研究里的 “间接暴露对比”
比值比OR 比 相对风险RR 绕一点,核心是对比两组的暴露比值,而不是直接风险, 主要用于「病例对照研究」。
Odds = 「发生某件事的概率」 / 「不发生某件事的概率」
研究场景:
想知道 “长期熬夜(暴露因素)是否与高血压(结局)有关”,但随访多年太耗时,于是做了一项病例对照研究(先找 “有结局的人” 和 “没结局的人”,再回头问暴露史)。
研究设计:
找 100 个高血压患者(病例组)和 100 个健康人(对照组),回顾他们过去 10 年是否 “长期熬夜(每周≥5 天,熬夜到 2 点后)”:
病例组(高血压患者):45 人有长期熬夜史,55 人没有;
对照组(健康人):25 人有长期熬夜史,75 人没有。
计算 OR:
OR 的核心是 “两组的‘暴露比值’之比”(先理解 “比值 = 发生数 / 未发生数”),步骤如下:
算两组的 “熬夜暴露比值”(该组熬夜人数 / 该组不熬夜人数):
病例组暴露比值 = 45/55 ≈ 0.818(高血压患者中,熬夜的人数是不熬夜的 0.818 倍);
对照组暴露比值 = 25/75 ≈ 0.333(健康人中,熬夜的人数是不熬夜的 0.333 倍)。
OR = 病例组暴露比值 / 对照组暴露比值 = 0.818 / 0.333 ≈ 2.46。
结果解读:
“高血压患者中‘有长期熬夜史’的比值,是健康人中‘有长期熬夜史’比值的 2.46 倍”,反过来理解:“长期熬夜的人,患高血压的‘暴露关联强度’是不熬夜者的 2.46 倍”,提示熬夜可能增加高血压风险。
关键提醒:
OR 是 “比值的比”,不是 “风险的比”, 因为病例对照研究没法算 “总体风险”(不知道所有熬夜的人里多少会得高血压),只能间接反映暴露与结局的关联;
只有当结局是 “罕见病”(比如发病率<5%)时,OR 才会接近 RR;如果结局常见(比如高血压发病率较高),OR 会比真实 RR “夸大关联”(比如真实 RR=2,OR 可能 = 2.46)。
3. HR(Hazard Ratio,风险比):随时间变化的瞬时风险比
风险比HR 是 考虑时间因素,对比两组在不同时间点的瞬时风险。
研究场景:
想知道 “每周 3 次规律运动(暴露因素)是否能延缓 2 型糖尿病的发病时间(结局)”,需要关注 “什么时候发病”,于是做了一项生存分析研究(带时间维度的队列研究)。
研究设计:
招募 1500 人(均无糖尿病),按 “是否规律运动” 分组,随访 3 年,记录 “每个人从入组到确诊糖尿病的时间”:
暴露组(规律运动):750 人,随访期间发病情况:第 1 年 10 人,第 2 年 15 人,第 3 年 15 人;
非暴露组(不运动):750 人,随访期间发病情况:第 1 年 25 人,第 2 年 30 人,第 3 年 35 人。
HR 的核心是 “两组的‘瞬时风险’之比”(瞬时风险 = 某时间段内发病数 / 该时间段开始时的剩余人数),步骤如下:
算每个时间点的 “瞬时风险”(以 “每年” 为时间段):
第 1 年:
暴露组瞬时风险 = 10/750 ≈ 1.33%;
非暴露组瞬时风险 = 25/750 ≈ 3.33%;
瞬时风险比 = 1.33% / 3.33% ≈ 0.4;
第 2 年(剩余人数:暴露组 750-10=740 人,非暴露组 750-25=725 人):
暴露组瞬时风险 = 15/740 ≈ 2.03%;
非暴露组瞬时风险 = 30/725 ≈ 4.14%;
瞬时风险比 = 2.03% / 4.14% ≈ 0.49;
第 3 年(剩余人数:暴露组 740-15=725 人,非暴露组 725-30=695 人):
暴露组瞬时风险 = 15/725 ≈ 2.07%;
非暴露组瞬时风险 = 35/695 ≈ 5.04%;
瞬时风险比 = 2.07% / 5.04% ≈ 0.41;
通过统计模型(Cox 回归)计算,发现 3 年中 “瞬时风险比” 稳定在 0.45 左右,最终 HR=0.45。
结果解读:
“在整个 3 年随访期间,规律运动组的‘瞬时糖尿病发病风险’,始终是不运动组的 0.45 倍(即 45%)” 意味着:不管是随访第 1 年、第 2 年还是第 3 年,规律运动都能持续降低糖尿病的发病风险(风险降低 55%)。
关键提醒:
HR 只用于 “有时间维度的研究”,能体现 “风险随时间的变化规律”, 如果 “瞬时风险比” 在随访中稳定(比如例子中始终≈0.45),HR 可以近似理解为 “长期风险比”;如果不稳定(比如第 1 年 HR=0.4,第 3 年 HR=0.8),则 HR 代表 “平均的瞬时风险比”。解读方向和 RR/OR 一致:HR<1 降低风险,HR>1 升高风险。
三、一张表分清 RR、OR、HR
指标 | 对应例子场景 | 核心计算逻辑 | 结果特点 |
RR | 吃水果 vs 中风(队列研究) | 直接算 “两组绝对风险之比” | 直观反映 “风险倍数”,最真实 |
OR | 熬夜 vs 高血压(病例对照研究) | 间接算 “两组暴露比值之比” | 仅反映 “关联强度”,非真实风险 |
HR | 运动 vs 糖尿病(生存分析) | 动态算 “随时间的瞬时风险比” | 体现 “风险的时间稳定性” |