为什么营养学的结论经常自相矛盾?
文 |小予
最近,业内引用率最高的国际学术期刊《内科医学年鉴》(Annals of Internal Medicine)发表了一系列的综述文章,指出摄取牛羊肉等红肉或加工肉对人体健康并没有明显的坏处,建议成人不用费心去改变摄取红肉的习惯。
这些新的论述一经发表,哈佛医学院的营养学家随即联名发表声明,一一反驳这组文章.美国心脏协会和癌症协会也站出来,指责这些文章会增加人们对营养学研究的不信任。
事实上,红肉健康与否绝不是营养学里有争议的孤例。近些年各种自相矛盾的营养学结论屡见不鲜:红酒抗衰老,但对健康也没什么益处;巧克力虽然是罪恶的甜点,但似乎又和减重有些联系;鸡蛋就更令人困惑了——该吃几个,吃蛋黄还是蛋清,煎着吃还是煮着吃更有利于营养吸收——各种学说剪不断理还乱。
这些可不仅仅是朋友圈里的养生头条,背后往往有科学研究做支撑。但是,为什么到了“吃什么”“怎么吃”的问题上,科学数据和实验得出的结论却天差地别呢?我们还可以相信营养学研究吗?
一、能救命的早期营养学研究
如果我们翻翻过往的著作,会发现早期的营养学研究可不像现在这样充满争议,相反还解决了很多实际的问题。
最著名的案例要数詹姆斯·林德 (James Lind)进行的坏血病对照实验。1747年,已经踏上航海大冒险之路的欧洲人饱受坏血病困扰。为了找到确切的治疗方法,林德把患病船员分成六组,在相同饮食的基础上分别给每组增加当时认为可以治疗坏血病的酸性食物,例如,橘子/青檬,苹果汁,醋等。结果只有吃柑橘类水果的组员迅速恢复健康。这个只维持了6天的对照实验有效地去伪存真,虽然当时的科学家们还不知道维生素C的存在,但这个实验结果让人们掌握了正确的预防坏血病的方法。这也是有记录的第一个临床对照试验。
类似的例子还有很多,例如碘缺乏和甲状腺肿大、维生素A和眼疾的相关性……这些营养学发现都让人类用简单的方法预防和治疗疾病。那为什么现在的营养学反而让人无所适从呢?
比较一下就会发现,过去那些经典的营养学研究,大部分只需解决缺乏单一营养素引发的疾病问题。在这个前提下,学者们只要一样一样地比较,总是会找到最优解。而我们如今面临的健康问题,则更多是由于多种元素长期过量摄取造成的慢性复杂疾病:如心脑血管疾病、糖尿病、肥胖等。
尽管有了更深厚的医学知识为基础,更先进的技术手段做支撑,但要从人类复杂的饮食中找到要从餐盘剔除的东西,远比添个橘子、加点海带更复杂。接下来,我们来看看“营养学结论”之所以会自相矛盾背后的原因。
二、无法完美的临床实验
要科学分析某种饮食和疾病的关系,一个办法就是做临床实验。
一个理想的临床实验,要保证在大量、随机的实验对象中设置唯一的变量,在足够长的时间内观察积累数据。但在现实中,要对我们现代人类最关切的各种慢性疾病以及肥胖问题进行营养学临床实验,有着诸多困难。由于这些慢性疾病都有较长的潜伏期,相应的临床实验也需要设置为“长期”。我们先不说这笔科研经费得是多大的一个数字,光是持续控制人群的饮食习惯就已经是天方夜谭。
假设,我们要研究吃红肉是不是会引发心脑血管疾病,完美的临床实验设计应该把一群人,随机分成两组。以200人为例,那么其中100人的肉食以红肉为主,100人则完全不吃红肉,最好他们别的饮食和生活习惯都差不多。然后等20年,看是不是吃红肉的那组心脑血管疾病发病率更高。
但是,等等!好像只有因为宗教、健康原因必须遵循某种饮食习惯的人才能坚持20年吧。大部分我这样的俗人既受不了天天吃牛羊肉,也无法抗拒正宗的潮汕牛肉锅或北京涮羊肉(向素食者致敬!)。总之,要找到完美的实验对象,谈何容易。
既然无法强制人实施某种饮食,那转而求其次,不少研究选择更容易控制的小白鼠、猴子等动物替代。排除伦理上的争议,动物实验的问题在于,人和动物在生理生化上有很大的不同,在动物体内可以验证的理论,未必适合人类。
之前有学者综合比较人类和动物的药物试验,发现有一半的药物反应在人类和动物间是不同的,基本上和扔硬币的概率差不多了。估计铲屎官们也可以举出一堆例子:我们常吃的巧克力、咖啡、洋葱可都是猫猫狗狗们的致命毒药。因此通过动物实验得出的结论通常只能作为参考或证据链中的一环。
此外,几十年的临床数据并不多,对于KPI压力不小的研究者来说,为一项研究等上几十年也不现实。因此,有不少研究常常利用一些指标来建立饮食和健康的关系,比如血液中胆固醇的含量、血糖的浓度等。
但是,从胆固醇偏高,到确诊心脏病或中风之间,还隔着好些疾病模型和好几章内科教材的内容。而营养学研究往往跳过这些,提供给读者的永远只是最粗略的因果关系。另外,从同一种食材上可以找到不同的中期指标,这些指标又和各种身体健康或致病因素有着或近或远的关系,这就是为什么同一食材在一个研究中被论证是抗癌的,但在另外一个研究中,又可能被认为是致癌的。
三、人群队列研究的不确定性
除了临床研究,很多的营养学结论是通过人群队列研究(cohort study)得出的。
这些研究往往不改变人群的生活习惯,只是搜集相关信息,然后在不同饮食习惯的人群中寻找特定饮食和健康的相关性。这样研究的好处在于相对容易获取数据,但同时却自带了不少“噪音”。
一方面,我们可能不太愿意承认自己经常吃薯片饼干;另一方面,我们可能确实记不太清楚昨晚吃了什么,更不要说几年甚至十几年的饮食习惯了。如果遇到更细节的问题,比如吃了多少蔬菜水果,每个人的“大约”“估计”背后的绝对值可能千差万别,更别说让研究人员统计出饮食的真实情况了。
除了受访者自身的不确定性带来的偏差,一个更大的问题在于,队列研究可能会忽略混合因素的影响。继续以红肉和心血管疾病为例,平日爱吃红肉的人也许更爱喝酒,少吃红肉的人可能蔬果摄入也更多,或居住在较好的生态环境中。而这些因素都和健康相关。
因此,群组队列研究如果在初始阶段没有考虑其他混合因素的潜在影响,则可能会放大特定食物和健康之间的相关性。
四、研究结果被过度解读
即便所有的实验设计都完美无缺,偏差依然可能会出现在解读环节。
基本上,无论是临床实验还是队列分析,由于实验中的个体差异,我们最终拿到的都是一组组并非规律变化的数据。为了在这些杂乱的数据中找到真相,研究者们通常会借助统计学工具来分析和解读。然而,另人担忧是,错误理解统计学意义的研究比比皆是。营养学就是一个重灾区。
2012,有学者随机挑选了50种常用食材的营养学研究,并评估了研究结果。结果发现:其中80%都被研究认为与癌症相关:要么增加患癌风险,要么降低患癌风险。然而细看数据后会发现,高达75%的研究仅仅显示微弱的统计学上的显著性差异或是缺乏统计学的验证。
什么是统计学上的显著性差异呢?一项研究中出现了显著差异后,又意味着什么呢?为了理解这个,我们还拿红肉来举例。
假如有吃肉和吃素的两个人,那位爱吃红肉的朋友十几年后果然血压高,得了心脏病。在得知这一连串的事实后,显然不会有人急匆匆地下结论:吃红肉就是会导致血压高——因为我们可不知道这位朋友是不是天生就心血管疾病高风险。
但是如果有这么一群人,100位吃肉的90%都纷纷患病,而100个吃素食的各个健康爆表,那么这时红肉和心血管疾病相关的可能性就很高了。吃肉和吃素人群的患病比例差别越大,我们观察到红肉和心血管疾病相关只是偶然的可能性就越低。这——就是所谓统计学中的显著差异。
有了“显著差异”做基础,营养学家们就能理直气壮地发布成果了。各种利益相关的食品制造商、媒体、健康管理中心拍浪而上,借研究结论的东风开始研发产品、发表意见、设计课程。于是,这些观念就会顺着条条大道传递到消费者的耳朵里,生活里。
但是,等等!现实中的数据可没有这么清楚。常常会是观察到100位吃肉的人中90%人患病了,但吃素的人群里也有80%的人患病了。类似这样的数据,才是领域内最常有的案例。
可问题就出在这里。即便是这样,统计学可能仍然会认为是差异显著,但是此“差异显著”和彼“显著差异”的可信度完全不同。反之,统计学上认为不显著,也不代表真的没有差别,因为可能是统计学的效力过低。
总之,统计学上的显著差异不应被理解成假设是否成立的决定性标准。
其实如果展开来看,各个学科都有能找出不少过度解读数据的案例。这也是为什么今年年初有800多名科学家联名在Nature上反对过度解读统计学的意义。笔者在这里并不是反对统计学,而是想要强调我们需要谨慎地看待用统计学工具得出的数字,不滥用,不粗暴下结论。相比把统计学结果粗暴地理解为“显著差异”和“不显著”,我们应该了解一下研究用的实验方法,看一下数据量的大小,也看看其他的证据,并且不要抛弃自己的常识和观察。
研究和统计方法本身的局限性之外,热衷于标题党的媒体也经常把这滩浑水搅得更浑。比如以下这些标题是不是很熟悉:“喝咖啡可以抗癌”,“吃巧克力可以抗癌”?这都是典型的把研究中相关性解释为因果关系的案例。慢性疾病亦或是癌症往往是由多种因素日积月累引起的。如果把单一因素和疾病的相关性解读为直线的因果关系,就像把太阳升起的功劳分给每日打鸣的公鸡。
五、商业的影响也不容小觑
商业力量也给营养学研究蒙上阴影。
有数据表明90%由食品公司支持的研究得出的结论都偏向他们的金主。纽约大学Marion Nestle教授所著《食物政治》(Food Politics)一书中就揭示了企业、科研和政治之间的复杂关系。她还开设了同名的博客,继续揭发和分析与食品公司关系暧昧的营养学研究。一条条翻下来,情节堪比美剧和宫斗剧。
比如以下几个真实的“糖衣炮弹”。
早在上世纪60年代就有研究发现,糖和脂肪(包括饱和脂肪酸,胆固醇)是引发心血管疾病高风险的饮食因素。但是从1965年起,代表产业利益的糖研究基金会(Sugar Research Foundation)为了扭转舆论风向,支持了一系列研究,片面强调那些证明糖类和心血管疾病相关的研究中的不完美,转移视线,让饱和脂肪酸成为心血管疾病的众矢之的,而糖得以全身而退。
这招瞒天过海大法直接导致80年代美国的膳食指南把关注点放在推广低脂饮食上。糖研究基金会甚至在1971年让美国牙齿研究协会弱化了少吃糖对牙齿健康的作用。
靠卖糖赚的钵盘盈满的可口可乐也多次出现在这些关于糖的研究丑闻中。它曾试图影响世界卫生组织放松对糖摄取量的建议,还支持了很多运动减重的研究,来分散公众对糖和肥胖关系的关注。
此外,企业神通广大的营销手段更让这些带有偏见和目的性的研究如虎添翼。要知道,美国食品营销可是一门每年320亿美元的大生意。
总之,从上世纪中叶到现在,糖业利益集团通过他们资助的研究,射出一枚又一枚这样的“糖衣炮弹”,影响了舆论,误导了公众,也让他们的利益在政府政策中得以保障。
如果营养学研究不能规避或坦陈这些“利益冲突”,公众的信任恐怕更是空中楼阁。
六、结语
啰嗦了这么多,面对各种营养学研究,我们到底该怎么自处?提出标准答案恐怕为时过早。
或许我们应该回到科学本身,用真正科学的态度来看待问题、思考问题。在决定少吃或多吃某种食物之前,我们可以多追问一下研究的细节,看看证据链是不是充实且没有逻辑漏洞。除此之外,我们还可以看看实验的方法和数据的规模,再判断这个研究是否有说服力。
又或者,遵循大部分专家都认同的原则:少吃加工食品,多吃天然食物,食材尽量多元化。
总之,过滤掉那些近乎奇迹的结论,特别是那些证明单一食物可以治疗癌症的研究,其背后极有可能和某产业集团有千丝万缕的联系;选择“简单点”的食材,亲自下厨,跟家里人学习小时候爱吃的家常菜的菜谱,让那些最新研究,再飞一会。
参考资料
[1]https://www.hsph.harvard.edu/nutritionsource/2019/09/30/flawed-guidelines-red-processed-meat/
[2]Perel P, Roberts I, Sena E, et al. Comparison of treatment effects between animal experiments and clinical trials : systematic review. BMJ. 2007;334(JANUARY):2-5. doi:10.1136/bmj.39048.407928.BE
[3]Jakobsen MU, Reilly EJO, Heitmann BL, et al. Major types of dietary fat and risk of coronary heart disease : a pooled analysis of 11 cohort studies 1 – 3. Am J Clin Nutr. 2009;89:1425-1432. doi:10.3945/ajcn.2008.27124.Am
[4]Jonathan D Schoenfeld, John PA Ioannidis, Is everything we eat associated with cancer? A systematic cookbook review, The American Journal of Clinical Nutrition, Volume 97, Issue 1, January 2013, Pages 127-134, https://doi.org/10.3945/ajcn.112.047142
[5]https://www.nature.com/articles/d41586-019-00857-9
[6]https://www.foodpolitics.com/
[7]Cristin E. Kearns, Laura A. Schmidt. Sugar Industry and Coronary Heart Disease Research A Historical Analysis of Internal Industry Documents. J Am Med Assoc. 2016;9. doi:10.1001/jamainternmed.2016.5394
文|小予
主业:遗传学研究;副业:关注环保,可持续发展相关议题。
编辑:棒恩乙 责编:天乐 图片:非特殊注明,均来自网络