最近发表在杂志上的一项研究《自然·通讯》提供了具有欧洲血统的人的次大陆混合的证据,与以前的遗传关联性研究是相反的,以前的研究认为欧洲血统的人群是分层的,而不是混合的。
背景 从人类基因研究中收集的证据表明,北欧和南欧之间存在明显的基因变异。古代DNA分析也显示了欧洲内部的基因的混合。尽管有这一证据,欧洲血统的人口大多被认为是分层的,而不是仅在次大陆水平的混合。
大多数对欧洲人和欧裔美国人的遗传流行病学研究认为人口分层是重要的混杂因素,并使用主成分分析估计的全基因组祖先来控制其潜在的混杂效应。重要的是,这些研究没有控制基因的特异性的祖先,这是混合人群所固有的,并可能导致多基因适应的错误估计和多基因风险评分的不良分析后果。
关于NIH的研究 美国国家卫生研究院(NIH)下属的国家人类基因组研究所(NHGRI)的科学家们整合了来自79个欧洲人和5个欧洲裔美国人的约19,000名欧洲血统的人的个体水平全基因组数据。
利用遗传数据,建立了一个新的参考小组,以确定被1000个基因组和人类基因组多样性项目遗漏的祖先多样性问题。
研究结果 发现欧洲人和欧裔美国人有混合的遗传血统,通常被称为混合体。这与之前的大规模人类基因研究形成对比,之前的研究认为欧洲血统的人是基因同质的人群。
为了实验证实,科学家们分析了乳糖酶基因,在欧洲各地差异很大,编码帮助消化乳糖的乳糖酶。新的参考小组确定了乳糖酶基因的高度分化体型与身高、体重指数(身体质量指数)和低密度脂蛋白胆固醇(LDL-C)水平等特征之间的联系。
对全基因组祖先(分层人群)和基因组特异性祖先(混合人群)进行调整后进行的分析显示,乳糖酶基因的基因组变异与身高和LDL-C水平无关。然而,这种变异和身体质量指数之间存在联系。
除了观察到的乳糖酶基因和特定性状之间的不正确关联之外,文献中还可能有更多的错误关联。因此,了解基因组变异和不同性状之间的联系对于估计多基因风险评分和预测个体对药物治疗有效和安全反应的能力尤为重要。正确理解遗传祖先对于预测常见疾病的遗传风险至关重要。
科学家们这次创建的新参考小组可供科学界将来使用。
研究意义 当前的NIH研究发现欧洲人和欧裔美国人在次大陆水平上是混合的,在欧裔美国人的亚组中混合的日期不同。这些发现强调了重新评估以前人类遗传学研究结果的必要性,这些研究没有考虑欧洲血统人群的混合分析。
Journal reference:
- Gouveia, M. H., Bentley, A. R., Leal, T. P., et al. (2023). Unappreciated subcontinental admixture in Europeans and European Americans and implications for genetic epidemiology studies. Nature Communications. doi:10.1038/s41467-023-42491-0