斯坦福大学医学院的研究人员开发了一种基于人工智能的方法来识别人类基因组中复杂的结构变异,这些变异与精神分裂症和双相情感障碍等精神疾病的遗传因素有关。这项研究利用全球4,000多个基因组数据,揭示了与大脑相关的基因和区域的变异,增进了我们对遗传性精神疾病的理解,并可能有助于发现新的治疗方法。
斯坦福大学医学院的研究人员开发了一种基于人工智能的方法来识别人类基因组中复杂的结构变异,揭示影响精神分裂症和双相情感障碍等精神疾病的遗传因素。
该研究利用了来自全球 4,000 多个基因组的全基因组测序数据,突出了与人类进化相关的大脑相关基因和区域的变异。这种先进的基因分析可以提高我们对遗传性精神疾病的理解,提供对疾病机制和治疗途径的更准确的理解。
人类基因组复杂性
人类基因组由 30 亿个碱基对(腺嘌呤与胸腺嘧啶配对、胞嘧啶与鸟嘌呤配对)组成,它不仅仅是我们身体的蓝图。这些碱基对序列的变化可以揭示疾病的起源并追溯我们的进化历史。这些变化的范围从涉及几个碱基对的简单交换到更复杂的改变,例如数千个碱基对的长段翻转或完全丢失部分。
全基因组测序是目前最先进的读取遗传密码的技术,可有效检测简单的变异。然而,它正在努力应对更复杂的结构变化。斯坦福大学医学院领导的一项新研究开发了一种人工智能驱动的方法,现在可以识别全基因组测序数据中的这些复杂的结构变异。
将遗传变异与精神疾病联系起来
这项研究最近发表在《细胞》杂志上,利用来自全球的 4,000 多个人类基因组创建了复杂结构变异的目录。这些变异通常发生在控制大脑的基因中,并且在与人类进化相关的基因组区域中发现。研究人员还表明,一些复杂的结构变异影响了被诊断患有精神分裂症或双相情感障碍的人大脑中如何读取大脑相关基因中包含的指令。
“这项工作是在弄清楚精神疾病的遗传和分子基础方面迈出的重要一步,并表明与大脑相关的疾病和具有强大遗传成分的一般疾病应该进行复杂的结构变异分析,”该研究的资深作者说。亚历山大·厄本(Alexander Urban)博士是精神病学、行为科学以及遗传学副教授。 “任何全基因组序列都应该通过这种新算法运行;这将使我们能够从目前被忽视的数据中挖掘出重要的答案。”
Urban 和 Wing Wong 博士(Stephen R. Pierce Family Goldman Sachs 科学与人类健康教授、统计学和生物医学数据科学教授)是共同高级作者。
增进对精神疾病的了解
迄今为止在人类基因组中发现的几乎所有变异都是简单的。但新算法的输出表明,每个基因组还具有 80 到 100 个复杂的结构变异。
“只寻找简单的变化就像校对一本书的手稿并专门搜索改变单个字母的拼写错误,”厄本说。 “你会忽略那些打乱、重复或顺序错误的单词——你甚至可能会错过半章已经消失的情况。所有这些事情都应该在手稿被送到印刷厂之前捕获。”
人工智能驱动的遗传变异发现
复杂结构变异自动重建算法,简称ARC-SV,可以捕获各种DNA重排,发现复杂结构变异的准确率高达95%。该算法使用人工智能模型,并根据来自不同血统的人的数十个完整人类基因组(称为泛基因组)进行训练。
该算法发现了超过 8,000 个不同的复杂结构变体,其长度在 200 到 100,000 个碱基对之间。许多变异位于调节大脑发育和功能的基因组区域。研究人员更仔细地研究了这些变异是否与精神疾病有关。
遗传分析和精神病学诊断
轻松发现和研究复杂结构变异的能力可以帮助解释基因组中的哪些改变导致可遗传的精神疾病。该研究检查了两种这样的疾病:精神分裂症和双相情感障碍。全基因组关联研究(称为 GWAS)已经确定了基因组中的许多位置存在被诊断患有精神疾病的风险。但 GWAS 结果未能提供足够的细节来解释遗传风险以采取行动。
厄本说:“我们在识别精神疾病的遗传成分方面取得了惊人的进展,但仍然缺少一些重要的东西。” “GWAS 结果告诉我们一些与疾病相关的 DNA 变化位于基因组中的哪个位置。但 GWAS 的信息有些模糊。这就像知道一本书的第 118、237 和 304 页上有错误。但我们不知道它们是什么类型的错误或涉及哪些单词。”
基因研究的精确性
Urban 解释说,虽然 GWAS 结果可能会引导研究人员在第 118 页上查找错误,但了解复杂结构变异的序列就像在该页上实际的 10 个单词的句子上用黄色荧光笔标记,其中一个单词打乱,另一个单词重复。
“正是如此,”他说。
对疾病理解和治疗的影响
研究人员对 ARC-SV 算法的输出进行了测试。他们使用全基因组序列,结合来自健康个体和被诊断患有精神分裂症或双相情感障碍的人的 100 多个死后脑组织样本的基因表达测量,来研究复杂的结构变异可能在做什么。这些变异往往位于已知与精神分裂症或双相情感障碍风险相关的 GWAS 位置附近或重叠。这些复杂的结构变异还影响附近基因的表达方式——改变DNA中指令的读数——这表明这些变异可能导致了这种疾病。
“识别和研究复杂的结构变异将使我们更好地了解 DNA 的变化方式,并提供分子线索,从而绘制导致疾病的生物功能轨迹和治疗疾病,”周波博士说,精神病学和行为科学讲师,也是该研究的第一作者。
参考文献:“检测和分析不同人群和患有精神疾病的捐赠者大脑中人类基因组的复杂结构变异”,作者:Bo Zhou、Joseph G. Arthur、HanminGuo、Taeyoung Kim、Yiling Huang、Reenal Pattni、Tao Wang、Soumya Kundu , Jay XJ Luo, HoJoon Lee, Daniel C. Nachun, Carolin Purmann, Emma M. Monte, Annika K. Weimer, Ping-Ping Qu, Minyi Shi, Lixia Jiang, Xinqiong Yang, John F. Fullard, Jaroslav Bendl, Kiran Girdhar 、 Minsu Kim、Xi Chen、William J. Greenleaf、Laramie Duncan、Hanlee P. Ji、Xiang Zhu、Giltae Song、Stephen B. Montgomery、Dean Palejev、Heinrich zu Dohna、Panos Roussos、Anshul Kundaje、Joachim F. Hallmayer、Michael P. Snyder、Wing H. Wong 和 Alexander E. Urban,2024 年 9 月 30 日, Cell 。DOI:10.1016/j.cell.2024.09.014
10X Genomics 的计算生物学家 Joseph G. Arthur 博士和精神病学博士后学者 Hanminuo 博士也是第一作者。釜山国立大学、西奈山伊坎医学院、宾夕法尼亚州立大学、保加利亚科学院、贝鲁特美国大学和 James J. Peters VA 医学中心的研究人员对这项研究做出了贡献。
这项工作由美国国立卫生研究院资助(赠款 K01MH129758、T32-GM096982、P50HG00773506、U01MH116529、R01HG010359、R01AG050986、R01MH109677、U01MH116442、R01MH110921、 5246、R01AG067025、R01MH125244 R01AG066490、U01HG01096、R01HG006137 和 UL1TR002014),国家科学基金会(赠款 DGE-114747 和 DMS1952386)、韩国国家研究基金会、退伍军人事务部优异奖、斯坦福大学斯坦奖学金和宾夕法尼亚州立大学种子奖。