生成人工智能设计 DNA 序列来开启和关闭基因

介绍

我们的基因组中隐藏着一些微小的序列,它们拥有控制邻近基因的巨大力量。这些DNA序列被称为顺式调控元件(CRE),可以开启或关闭相邻的基因。最近,耶鲁大学医学院、杰克逊实验室以及麻省理工学院和哈佛大学布罗德研究所的研究人员开发了一种新方法,用于 生成式人工智能 设计新的调控元件来精确控制基因在细胞中的表达方式。

顺式调控元件的重要性

CRE在调控基因表达中起着至关重要的作用。它们充当分子开关,决定基因在特定细胞类型中是被激活还是被沉默。这种特异性对于生物体的正常功能至关重要,确保基因仅在需要的时间和地点表达。理解和操控这些元件对生物学和医学,尤其是靶向基因治疗具有重要意义。

CODA 平台开发

这个名为 DNA 活性计算优化 (CODA) 的全新人工智能平台,利用深度学习生成可作为合成 CRE 的新型 DNA 序列。与 DALL-E 和 ChatGPT 等知名工具类似,CODA 也基于大量天然调控元件数据集进行训练,从而能够创建在特定细胞类型中有效开启或关闭基因的序列。“这个项目的核心问题是:‘我们能否学习读取和编写这些调控元件的代码?’”YSM 遗传学助理教授、该研究的主要作者之一 Steven Reilly 博士解释道。

基因治疗中的潜在应用

控制基因在某些细胞类型中的表达方式,或许有一天能够显著改善基因疗法。这些疗法有可能克服致病突变,但需要更有效的方法将治疗直接递送至受影响的细胞。例如,靶向帕金森病中衰竭的特定神经元或携带HIV的免疫细胞。CODA平台可以帮助基因疗法更精准地靶向患病细胞,避免对健康身体部位产生副作用。

前景光明和未来方向

研究人员在实验室培养的血液、肝脏和脑细胞中测试了人工智能设计的调控元件,发现在许多情况下,这些合成元件比任何已知的天然序列都更具细胞类型特异性。随后在活体斑马鱼和小鼠身上进行的测试表明,这些序列也能激活动物特定细胞类型中的测试基因。在一个案例中,一个工程化的调控元件尽管被传递到小鼠全身,却只在小鼠大脑中一个非常特定的细胞层中激活了一个报告基因。

结论

设计能够高精度控制基因表达的DNA序列的能力开辟了生物医学研究的新领域。CODA平台代表着一项重大进步,它结合了人工智能和分子生物学,创造出能够以前所未有的方式调控基因表达的工具。“进化或许从未想过要为阿尔茨海默病药物构建强大的驱动力,但这并不意味着它不可能存在,”Reilly说道。在未来的研究中,研究人员计划扩展CODA的应用,以开发针对多种遗传疾病的靶向基因疗法,从而有望克服自然进化带来的局限性。

Compartilhar