环球通讯!基因的位置如何影响其表达
(资料图片)
著名物理学家理查德·费曼(Richard Feynman)有一句名言:“我无法创造,我不明白。” 除了为费曼的理论物理学方法提供信息外,它还是描述合成生物学家的动机的好方法,他们对从头开始构建基因组感兴趣。通过设计和构建合成基因组,他们希望更好地理解生命密码。
合成生物学是围绕使用 DNA 序列作为具有可重复功能的“部分”的概念组织起来的。现在,通过成功的合作和尖端工具的使用,EMBL 的 Steinmetz 小组对基因组中这些 DNA 部分的位置或背景导致的基因表达变异有了重要的了解。
Steinmetz Group的共同主要作者和博士后Amanda Hughes 在解释激发这项工作的潜在问题时说:“在合成生物学中,你倾向于将事物分解成模块化的‘即插即用’部分。这些是启动子部分、编码区和终止子部分。我们想测试这些部件是否真的是“即插即用”,在任何情况下都以相同的方式发挥作用,或者它们的位置是否会影响它们的功能。我们希望更好地了解基因的线性组织如何影响它们的功能,并确定可用于构建基因组的一般设计原则。”
合成生物学工具箱提供上下文洞察
这项工作由 BMBF 和大众汽车基金会的“Life?”资助 这项倡议之所以成为可能,是因为有两项关键技术:来自Sc2.0 联盟的合成酵母菌株和长读长直接 RNA 测序。从 Sc2.0 联盟获得的菌株包括一个称为“SCRaMbLE”的设计特征,它提供了以以前无法实现的规模将基因重新排列到不同位置的能力。EMBL 基因组学核心设施提供的专业知识和工具包括 Oxford Nanopore 的 GridION 在内,该团队能够进行长读长直接 RNA 测序,从而可以识别 RNA 分子的开始和结束,并将它们分配给特定的重排。这些尖端技术的结合对于在许多环境中测量来自基因的全长 RNA 分子至关重要。
这篇发表在《科学》杂志上的论文表明,环境——尤其是转录环境——会改变基因的 RNA 输出。使用长读长直接 RNA 测序,他们能够观察到从合成酵母基因组中随机重排的 DNA 序列表达的全长 RNA 分子的开始、结束和数量的变化。重新定位基因会影响其 RNA 输出的长度和丰度;然而,这些变化并不总是由新的相邻 DNA 序列来解释。似乎是在它周围发生的转录,而不是序列本身,改变了基因的 RNA 输出。
正如主要作者 Aaron Brooks 解释的那样,从如此庞大的随机数据集中收集一般原则并非易事:“为了得出我们的结论,我们必须观察 SCRaMbLE 菌株中存在的许多替代遗传背景中的基因。然而,将这些碎片重新组合在一起是一项巨大的努力。我们必须生成一个庞大的测序数据集,而这反过来又要求我们开发新的软件工具。我们必须依靠复杂的机器学习算法来帮助我们理解我们观察到的复杂模式。” 根据新的上游和下游背景对基因的 RNA 输出进行建模,揭示了与周围转录模式相关的特征可以预测 RNA 边界和丰度。例如,如果一个基因被重新定位到一个高表达的邻居旁边,