RNA靶向的CRISPR系统 ——从宏基因组到RNA调控外文翻译资料

 2023-03-27 06:03

RNA靶向的CRISPR系统

——从宏基因组到RNA调控

作者:Aaron A. Smargon1, Yilan J. Shi1,2 and Gene W. Y eo   1,2*

单位:1Department of Cellular and Molecular Medicine, University of California, San Diego, La Jolla, CA, USA. 2Biomedical Sciences Graduate Program, University of California, San Diego, La Jolla, CA, USA.

摘要:RNA导向的DNA内切酶CRISPR-Cas技术的应用使得生物学取得了突破性进展。随着CRISPR–Cas和并行系统功能多样性的进一步探索,RNA操作正成为一种基于CRISPR的强大工程模式。在这个视角中,我们阐述了靶向RNA的CRISPR-Cas(RCas)领域的进展,并指出了该领域面临的困难和挑战,从而为未来研究提供了思路和见解。

与对DNA的研究不同,生物学家在21世纪初就利用自然界的分子多样性来靶向活细胞中的RNA。RNA生物学的一项突破研究表明,MS2噬菌体病毒外壳蛋白(VCP)可以与其同源的RNA环结合伴侣一起编程,从而显示和稳定真核细胞中的mRNA 1,2。三年后, RNA干扰(RNAi) 这种基因表达抑制系统成为为该领域应用最广泛的工具之一3。在接下来的15年里,尽管有其他系统被不断开发, VCP和RNAi这两个系统仍在RNA靶向这个领域中有举足轻重的作用。

CRISPR-Cas(成簇的规律间隔的短回文重复序列和CRISPR相关蛋白)是起源于原核生物的一种免疫防御系统,用以对抗噬菌体入侵4。一般来说,Cas蛋白和CRISPR RNA (crRNA)会将原间隔序列整合成crRNA中的新间隔序列5,进而形成一个复合体来对抗外来核酸的干扰。CRISPR-Cas(通常简称为CRISPR)系统显示了通过预设的趋同、分化和水平基因转移而获得的大量进化多样性6。例如,第1类系统需要多个亚基进行核酸干扰,而在第2类系统中,只需要一个有效的单效应器。随着分类命名的不断发展,人们发现1类和2类CRISPR系统分别可以靶向双链DNA (dsDNA)、单链DNA (ssDNA)和/或单链RNA (ssRNA)7

由于CRISPR对RNA编程的潜力、内置的酶和易用性,它已经成为基因组工程的基本工具。在发现通过Cas9可以在哺乳动物细胞中使用靶向DNA的CRISPR-Cas(我们称之为“DCas”,不要与无催化活性的“dCaS”混淆)后不久8,生物学研究人员将DCas应用于高通量基因组筛选和同基因背景突变细胞系生产,以及其他变革性应用9。如今,在生物信息学的推动下,RCas领域也取得了类似的进展,以重构CRISPR系统。

发现、多样性和并行系统

RCas识别。除了使DCas系统靶向RNA10外,RCas识别还可以通过生物信息学(图1a)完成11。虽然这种宏基因组数据的计算分析可以分为为1类和2类系统12,但在实践中,单效应器、双组分的2类RCas系统在转录组工程中更具有应用前景。因此,研究人员主要将对CRISPR系统的搜索集中在预设的单效应因子上,这些单效应因子最接近于CRISPR适应性免疫所必需的Cas1基因13,而现在仅仅接近一个重复基序序列,这类似于将CRISPR阵列的“直接重复”序列和插入的“间隔区”序列整合到噬菌体基因组11,14,这两个元素构成了crRNA。在考虑了多个约束条件之后,根据序列同源性对预设的效应器进行分类,最后预测功能域,就将生成Cas候选效应器的列表。

图1 | RNA靶向CRISPR-Cas (RCas)及并行系统。a, Cas蛋白,包括RCas,是利用已建立的生物信息通路在细菌和古菌的宏基因组测序中发现的。从CRISPR阵列搜索开始,根据各种标准筛选附近假定的Cas效应因子,包括与CRISPR阵列的相关性、大小和预测的蛋白质结构域。根据同源性分组后,选择不同的效应器组进行后续实验验证。研究人员通过将底物核酸与纯化的CRISPR核糖核蛋白复合物进行生化孵育,并观察其裂解和结合的情况,推断出靶向底物和机制。靶向规则的遗传审讯可以通过间隔物耗尽筛选试验实现,该试验由CRISPR文库和针对抗生素抗性基因的间隔物组成。细菌通过含有(i)间隔器库和Cas效应器以及(ii)抗生素耐药性基因的质粒进行共转化,然后对已测序存活种群中已耗尽的间隔物进行计算分析,将产生与vis-agrave;-vis间隔物相关的任何目标依赖序列需求。b, II类和VI类系统,分别包括Cas9和Cas13,这代表最常用的RCas系统。Cas9结合一个tracrRNA和crRNA(通常结合成一个单独的sgRNA)来靶向RNA。根据Cas9的不同,组成PAM序列的PAMmer寡核苷酸可能需要用于RNA的结合10,而一个额外的结构域(如PIN结构域内切酶)可能需要用于RNA的裂解47。Cas13只特异性的识别并靶向ssRNA,而且Cas13-crRNA复合物在识别靶序列后,会无差别的切割并降解非目标ssRNA。c,原核Argonaute (pAgo)系统类似于CRISPR-Cas系统,它们能够通过可编程引导来靶向核酸。它们是更广泛的RNA靶向系统的一部分,包括反义寡核苷酸链技术 (ASOs)、RNA干扰(RNAi)、CRISPR-Cas相关的RNA靶向系统(CIRTS)、病毒外壳蛋白(VCPs)、锌指、Pumilio和FBF同源蛋白(PUFs)以及五肽重复蛋白(PPRs)等。

每一个候选的效应器都必须经过实验验证以确定CRISPR的功能。如果预设的Cas效应器通过crRNA加工的实验得到证实,研究人员就可以很容易地确定间隔区长度和直接重复定向。有了这些基础,Cas效应因子和相应的crRNA (可能会活化crRNA或“tracrRNA”)就可以共同表达,以匹配靶向底物(DNA对RNA)、靶向机制(负责蛋白结构域)和靶向规则(底物序列偏好)。

研究人员通过生化重组CRISPR系统培养各种核酸,并观察产生的核酸裂解或结合现象来检测靶向底物。一旦成功建立,靶向机制就可以在保守的蛋白质结构域中破坏活性的氨基酸残基的突变。对于识别靶向规则,在我们看来,迄今为止最精细的试验(对之前描述的随机PAM耗尽筛选和细菌基本基因平铺筛选的一种进化14,15)涉及到对抗生素抗性基因质粒平铺的CRISPR阵列库间隔区16。在这样的分子生物学、生物化学和遗传学的整合中,研究人员发现了多种有应用价值的RCas系统。

多样化的RCas平台。1类RNA靶向CRISPR系统,即Cmr复合体(III-B型和III-C型)17和Csm复合体(III-A型和III-D型)18,19,已经有明确的研究。然而,由于II型Cas9和IV型Cas1的基因座相对简单,因而研究了RCas转录组的工程空间(图1b)。

原生Cas9和它的crRNA和tracrRNA(这两种RNA通常结合成单向导RNA或sgRNA)复合物需要一个原间隔邻近基序(PAM)来有效识别和切割其dsDNA靶标20。基于这一机制,研究人员设计了一种RCas系统,通过将含有这种PAM的寡核苷酸PAMmer与CRISPR系统的其余部分共同孵育,从而催化靶标RNA的单个切割10。随后,一些与PAM无关的RNA裂解Cas9系统会被鉴定为具有天然歧义的DCas和RCas功能21,这也可能被用于RNA靶向。

与Cas9不同的是,到目前为止, VI型Cas13只特异性的识别并靶向ssRNA。此外,Cas9-crRNA - tracrRNA核糖核蛋白利用RuvC(以大肠杆菌中的DNA修复蛋白命名的核酸内切酶结构域)和HNH(具有组氨酸和天冬酰胺残基特征的核酸内切酶结构域)催化结构域在底物中诱导单个dsDNA断裂,Cas13- crRNA复合体识别含有一个原间隔体侧翼序列(PFS)的目标ssRNA后,Cas13的双重真核和原核生物核苷酸结合域(HEPN)区域开始在一个底物中随机地切割RNA 22。此外,Cas9依赖内源性表达的RNAse III来处理crRNA,而Cas13效应器处理自己的序列23。到目前为止,已经发现和鉴定了几种Cas13变体,Cas13b crRNA包括一个5 间隔层和3 直接重复层,如Cas914,Cas13a、Cas13c和Cas13d crRNA包括一个3 间隔层和5 直接重复层16,22 - 24。Cas13的结构进一步揭示了这些特征变体之间的结构差异,并为合理设计分子工程提供了借鉴25 - 27

非Cas RNA系统。RCas在RNA靶向领域占据主导地位,但如果将编程系统分为核酸可编程和蛋白质编程的话,它只是一项技术(图1c)。

和CRISPR一样,原核Argonaute( pAgo)系统是为了保护原核生物免受噬菌体入侵而进化的28。根据基因变体的不同,pAgo可以通过DNA或RNA向导进行编程,这也证明是一种RNA靶向工具29。真核的Argonaute系统在机制上类似于pAgo,但它在工程应用中受到RNAi的限制,因为它们的内生起源,因此不能正交化30。反义寡核苷酸(ASOs) 是另一种核酸编程技术,由于RNA的碱基修饰和关键蛋白质成分的缺乏,它已成为靶向RNA的有效手段31。最后,为了实现人类RNA可编程元件的重新编程,CRISPR–Cas启发的RNA靶向系统(CIRTS)和招募内源性因子的RNA支架开始发展32,33,但是这些技术的特异性和敏感性仍未确定。

与此相反,研究人员正在考虑用单组分、蛋白质可编程的方法来靶向RNA。目前,类似于DNA靶向的锌指核酸酶和RNA基序识别的锌指核酸酶已经成功地串联起来进而与ssRNA结合34,但是目前为止,有限的可识别RNA靶向基序使得其应用仍不够广泛。Pumilio和FBF同源蛋白(PUFs) 由单个核苷酸识别亚基组成,他们串联重复提供了一个更为可行的选择35,这一点可以在在一项真核RCas研究的同期研究中得到证明36。同样的,与PUFs类似,五肽重复蛋白(PPRs)也可以被改造37

目前, RCas和非RNA靶向系统的直接比较范围有限,但是有两项研究表明,在选定的转录物上,Cas13的RNA敲除效率和特异性高于短发夹RNA (short hairpin RNA, shRNA)的表达24,38。每个RNA靶向系统都有一套独特的模式,并且都具有独立的特征。例如,ASOs必须通过化学或物理方式交付,而RCas和其他系统可以通过AAV交付向量化39。此外,ASOs(和shRNA)可以逃避蛋白质介导的免疫原性问题。尽管所有这些系统无疑将在迅速发展的RNA靶向领域发挥作用,但我们仍然认为基因编程、核酸可编程、真核正交、双组分RCas在应用方面具有最大的实用价值。

基础研究领域

生物领域。RCas可用于生物用途,如检测(图2a)、调控(图2b)和编程(图2c)。在哺乳动物细胞中,RCas9可用于敲除mRNA,并跟踪mRNA向应激颗粒的转运40。随后有研究发现,Cas13a、Cas13b和Cas13d都具有类似的功能24、38,41。例如,与ASOs类似,催化失活的Cas13被证明会破坏5 剪接位点、3 剪接位点和分支点的识别,导致培养细胞中高效的外显子产生排斥24。随着一种作用于RNA (ADAR)酶的腺苷脱氨酶融合到Cas13,研究人员已经证明了可编程腺苷到肌苷的转换41,但是与其他ADAR融合方法相比,这种位点定向RNA编辑的效率和特异性仍存在强烈争议42,43。事实上,位点定向的ASOs或是基因表达的单组分向导RNA可能在该领域比RCas更优越 33、44、45

对于大多数RCas程序,Cas9可能与Cas13难以区分,但有两个明显的例子。首先,Cas13在其自身环境中只与RNA相互作用,而Cas9可能需要取决于PAM(或PAMmer)的识别需求和额外蛋白质域的融合,进而竞争性地结合到DNA和RNA21。其次,只要有足够的RCas和单独的向导表达,Cas13的自我处理CRISPR阵列的能力可以实现多路复用。

对研究人

剩余内容已隐藏,支付完成后下载完整资料


英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[597901],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。