当前位置:首页 > 生物研究 > 生化与分子生物学 > 正文

Nature:改良后的CRISPR可启动基因表达

研究人员将一种名为CRISPR的细菌防御系统改造成为人类细胞(比方说肿瘤细胞)基因表达的强效活化剂,从而促进了基因功能的研究。

分子生物学家一直以来都有一个梦想,就是希望能够随意启动任何基因的表达。机体内大多数基因的表达都是在特定生物学过程的控制之下进行动态启动和关闭的,而对基因表达水平的操控技术则是研究基因、调控元件和信号通路的功能的一种关键方法。Konermann等人描述了一种简洁的技术策略,可以将CRISPR/Cas9系统(即细菌内用于抵御外源性DNA的防御系统)转变成为一种强效的选择性基因活化剂。Konermann等人在文章中展示了如何用这一方法来检测成千上万个基因的并行启动效果。

CRISPR是成簇的、规律间隔的短回文重复序列(clustered regularly interspaced short palindromic repeat)的缩写,是指细菌内用于编码特殊RNA序列的DNA区域;这些特殊的RNA序列可以通过直接的序列互补作用来识别外源性DNA序列,例如病毒的DNA序列。在细菌中,这些向导RNA(guide RNA)能够与Cas9酶结合形成复合物,或者与其他能特异性剪切被识别的DNA序列的蛋白质结合形成复合物,从而破坏被识别的DNA序列,保护细菌免受侵害。因此CRISPR/Cas9是一种可被操控的DNA靶向系统,其特异性取决于其RNA序列。

分子生物学家已经利用此系统来促使基因组序列发生快速突变或替换——这一技术策略被称为基因组编辑(genome editing)。2012年时,CRISPR/Cas9系统获得了突破性的进展,当时研究人员利用短链向导RNA(short guide RNA, sgRNA)分子来特异性地操控CRISPR,从而简化了CRISPR/Cas9系统。研究人员在不久之后发现,Cas9的突变体dCas9虽然无法剪切DNA序列,但是却能够用来结合DNA。我们将dCas9连接到参与转录激活或转录抑制的蛋白质区域(或结构域)上,然后利用CRISPR,使其作用于调节特定基因转录的启动子序列,如此一来,这些融合蛋白就能够调节基因的自然表达水平。然而,对于众多应用领域而言,这种方式对基因表达水平的影响效果太低——基因活化程度小于或约等于五倍。

Konermann等人将CRISPR sgRNA转变成为一种可将多个不同的转录激活因子组装起来的模块化平台,从而解决了该方法基因活化效率低的问题(图1a)。RNA结合蛋白可以结合到RNA的一些短序列上,而Konermann等人则在sgRNA上确定了两个有此类短序列的区域,而这两个区域反过来能够融合到哺乳动物体内不同转录因子的转录激活区域上。Konermann等人将该系统命名为协同激活介导因子(synergistic activation mediator, SAM)。机体内有12个基因无法被dCas9-激活因子融合蛋白有效地激活,而Konermann等人证明,SAM系统能够诱导激活这12个基因,基因活化倍数可达到100倍以上。

http://www.nature.com/nature/journal/v517/n7536/full/517560a.html

图1 RNA可作为基因调控的模块化支架。a. Konermann等人对天然的CRISPR短链向导RNA(short guide RNA, sgRNA)分子进行了改良,使其变成蛋白质装配的模块化支架;改良后的CRISPR sgRNA可形成复合物,利用多个转录调控区域的作用,来特异性地调节基因表达水平。sgRNA上的适配体(aptamer)结构可以招募特殊的蛋白质:在本案例中,适配体招募的蛋白质是与不同转录因子的转录激活域相融合的RNA结合蛋白。由于CRISPR RNA的不同区域均可以与靶DNA序列进行碱基互补配对,因此sgRNA复合物具有良好的DNA靶向特异性。dCas9酶通常都与CRISPR RNA结合在一起,有助于打开DNA的结构;dCas9也能够融合到另一个调控区域中,进而增加生物学效应的多样性。b. CRISPR系统的改良工作体现了天然的长链非编码RNA(long non-coding RNA, lncRNA)的设计原则,lncRNA能够招募多种可修饰染色质(即细胞核内组蛋白与DNA形成的复合体)、调节基因表达的细胞因子。

为了说明该方法的潜在应用价值,Konermann等人创建了一个sgRNA数据库,汇总了一系列能够分别启动23000个人类基因的改良后的sgRNA。他们随后逐个探讨哪个基因在被sgRNA激活后,可以促使黑色素瘤癌细胞逃避PLX-4720(治疗黑色素瘤的主要药物)的杀伤作用。不同的基因被激活后,可以使黑色素瘤癌细胞产生不同程度的抗药性,而抗药性的高低则取决于细胞在接受药物治疗后sgRNA的相对频率。在高度富集的sgRNA中,有一些sgRNA可以启动已知耐药性通路中的基因,还有一些sgRNA可以启动在抗药性黑色素瘤患者体内表达水平增高的基因,这就可以证明,SAM法能够确定基因表达水平改变后会发生哪些生物相关性结局。

CRISPR改良工作的成功可用于直接揭示天然的基因调控机制。增强子(enhancer)是一种能够启动基因表达的DNA序列,它们通常都含有一些可识别不同转录因子的识别序列。此外,增强子和其它调控元件通常都会转录出长链非编码RNA(long non-coding RNA, lncRNA),这种RNA可以作为模块支架,利用各种各样可修饰染色质(即细胞核内由组蛋白与DNA形成的复合物)的细胞因子,调控基因的表达(图1b)。lncRNA就像放大的分子“菜谱”,既能够指导一系列生化作用的组合,也能够指导这些生化作用应该去影响哪些基因组位置。

最近还有另外两项研究也证明,在将dCas9或CRISPR RNA改良成模块化支架后,就大大提高了CRISPR引导性基因调控技术的效率或灵活性。其中一项研究还进一步表明,多种改良后的CRISPR RNA能够同时启动和关闭同一细胞内的不同基因,从而操控某一条代谢通路。Konermann等人的研究发现以及这两项研究均表明,天然lncRNA的模拟技术是一种有效的、协调多个蛋白质的方式,可以使这些蛋白质共同对整个基因组内产生影响。我们用一个sgRNA分子,也许就能够让各种效应蛋白作用于相同的基因组位置上。由于这类研究工具在生物技术领域中具有广泛的实用性,因此我们也有必要进一步构建一些新的多功能人工蛋白或非编码RNA。

下一代CRISPR技术为我们提供了一个绝佳的机会来研究多个基因和DNA序列的功能。在过去十年里,RNA干扰技术已经被广泛用于研究基因功能缺失后所造成的影响,但是由于存在非特异性靶向作用,因此这种方法出现假阳性结果的概率非常高。与此同时,如果利用过表达技术来开展功能获得性研究的话,可能无法阐明正常的RNA调控过程,例如选择性剪接(alternative splicing)。我们虽然可以根据锌指蛋白和TALEN等DNA结合蛋白的结构来合成人工转录因子,作为改变基因表达水平的备选方法,但是我们却难以在全基因组范围内构建这些人工转录因子。因此,CRISPR技术拥有其他技术无法比拟的强大优势:即CRISPR数据库的全面覆盖性以及CRISPR方法的模块化特性。然而,CRISPR靶向技术也会产生脱靶效应(off-target effect),因此,如果我们利用这种方法来确定基因表达水平的改变会造成哪些影响,那么还需要开展额外的验证性试验来进行证实。

Konermann等人对黑色素瘤细胞进行了实验,最终确定了13个特殊的基因:当每个基因的表达水平发生改变时,都可以使黑色素瘤细胞产生抗药性。然而,一般而言,只有当多个基因同时进行复杂调控时,才能够导致疾病或严重生物学效应的发生——有一个很好的例子可以说明这一点:研究人员发现,四个基因必须同时进行表达时,才能够促使诱导性多潜能干细胞(induced pluripotent stem cell,是成熟细胞所产生的一类干细胞)的生成。因此,我们需要详尽地了解基因调控网络,也需要利用基因分库和基因剂量来进行实验,以便确定是哪些基因共同决定了某些性状。CRISPR/Cas系统将会成为一个用于实现该目标的万能工具,这是因为该系统能够对各种不同的效应结构域进行多重靶向和多重调控。

原文检索:

CRISPR engineering turns on genes

阅读次数:  

发表评论