1990年,人类基因组计划正式启动。这个被誉为生命科学“登月计划”的人类科学史上的伟大工程,旨在测定组成人类基因组DNA中30亿个碱基对的序列,从而破译人类的遗传信息。伴随着这项历时13年耗资30亿美元的工程宣告完成,科学家们发现了一些令人震惊的现象。
与曾经在公众中广为流传的预期大相径庭,科学家们无法在人类基因组中发现“10 万个”基因,目前公认的数值是大约只有2万个编码蛋白质的基因。这说明虽然人类基因组的容量比线虫、果蝇和小鼠都要大得多,但是它们能够编码蛋白质的基因数量差不多。换句话说,没有用于编码蛋白质的DNA序列在基因组中的比例高达98%,这简直可以用令人震惊来形容。这些大量的非编码序列曾经被称为“无用”DNA,它们就像一片片荒漠,一度被认为无关紧要,也无人探索。
然而,这些“无用”DNA并不是无用的。很多关系人类健康、决定人类与其他物种差异的信息就储存在这大量尚未开采的“荒漠”中。其中,“无用”DNA的重要性日益凸显的一个研究领域是癌症研究。
(相关资料图)
这涉及人类基因组最令人迷惑的某些特征,包括巨量的DNA重复序列,其中许多都是古老的病毒在感染人体后残留的碎片。
伦敦的科学家发现,这些重复序列会在细胞分裂时阻碍DNA的复制,为危险的突变创造机会。其他类型的“无用”DNA也在癌症的发生中起作用,相关的证据在过去的几年间显著增加。我们还渐渐看到,各种各样的非编码RNA在肿瘤的发生和发展以及癌细胞的耐药性中发挥着各自的作用。
长链非编码RNA与癌症
在某种程度上,癌症可以被看作与发育同根同源的另一面。与正常的发育相比,癌症的问题在于成熟的细胞重新获得了某些非专能细胞才拥有的特性,继而开始不受控制地分裂。既然长链非编码RNA与细胞的多能性和胚胎的发育息息相关,它们与癌症有瓜葛自然也就没有那么令人惊讶了。
曾有一项大型的研究对4种不同的癌症(前列腺癌、卵巢癌、一种名为胶质母细胞瘤的脑部肿瘤,以及一种肺癌)共计1300多个病灶样本的长链非编码RNA表达情况进行过分析。科学家在急重症患者中发现了大约100种最常见的、表达水平异常提升的长链非编码RNA,其中有9种表现出与癌症类型无关的倾向,所以它们或许可以用作预测癌症患者生存率的通用性标志物。
这项研究的参与者称,他们发现了用长链非编码RNA区分上述3种癌症(前列腺癌除外)的办法。通常所说的癌症只是一个笼统的称呼,它包括了许多性质差异巨大的疾病。比如,当我们说卵巢癌时,根据癌变细胞的种类不同,其实卵巢癌有不同的分型,它们的自然史互不相同。这会影响疾病的转归和预后,以及治疗手段的选择。将来的医生或许可以根据病例样本的长链非编码RNA检测结果,针对性地为病人制定最佳的治疗方案。
声称长链非编码RNA的表达与癌症有关的研究一直层出不穷,与此同时,针对癌症的遗传学研究也有了很多耐人寻味的发现。
有的癌症是由单个效力巨大的变异引起的,而且同样的变异会在家族中代代相传。最家喻户晓的例子可能要数BRCA1,这个基因的变异会让女性有极高的概率患上恶性乳腺癌。
2013年,美国女星安吉丽娜·朱莉在得知自己带有这个基因的变异后,选择了接受双侧乳腺切除手术。虽然这种只要一个基因变异就有可能导致癌症的情况相当罕见,不过从现有的研究看,与遗传因素相关的癌症并不在少数。让人费解的是,当科学家在基因组中定位那些会提升癌症患病风险的变异时,他们寻获的位置经常落在没有基因的区域内。在已知的略多于300个癌症相关遗传变异中,只有3.3%改变了蛋白质内的氨基酸序列,超过40%的变异位于编码蛋白质的基因之间的序列——在这种情况下,变异影响的可能是长链非编码RNA,而不是蛋白质。新近研究证实,至少有两种癌症(乳头状甲状腺癌和前列腺癌)的部分变异符合这种情况。
令人欢欣鼓舞的是,我们已经开始在某些研究结果中看到了端倪:在某些癌症中,长链非编码RNA能改变癌细胞的行为,两者绝不只是“相关”那么简单。
前列腺癌细胞会过量表达一种长链非编码RNA。这种过量的表达抑制了另一种蛋白质的表达,而这种蛋白质在抑制细胞过快增殖中起着关键性的作用。打个比方,这种长链非编码RNA的过量表达就好像是松开了一辆车头冲下停在斜坡上的汽车的手刹。敲除该分子将导致小鼠在发育中出现骨骼畸形,科学家发现它在很多癌症病例中都有过量表达的现象,包括肝癌、结直肠癌、胰腺癌和乳腺癌。另外,它的过度表达与较差的预后有关。在人工培养的癌细胞中进行的实验显示,过量表达这种长链非编码RNA可能会让癌细胞的转移性更强,更容易侵犯身体的其他部位。
长链非编码RNA是主动参与了细胞的癌变,而非被细胞癌变所裹挟,能够证明这一点的最有力的证据源自对前列腺癌的研究。在前列腺癌发生的早期,癌组织的生长需要依赖雄激素——睾酮。睾酮与细胞表面的受体分子结合,启动许多能够促进细胞增殖的基因。
你可以把睾酮与受体的结合想象成用脚踩下汽车的油门。治疗前列腺癌的早期措施是用药物阻断雄激素与受体分子的结合,就好像是在你的脚和汽车的油门之间插上一块隔板,踩不到油门,汽车自然就无法加速。
但这不是长久之计,很快癌细胞就会找到应对的方法。雄激素受体会发生变化,即便没有与睾酮结合,也可以激活下游的基因。这就像有人在油门上放了满满一麻袋糖,把它死死压住,于是车子开始急速狂奔。这时候,你就算把双脚高高地搁在仪表盘上也于事无补。
侵袭性前列腺癌细胞会超量表达两种长链非编码RNA,它们在癌细胞雄激素受体的性质变化中扮演了关键角色。这两种RNA能协助激素受体,让受体在没有雄激素刺激的情况下照样可以驱动下游基因的表达,借此加快细胞的增殖。它们就是比方里的那袋糖。如果在癌症的细胞模型里敲减这两种长链非编码RNA的表达,肿瘤的生长速度就会显著降低,这侧面反映了它们在癌症中所起的重要作用。
还有一种长链非编码RNA也与前列腺癌有关。这种长链非编码RNA的表达水平越高,癌症的恶性程度就越高,患者完成治疗后的复发时间越短、死亡率也更高。敲减这种长链非编码RNA对肿瘤生长的抑制效应与我们在上述细胞模型里看到的相近,只是它的作用机制似乎没有涉及睾酮的受体。这意味着即便是同一种癌症,不同的长链非编码RNA也可能在通过不止一种途径对其产生影响。
小RNA与癌症
小RNA的错误表达与一些严重影响全人类健康的疾病有关,其中包括心血管疾病和癌症。后者应该在很多人的意料之中,毕竟癌症的本质是细胞的一种发育异常,而小RNA在细胞的发育中发挥了重要的作用。
能够清楚说明这一点的例子是一种肿瘤,它是儿童脑肿瘤的一个亚型,特点是肿瘤细胞持续表达与细胞发育而非细胞成熟有关的基因,症状出现的时间通常在两岁以前。很不幸,这是一种非常恶性的肿瘤,即使用了最有效的治疗方式,它的预后也很差。造成这种肿瘤的原因是脑细胞的遗传物质发生了不恰当的重排:一个在正常情况下能够强力促进基因表达的启动子,出现在了某个编码小RNA的基因簇之前。不仅如此,这段混搭的序列还被复制了,所以基因组里有不止一个这样的重排序列。结果,错位的启动子过分强烈地激活了紧跟其后的小RNA的表达,导致它们在细胞内的数量达到了正常水平的150~1000倍。
这个基因簇一共编码了超过40种小RNA,事实上,这是灵长类动物中最大的一个小RNA基因簇。正常情况下,它只在人类发育的早期(不到8周的胎儿体内)才表达。如果是在出生后的婴儿脑内,这些小RNA会给基因的表达带来灾难性的后果。比如,它们可以促进一种表观遗传蛋白(对DNA进行修饰)的表达,这会造成脑细胞DNA甲基化修饰的全面洗牌,导致基因组内大范围的基因表达异常,许多基因原本只应该在大脑还未发育成熟、脑细胞还能分裂的时候表达,可它们在婴儿时期被激活,这成了脑细胞癌变的祸根。
小RNA与表观遗传机制之间的协作并不一定会直接导致癌变,也可能只是让细胞更具癌变的倾向。表观遗传放大了小RNA异常表达的效应,因为表观遗传修饰可以传给子细胞,这让细胞有了把小RNA造成的效应传递下去的机会,从硬件上延续了一种具有潜在危险的表达模式。
小RNA与表观遗传之间的协作机制并没有被完全阐明,但新的线索正不断涌现。比如,有一类特殊的小RNA能够提高乳腺癌的恶性程度,原因是它们针对的信使RNA编码了某些负责移除关键性表观遗传修饰的酶。这改变了癌细胞基因组的表观遗传修饰,进一步扰乱了基因的表达。
许多癌症的探查都出奇困难,原因可能是它们生长的位置刁钻,癌变组织的样本很难获取。这可叫医生犯了难,他们需要明确癌变组织的情况,还要在治疗阶段通过及时跟进癌细胞的变化来评估治疗的效果。因此,他们不得不借助间接手段,比如扫描和成像技术。
于是有研究者提出,或许我们可以利用小RNA分子来追踪肿瘤的自然史。在癌细胞死亡后,小RNA常常因为癌细胞的破裂而被释放到细胞外。这些短小的“无用”分子往往依附在细胞的蛋白质上,或是被包裹在细胞膜的碎片中,因此可以稳定地存在于体液中,这让分离和分析这些分子成为可能。由于它们的含量很低,研究人员需要非常灵敏的分析技术——考虑到核酸测序技术日新月异的升级速度,这也不是不可能实现的。支持这种构想的实验数据已经有了,它们证实了该技术在乳腺癌和卵巢癌等癌症中的可行性。
另外对于肺癌,数据表明外周血中的小RNA水平可用于区分患者肺内的单个结节究竟是良性的(不需要治疗)还是癌变了(需要治疗)。
总结
或许,没有什么比投入新型治疗技术的研发经费数目更能反映我们对于“无用”DNA的巨大改观。保守估计,这个领域的投入已经达到了数百亿美元的级别。各种“无用”DNA的表达可以作为癌症患者分期的生物标志物,不仅能为制定最合适的治疗方案提供参考,还能用于甄别哪些患者最有可能对标准的一线疗法产生耐受。此外,有临床试验正在测试将“无用”DNA序列直接作为抗癌药物的效果。
标签: