题名 | GENOME WIDE PAN-TISSUE ANALYSIS OF ALLELE-SPECIFIC RNA ALTERNATIVE SPLICING REGULATION IN HYBRID MICE |
其他题名 | 杂交小鼠中等位基因特异 RNA 可变剪接调控的多组织全基因组研究
|
姓名 | |
学号 | 11649089
|
学位类型 | 硕士
|
学位专业 | 生物学
|
导师 | |
论文答辩日期 | 2018-06-04
|
论文提交日期 | 2018-07-07
|
学位授予单位 | 哈尔滨工业大学
|
学位授予地点 | 深圳
|
摘要 | Alternative splicing is an important regulatory process of gene expression. It isregulated by the interaction of cis-regulatory elements and trans-acting factors. Thecis-regulatory elements are sequences that can be recognized by RNA binding proteins in precursor mRNA. Trans-acting factors are proteins capable of interaction with cis-regulatory elements to regulate alternative splicing. The F1 hybridization model isan effective method for studying allele specific splicing regulation. Because both allelesin the hybrid have the same trans-acting factors in their shared cellular environment,their splicing differences are due to differences in cis-regulatory elements. To study theregulation of alternative splicing in mammal, we used a hybrid mouse model of C57BL/6J (Mus musculus) and SPRET/EiJ (Mus spretus). The genomic sequencedivergence between C57BL/6J and SPRET/EiJ is the largest among all mouse pedigreestrains with available high-quality genome sequences or currently undergoing genome sequencing. The exonic regions have a DNA sequence difference between the two stains in every 90 base pairs on average. This large sequence difference enables the use of sequencing approach to distinguish allelic RNA transcripts. We studied alternative splicing patterns through RNA-Seq in six tissues and two cell lines. More than 60% of reads could be unambiguously assigned to their respectiveallele in F1 hybrid. Estimated PSI and △PSI values for events in genes with lower SNP density may be inconsistent with the real values due to the exclusion of common reads. To avoid this potential error, we developed an effective method to filter out these events. Finally 16371 splicing events were identified in six tissues and 2 cell lines. 4744 splicing events were expressed in one tissue and 2143 splicing events were expressed in6 tissues and 2 cell lines. According to the clustering results of gene expression andalternative splicing, for PSI values samples predominately clustered by species, tissue-dominated clustering was observed for gene expression levels. This shows thatthey have different patterns of regulatory divergence in splicing and mRNA levels. We found that genes with lower expression levels exhibited larger splicing divergence between C57BL/6J and SPRET/EiJ and events with lower uniformity exhibited larger splicing divergence. Alternative splicing events with less functional impact andtherefore under weaker selective constraint tend to diverge faster in mammalianevolution. Sequence variants affected splicing events. The frequency of divergent events contained higher density of sequence variants at splice sites than control. Cis-regulatory variants at splice site could affect splicing site strength and thereby lead to divergent AS. |
其他摘要 | mRNA 的可变剪接是指由一个前体 mRNA 通过不同的剪接方式产生多个mRNA 转录本异构体的 RNA 加工过程。通过可变剪接,同一基因可以编码具有不 同结构和功能的蛋白质。这也是蛋白质和转录本多样性的重要原因之一。可变剪 接的发生受到严格的控制,它在控制细胞分化,个体发育,机体应对外界刺激等 诸多生理进程中起着决定性作用。另一方面,可变剪接的异常也是导致多种人类 疾病,包括癌症的重要原因之一。可变剪接的发生主要依赖于顺式调控元件和反式作用因子之间的相互作用。顺式调控元件是前体 RNA 上剪接位点附近的一段能够被反式作用因子特异识别的序列。反式作用因子是能够识别并结合到前体 RNA 上的调控可变剪接的蛋白质。目前发现的反式作用因子主要包括:SR 蛋白家族、 不均一核糖核蛋白家族以及一些具有组织表达特异性的 RNA 结合蛋白。目前对于 剪接分子机制已经有了很深的理解,但是对于可变剪接的调控,特别是在不同组 织细胞中发挥功能的调控网络还知之甚少。 本论文通过建立的 C57BL/6J 和 SPRET/EiJ 杂交小鼠模型全面系统研究等位基 因特异的可变剪接模式的跨组织分布,并发掘新型可变剪接顺式调控元件及相应 的反式作用因子,从而重构具有组织特异性的可变剪接调控网络。这也是目前首 次对可变剪接在哺乳动物模型中跨组织多细胞类型的系统性研究。C57BL/6J 和 SPRET/EiJ 是目前已完成基因组测序的 17 种小鼠中基因组序列差异最大的两种,他们之间有 3500 多万的 SNPs 和 450 多万的 indels。外显子区域平均每 90 碱基对就有一个 DNA 序列差异。如此大的序列差异一方面提供了大量具有功能差异的顺式调控元件,另一方面可以运用 RNA-Seq 的方法有效地分辨来自不同等位基因的可变剪接调控进程。杂交子一代模型是目前研究可变剪接顺式调控元件有效的方法。因为在杂交小鼠中,它们所有的 RNA 都处于相同的细胞环境中,所以观察到的等位基因上的剪接差异可以直接归结为顺式调控元件造成的。我们在杂交子一代小鼠中取 6 个组织和 2 个细胞系的 mRNA 进行测序,每个重复的测序深度为 2.4-2.6 亿个读段。根据读段与两个基因组的编辑距离,可以把读段分到它来源的小鼠品系。在子一代中至少 60%的读段可以明确地分配给它们来源的品系。只保留可以明确分配给对应品系的读段以估计 F1 中的可变剪接事件。因此,SNP 密度较低的剪接事件中的的估计 PSI 和△PSI 值可能与实际值不一致。为了避免这种潜在的错误,我们设计了一种方法来排除这些估计 PSI 和△PSI 值与实际值不一致的事件。我们将 F1 中所有的读段合并起来作为一个数据集,把那些能够分配到对应品系的读段合并起来作为另一个数据集。通过比较这两个数据集中剪接事件是否有差异来选出实际值和估计值不一致的剪接事件。为了验证我们的方法是否可行,我们把成纤维细胞的两个品系的亲本读段等量的混合在一起作 为模拟的杂交子一代小鼠。然后对模拟的 F1 按照上述方法处理。最后通过比较模 拟的杂交子一代中两个品系的剪接差异和亲本的剪接事件差异是否一致来验证我们的方法。我们发现在亲本和模拟 F1 中有显著变化的差异事件小于 10%。我们又用肝脏的亲本数据进行验证,它们亲本和模拟 F1 之间的差异也小于 10%。我们又 比较模拟肝脏组织中杂交子一代的各个品系和亲本之间的基因表达,发现它们之 间的相关性在 0.98 以上。这些证明了我们分配杂交子一代数据的方法和计算可变 剪接的方法都是可行的。 最终我们在成纤维细胞、胚胎干细胞、大脑、心脏、肺脏、肝脏、肾脏和脾 脏中总共发现了 16371 个可变剪接事件。4744 个剪接事件只在一个组织中表达。 2143 个剪接事件在 8 个组织中表达,其中包括 87 个在 8 个组织中都是显著差异剪 接事件。通过对杂交小鼠中基因表达和可变剪接的聚类分析,我们发现在杂交小 鼠中基因表达和可变剪接具有不同的调控模式。对于可变剪接,相同品系的小鼠 的不同组织样本首先被聚在一起。对于基因表达,相同组织的不同品系的样本首 先被聚在一起。这和 Burge 实验室在不同脊椎动物中基因表达和可变剪接的分析结果一致。但是有趣的是在我们的杂交小鼠中只有顺式调控元件的差异,我们也观察到了这样的结果。根据 C57BL/6J 和 SPRET/EiJ 小鼠在不同组织中的可变剪接差异事件,我们把在两个组织及以上表达的剪接事件分为 3 组,第一组在所有表达 的组织中都是显著差异的;第二组在所有表达的组织中部分是显著差异的,但不是全部;第三组在所有表达的组织中都没有显著差异。通过对着 3 组剪接事件基因表达和‘Uniformity’(代表这个转录本在这个基因中的支配的程度)的分析,发 现第一组剪接事件中的基因表达和 Uniformity 都低于第三组剪接事件。这说明功 能不重要的剪接事件受到的选择压力较小,从而有更多的可变剪接差异。在哺乳 动物中功能不重要的剪接事件进化比功能重要的剪接事件要快。在 C57BL/6J 和 SPRET/EiJ 之间的顺式调控元件的差异应该可以影响剪接事件,特别是在剪接位点 上的序列差异。为了研究这个问题,我们比较了显著差异的剪接事件和没有差异 的事件在剪接位点上的序列差异密度,发现显著差异的剪接事件具有更大的序列 差异。特别是经典剪接位点(GU/AG)上的序列差异,对可变剪接的影响更大,会导致一个颠覆性的剪接变化。 |
关键词 | |
其他关键词 | |
语种 | 英语
|
培养类别 | 联合培养
|
成果类型 | 学位论文 |
条目标识符 | http://sustech.caswiz.com/handle/2SGJ60CL/75404 |
专题 | 生命科学学院_生物系 |
作者单位 | 南方科技大学 |
推荐引用方式 GB/T 7714 |
Jia FJ. GENOME WIDE PAN-TISSUE ANALYSIS OF ALLELE-SPECIFIC RNA ALTERNATIVE SPLICING REGULATION IN HYBRID MICE[D]. 深圳. 哈尔滨工业大学,2018.
|
条目包含的文件 | ||||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | 操作 | |
GENOME WIDE PAN-TISS(2350KB) | -- | -- | 限制开放 | -- | 请求全文 |
个性服务 |
原文链接 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
导出为Excel格式 |
导出为Csv格式 |
Altmetrics Score |
谷歌学术 |
谷歌学术中相似的文章 |
[贾富建]的文章 |
百度学术 |
百度学术中相似的文章 |
[贾富建]的文章 |
必应学术 |
必应学术中相似的文章 |
[贾富建]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
|
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论