您的位置 首页 > 数码极客

rnaseq——rnaseq数据分析流程

QsRNA-seq:一种用于对小RNA进行高通量鉴别和定量的方法

QsRNA-seq: a method for high-throughput

profiling and quantifying small RNAs

该篇文章主要介绍了如何分离长度很短的小RNA分子,然后如何利用该分离方法得到的小RNA分子进行建库操作。最后从技术重复性,生物学重复性,小RNA检测能力等方面对QsRNA-seq方法进行评估。

摘要

利用高通量测序技术进行小非编码RNA定量非常困难,因为这些RNA长度太短。研究人员开发了一种名为QsRNA-seq的建库方法,该方法允许对长度仅相差20 nt的小于100 nt的片段进行凝胶自由分离。该方法允许使用分子标签进行定量,并且比基于凝胶的方法更易于自动化。通过观察秀丽隐杆线虫胚胎和幼虫中的miRNA,研究人员证明了QsRNA-seq可以得到非常准确、全面和可重复的结果。

A novel method for separating nucleic acids shorter than 100 nucleotides

sRNA测序和定量的难点在于其长度过短,为了将这些小RNA从tRNA等分离出来,需要开发一种能将20-100nt长度的分子分开的方法,为此研究人员改进了SPRI方法,该方法可以对特定片段范围的核酸进行筛选,通过核酸分子长度和凝聚剂的浓度可以分离不同长度的片段。当加入酒精时,可以使短至18 nt的片段与磁珠结合。因此研究人员假设通过调整异丙醇的浓度,就能实现分离小于100 nt的分子。这该假设基础上,研究人员制备了一系列基于SPRI的尺寸选择溶液,其中PEG浓度相同,异丙醇浓度范围则是32%-54.5%,然后测试它们促进不同长度的单链RNA寡核苷酸(19-66 nt)与磁珠的结合能力(相当于模拟从tRNA等分子中分离sRNA过程)。之后研究人员还检测了用这些条件分离37 nt和58 nt分子的可行性,分离过程中还进行了两步尺寸选择。首先是长一些的分子与磁珠结合,收集未结合的短片段分子,然后再加入第二批磁珠和异丙醇,调整条件使得短一些的分子全部与磁珠结合。如图1展示的即为不同异丙醇浓度下,两种片段分子分离的情况。最终研究人员得到的结论就是在异丙醇浓度合适的条件下,可以将两种长度差在20 nt的短核苷酸分子分开。


QsRNA-seq: a method for preparation of small RNA libraries

分离完小片段RNA,接下来需要进行sRNA建库,这里研究人员起了个名字叫QsRNA-seq(如图2)。大致方法是第一步3‘端加adapter,然后移除长的RNA,之后在短RNA的5’端加adapter,进行反转录和扩增等步骤。QsRNA-seq方法是基于传统的基于PAGE的方法,该方法的一个问题是产量低,因此研究人员利用两种方法(QsRNA-seq和基于PAGE的方法)进行小片段寡核苷酸建库,结果表明QsRNA-seq的产量比另一种方法高5倍,并且具有更高的技术重复性。

之后研究人员又从秀丽隐杆线虫胚胎中提取RNA,分别用QsRNA-seq方法和基于PAGE的方法进行3次技术重复建库,最后结果表明用QsRNA-seq方法建的文库质量与其他方法相比具有相当高的质量和更高的产量。并且sRNA建库过程中会出现偏差,通过比较在5‘端加入UMI和不加UMI的文库发现,加入UMI会显著降低偏好性。

QsRNA-seq can evaluate miRNA abundance and expression changes accurately

之后研究人员为了研究QsRNA-seq方法检测sRNA的能力,利用该方法从不同发育阶段野生线虫和人类大脑组织中提取RNA,建库测序后将测序reads比对到miRNA上。在秀丽隐杆线虫样本中,100%miRNA都被检测到至少呈现一条链(3p或者5p),稀有miRNA比如lsy-6也被检测到,并且RNA起始量降低也能得到一致的结果。在人类大脑中,可以比对上80%miRNA。研究人员认为这种差异可能是RNA提取样本不一样,线虫样本是从整个蠕虫中提取,而另一种样本只是来源于人类某一特定组织中的细胞。

为了进一步评估方法的一致性,研究人员分别从技术重复和生物学重复两方面评估miRNA表达水平的离散情况,结果表明加入UMI分子后,不管是技术重复还是生物学重复,都会降低文库偏差,展示出更低的离散水平(图3)。

The 23-nt-long small RNAs are enriched in L4 larvae and not in embryos in C. elegans

在秀丽隐杆线虫中除了22 nt的miRNA分子,还有各种内源性siRNA(26 nt,21 nt等)。为了评估QsRNA-seq方法是否能检测到所有的sRNA,研究人员计算了比对到基因组上的reads的长度分布,然后发现在胚胎期和L4幼虫期的秀丽隐杆线虫中reads长度分布有差别(图4),在胚胎期,大部分sRNA长度是22 nt,而L4阶段主要是23 nt。后续通过去除比对到miRNA的reads,重新计算长度分布,发现大部分22 nt,23 nt长的分子是miRNA。类似的分析发现21 nt的序列是21 U,26 nt的序列是初级siRNA。


为了进一步研究胚胎期和L4幼虫期的秀丽隐杆线虫中reads长度分布的差别,研究人员计算了在两个不同时期miRNA的表达变化情况,通过筛选差异表达miRNA,发现30个miRNAs主要在胚胎期表达,38个miRNAs主要在L4时期表达(图5a)。有趣的是只用23 nt长的序列评估miRNA的表达变化,研究人员发现23 nt的miRNA在L4期中表达比例更高(图5b),而22 nt长的miRNA表达比例在不同发育时期没有显著差别,表明23 nt的miRNA可能是发育过程中特有的。



更多生信分析需求请加微信:


责任编辑: 鲁达

1.内容基于多重复合算法人工智能语言模型创作,旨在以深度学习研究为目的传播信息知识,内容观点与本网站无关,反馈举报请
2.仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告,请读者放心使用!

“rnaseq,rnaseq数据分析流程,rnaseq测序,rnaseq是什么意思”边界阅读