长链非编码RNA(lncRNA)是一类长度大于200 nt 的非编码RNA(ncRNA),广泛存在于各种生物体内,在表观遗传调控、细胞周期调控和细胞分化调控等众多生命活动中发挥重要作用,与动植物的生长发育,人类的疾病发生有着密切关系,也可作为疾病诊断的标志物或是重要靶点。
利用高通量测序技术进行lncRNA 测序及生物信息学分析,可快速准确地发现那些具有重要调控功能的lncRNA,分析其与特定生物学过程的关系,深入探索lncRNA的功能及其表达调控机制。包括竞争结合miRNA的ceRNA调控机制,及对染色质结构进行一系列调控如增强子、启动子、绝缘子等。
技术优势
1. 文库优化:采用核糖体去除和链特异性文库构建方案,保留了完整的lncRNA和mRNA序列,以及序列方向性。
2. 序列完整:对样本中几乎全部的lncRNA和mRNA序列进行鉴定和分析。
3. 物种多元:对包括人类、动植物在内的许多物种的lncRNA进行鉴定和分析。
4. 分析严谨:系统收集lncRNA数据库用于鉴定已知lncRNA,并设置严格的筛选条件用于发现新lncRNA。
5. 关联全面:开展lncRNA与mRNA的关联分析,深入分析lncRNA调控网络。
样本起始量与送样建议
样本类型 |
起始量 |
动物及临床脏器组织/脑组织等 |
>20mg |
动物及临床皮肤/骨/血管/脂肪组织等 |
>100mg |
植物叶片组织/花 |
>200mg |
植物根/茎/果实/种子 |
>500mg |
原代细胞/细胞系 |
>5×106个 |
中性粒细胞/嗜酸性粒细胞/嗜碱性粒细胞 |
>5×107个 |
外泌体样本 |
>1×108个 |
血清/血浆/脑脊液/关节积液/卵泡液 |
>2mL |
细胞培养上清液 |
>20mL |
尿液 |
>30mL |
总RNA |
>1μg且RIN>7.0 |
注意事项:
① 组织样本建议保存在RNAlater、RNAHold、RNAProtect等相关组织保存液中,然后-80℃保存或干冰寄送;
② 细胞样本使用TRIzol等裂解液充分裂解之后,-80℃保存或干冰寄送
③ 更加详细的样本准备指南,请联系在线客服
应用场景
应用场景1:启动子/增强子调控
适用范围:非线性转录调控、新顺式作用元件发现及功能鉴定、组织特异性启动子筛选及确定等研究
lncRNA的自身转录会干扰其邻近编码蛋白的基因的转录。上游lncRNA转录时,会穿越邻近靶基因的启动子区,干扰了转录因子与靶基因的启动子结合,从而抑制靶基因的转录。此外,lncRNA具有促进增强子环化和激活基因表达的功能。在没有成环的情况下增强子处于非活性状态。
应用场景2:与蛋白修饰/DNA甲基化/m6A联合
适用范围:临床医学、基础医学、植物遗传育种等研究
lncRNA参与表观调控,可能是招募一些染色质重构复合体来介导基因沉默,尤其是一些与组蛋白修饰相关的组蛋白甲基转移酶的调控。此外,lncRNA还能与一些DNA甲基化和去甲基化酶结合使得基因的启动子区发生甲基化的变化从而影响基因表达。
应用场景3:ceRNA调控机制
适用范围:环境应激、临床医学、植物遗传育种、疾病早期诊断等研究
ceRNA全称competing endogenous RNA,是一种能够竞争结合RNA的作用元件。通常lncRNA和circRNA会竞争结合miRNA,我们一般把lncRNA和circRNA可以称作ceRNA。ceRNA调控网络全称ceRNAregulation network,指的是有ceRNA参与的整个调控网络cascade。而ceRNA分析指的是对整个ceRNA调控网络进行分析。一般有circRNA-miRNA-mRNA分析或lncRNA-miRNA-mRNA分析。
结果展示
不同样本lncRNA基因组可视化结果为了更直观的展示lncRNA candidate在染色体中分布情况,我们采用circos(ww.circos.ca)软件对筛选获得的lncRNA进行基因组mapping。
主要分为两部分进行展示,一部分按照lncRNA的不同分类进行基因组mapping,另一部分按照不同样本中lncRNA进行基因组mapping。作图时分别将每条染色体按照每25mb为基本单位,不同样本中lncRNA基因组可视化作图时统计每个区段中lncRNA的表达量绘图,不同lncRNA类型基因组可视化时统计每个区段内lncRNA的数目绘图。
1.差异基因火山图
通过绘制火山图可以了解差异表达基因的整体分布情况。以log2 (foldchange)为横坐标,-log10(pvalue)为纵坐标,对差异表达分析中所有的基因绘制火山图。 其中横坐标代表基因在不同样本中差异表达倍数变化;纵坐标代表基因表达量变化差异的统计学显著性;up颜色代表上调的显著差异表达基因,down颜色代表下调的显著差异表达基因,no代表非显著性差异表达基因。
2.差异基因聚类热图
差异基因聚类分析用于判断基因在不同实验条件下调控模式的聚类模式。根据样品基因表达谱的相近程度,将基因进行聚类分析,直观地展示基因在不同样品(或是不同处理)中的表达情况,由此获取生物学相关信息。为了更好的直观反映聚类表达模式,对于非生物学重复
我们采用log10(FPKM+1)进行展示,对于生物学重复将差异基因FPKM通过Z值方式进行基因表达展示。其中横坐标为样本,纵坐标为基因,不同的颜色表示不同的基因表达水平。
常见问题
1.什么是长链非编码RNA?它们的作用有哪些?
哺乳动物基因组序列的约5%~10%被稳定转录,蛋白质编码基因仅约占1%,其余4%~9%的序列都转录为非编码RNA。而非编码RNA(non-coding RNA) 是指不能翻译为蛋白的功能性RNA分子。长链非编码RNA为这4%~9%中长度大于200nt的非编码RNA。它们的作用主要体现在四个方面:第一,影响周边基因的表达;第二,调控蛋白质活动及定位;第三,产生小分子RNA;第四,对其他RNA的调控作用。
2.lncRNA测序为什么需要构建链特异性文库?
很多基因组区域具有正负链的转录本,反义转录是真核基因的一个特征,是一种重要的调控方式。使用ssRNA-Seq(Strand-Specific)能够保留RNA的方向性信息,可以确定转录本来自正链还是负链,以便更加准确的获得基因的结构以及基因表达信息。
3.预测lncRNA与mRNA、miRNA互作的方法?
1)cis调控预测,筛选的条件只有cis location是100kb。(同一条染色体上距离lncRNA100kb的mRNA,都会被列入到cis调控的可能)
2)trans调控预测用的是RIsearch软件,是以最小自由能小于-11来筛选碱基互补配对的lncRNA与mRNA。
3)在预测lncRNA与miRNA互作的时候, 用score罚分值来判定,一般≤4就认定为可信,数值越小越可信。