加入收藏| 登录   注册
021-5132 0133
网站公告:

 

单细胞mRNA-Seq >> 返回 您当前所在位置:首页 > 科研服务 > 转录组研究 > 单细胞mRNA-Seq > 正文

单细胞mRNA-Seq服务

更新时间:2014-07-07 14:24:38点击次数:3265次字号:T|T

单细胞转录组测序主要用于在全基因组范围内挖掘基因调节网络,尤其适用于存在高度异质性的细胞(干细胞、肿瘤细胞、神经细胞等)及胚胎发育早期的细胞群体。单细胞转录组分析更有助于深入理解细胞分化、细胞重编程及转分化等过程及相关的基因调节网络。

基于单细胞水平实验的首要条件是准确获得状态良好的单个细胞。目前,应用的方法主要包括显微操作法、有限稀释法、流式细胞法,以及微流体芯片技术。

南方基因利用Illumina HISeq2500平台助您进行单细胞mRNA测序,并通过生物信息学的手段,为您提供全面有效的分析结果。


实验流程


样本准备说明


注意事项:

1. RNA测序单细胞裂解液为1x Triton X-100:分离后的单细胞分别放到3.5?l裂解液中用移液器反复吹打几次后立刻放到-80度保存备用。
2. 如果从细胞开始做那您的培养基中不能含有抑制cDNA反应的成分。
3. 我们的方法适用于无内部标记的悬浮细胞,任何经过固定的细胞样本不能使用。
4. 起始的悬浮细胞的总体积不要超过1-2 μl。请提供给我们1-2μl能直接开始实验的细胞。
附:1x Triton X-100配方

注:以上试剂均为常规实验用试剂,生产商不限。


客户可以自己购买上述单细胞放大试剂盒,将放大纯化后的样品送到我公司,经我公司质检合格后,可以进行文库构建及上机测序实验。若质检不合格,只收取质检费用。


质检标准

单细胞RNA经放大纯化后的样品:

1) 样品浓度:最低浓度不低于0.2ng/?l。
2) 样品总量:每个样品总量不少于5ng。
3) 样品长度分布:长度不小于600bp。
4) 样品溶剂:要溶解在H20中。
5) 样品运输: 用冻存管保存,并用干冰或液氮运输。


数据分析


1.数据预处理

根据测序接头以及测序质量对原始的测序数据进行预处理,其中,测序质量Q与测序错误E之间的关系如下:Q=〖-10Log〗_2 E

Clean统计结果如下:

表1. 数据预处理结果统计

注:Effective reads ratio=Clean reads /raw reads


对预处理后的数据质量以及碱基分布进行统计:

图1. 碱基质量分布

图2. GC含量分布


2. 基因覆盖度分析

2.1 Mapping genome

应用tophat(version:2.0.6)的spliced mapping算法对预处理后reads进行Genome mapping,这种算法允许将不能全长匹配的reads分割进行mapping,较适用于真核(有内含子间区)转录组测序数据;比对允许2个错配,每个reads允许multi hits<=2。
Mapping统计如下表:

表2. Mapping结果统计结果

注:Mapping ratio=Mapped reads/All reads, Mapped Multi reads:匹配到基因组多个位置的reads, Mapped Unique reads:在基因组仅有一个位置匹配的reads


2.2 测序5’,3’偏好性分析

我们把reads在基因上的位置标准化到相对位置(reads在基因上的位置与基因长度的比值),然后统计基因的不同位置比对上的reads数。结果显示,测序主要集中于基因bady区,3’较5’有一定的偏向性。

图3. 测序3’,5’偏好性分析


2.3 基因覆盖度评估

与常规的多细胞样本(检测到15,880个基因)和组织样本(检测到16,767个基因)相比,4个单细胞样本共检测出14,341个基因。

图4. 各类型样本检测出的基因数目


2.4 饱和度分析

随机选取一定数量的reads,检查有多少reads落在基因上,然后建立饱和曲线(图5),分析测序深度与所发现的基因数目的关系。

图5. 饱和曲线(Sample 6)


Reads:即至少有一个reads落在基因区域;Fragments:至少有一个fragment落在基因区域,这里fragments就是指一对reads,也就是至少有一对reads落在基因区域才算这个基因有覆盖。


3. 基因表达分析

3.1 基因表达定量

从指定物种基因模型(基因结构)中得到gene、exon、intron以及UTR等位置信息,通过基因组比对结果计算出在不同区域富集片段数目,然后应用RPKM/FPKM标准化公式对富集片段的数量进行归一化。


3.2 基因表达分布统计

图6. 基因表达量分布


3.3 样本间表达相关性分析

根据每个细胞各个基因的表达量(FPKM)计算Spearman相关系数(表3),并绘制相关性散点图(图7)。

表3. Spearman相关系数

图7. 样本间基因表达(log2(FPKM))相关性散点图


3.4 细胞特异性表达的基因

根据基因表达量(FPKM),绘制各细胞表达基因数目的韦恩图。

图8. 四个细胞检测到的基因数目


4. 技术重复性评价

为了检测技术的重复性,我们将1个单细胞样本反转录后的cDNA平均分成两份,然后分别构建RNA-seq文库并测序。结果显示,测序质量、基因表达相关性及基因覆盖度三个指标均表明该方法具有良好的重复性,相关结果如下:

表4. 测序质量统计

图9. 基因表达相关性

图10. 基因覆盖度比较


5. 样本聚类

应用主成分分析(Principal Component Analysis,PCA)考察细胞间基因表达模式的相似程度。

图11. 主成分分析

将差异表达基因进行层次聚类(Hierarchical clustering),一般来说,聚在同一个簇的基因可能具有类似的生物学功能,而且同一类细胞能通过聚类也将会出现在同一个簇(cluster)中。

图12.差异表达基因的热点图





(编辑:sgfmt)
  • 上一篇:已经没有了
  • 下一篇:已经没有了

地址:上海市浦东新区张江高科技园区郭守敬路351号1号楼4楼

电话:+86-21-51320133

            +86-21-58816760

            +86-21-58820889
传真:+86-21-51320131


点击这里给我发消息点击这里给我发消息点击这里给我发消息点击这里给我发消息