欢迎添加本公司微信公众号:southgene,了解最新最全的基因检测资讯
Ion Torrent Personal Genome Machine (PGM) 16s rDNA测序是下一代测序基础上微生物研究领域的应用。其对微生物16s rDNA测序,首先得到的原始图像文件,然后经过碱基识别及误差过滤,最终得到可以用于分析的原始测序片段,我们称之为Reads,它包括序列的碱基组成信息以及其对应的序列质量信息。
可接收样本类型:口腔唾液、肠道菌群、土壤、水体等。
一、 提供DNA样品的基本要求:
1.样品纯度:OD 260/280值应在1.7~2.0 之间;RNA 应该去除干净。
2.样品浓度:最低浓度不低于20ng/?L。
3.样品总量:每个样品总量不少于0.5?g。
4.样品溶剂:要溶解在H20或TE(pH 8.0)中。
5.样品运输:DNA低温运输(-20℃),且在运输过程中请用parafilm将管口密封好,以防出现污染;收到样品后,公司对样品进行检测,最终样品的量和纯度,以公司的检测结果为准。
二、数据分析:
测序序列质量评估
应用测序质量Q值进行评估,Q值与测序错误E值之间关系为:
评估方法
Q值盒图统计:
盒图即是质量分位图,黄色长方形最下面的边为占25%比例的,质量Q值,依此往上分别为占50%比例,占75%比例对应的质量Q值,上下的黑线代表占90%和10%对应的质量值,蓝色的线表示质量数值的平均值、绿色背景部分代表高质量数值部分、橘色背景部分代表合理质量数值部分、红色背景部分代表低质量数值部分。
图 quality statistics
横坐标为reads的碱基位置,纵坐标为所有reads在每个位置上的
质量(Q: 0~40)分布。此为一个样本双端测序结果综合示例。
数据预处理
本步骤将利用引物设计序列,以此来确认真实有效的16s rRNA 序列片段。这里我们选取两头皆为正确引物序列的reads 作为clean reads 进行分析。
各样品物种分类
使用mothur(version: 1.31.2)工具的“classify.seqs()”方法对每个样品进行物种分类鉴定,去除Mitochondria,Chloroplast,Eukaryota,和unknown(未在数据库中检索到)的结果。随机取样bootstrap 阈值设置为80%。
使用的数据库是RDP training set (v9),下载地址为:http://www.mothur.org/w/images/5/59/Trainset9_032012.pds.zip
选取某一分类层次上物种分类绘图。这里选取分类为第二层:图中显示的比例指该物种分类在各样本中的序列数目占该物种分类所有序列数目的百分比。
各样品OTU及丰度和分类
使用“mothur”工具通过与GreenGene数据库比对,生成OTU,并计算各个OTU在每个样品中的丰度及物种分类,去除Mitochondria,Chloroplast,Eukaryota,和unknown(未在数据库中检索到)的结果。
样品丰富度稀疏曲线
接下来使用sobs 算法对各样本进行随机抽样并计算OTU 的数目丰富度。据此,最终绘制丰富度(richness)稀疏曲线。横坐标为抽样序列数目, 纵坐标为抽样序列中的OTU 的数目。
相似性水平为0.03 的各样本OTU 数目的稀疏曲线
香农指数
计算各样本香农(shannon)指数。绘制多样性(alpha-diversity)曲线横坐标为抽样序列数目,纵坐 标为对应的香农指数。
Rank-Abundance 曲线
根据各样品的OTU 丰度和排序做Rank-Abundance 曲线。
组间韦恩图
根据以上OTU 在各样本中的分类信息绘制韦恩(venn diagram)图。交叉的部分指相邻样品共同的OTU。
群落相似度分析
根据各样品OTU 组成和丰度的差异,计算样品间的相似度,绘制相似度树。