4006-506-908

全外显子组测序数据分析服务

发布时间:2019-04-09 分享到:

 

分析流程

 

 

识别变异体的分析流程图

变异的筛选分类和统计学分析

1SNPInDel位点进行过滤,过滤条件为:No call rate>=10%;最小等位基因频率,Minor allele frequency < 0.05 ;不符合哈维平衡的位点,HWE P value < 0.001的位点。

 

SNP位点过滤

2)频数统计:计算case/control组中各等位基因和基因型的频率。

 

频数统计

3)关联分析:对所有样品进行分层分析、卡方检验、Fisher精确检验;比较各allele的频率分布在casecontrol组内中是否具有统计学差异;卡方检验、Fisher精确检验和Cochran-Armitage趋势检验,比较各基因型频率分布在两组间中是否具有统计学差异。

 

关联分析

4单倍型分析:选取包含显著的SNP的区段进行单倍型分析(采用软件haploview)以进一步定位候选区段;频率较高的几种单倍型各自的频率,在case/control两组中的分布状况,卡方统计量及p值,判断单倍型与疾病相关性。

 

单倍型分析

5)筛选突变体:使用Phred,得到每个碱基的quality score,去掉那些quality score小于45candidate variantheterozygous variant应该具有10倍以上的覆盖率,并且相应的序列应该具有不同的起始端和终止端,不满足这个条件的需要筛掉;人类基因组中存在正常的SNPs,基于dbSNP, 1000GenomesProject, NHLBI-ESP6500等数据库,筛掉这一部分候选变异体。

6)突变体分类:基于这些variant所在的位置,以及可能产生的后果可以将其分成不同的类别。包括synonymous variant, non-synonymous variant, premature termination, splicing site, indels等等。统计这些变异体的数目和基本信息。

7)基因融合:使用FusionMapGASVPro进行基因融合识别,寻找可能的基因组易位。

8)突变体的蛋白结构预测:使用swiss-model进行同源模建,然后对突变体蛋白质三级结构预测。此外还可以使用chimraDS进行定点突变模块分析,建模之后进行动力学优化,从而预测突变对蛋白质结构的影响。

 

突变体的蛋白结构预测

基因功能关联分析

如果得到较少的和所研究表型相关的基因变异,进行文献查阅和数据库(如ClinVar, Cosmic数据库)检索,得到可能相关的基因功能,以支持实验结果。如果得到比较多的相关基因,选择GO Analysis,验证是否变异的基因富集了和特定表型相关的功能。

Driver mutation的判定

判定第一步:由体细胞突变呼得到候选癌症驱动突变的优先级列表 

综合评价稀有和常见的突变对癌症发病中的作用,首先我们使用径向支持向量机(SVM)训COSMICUNIPROT数据库中的非同义单核苷酸变异(nsSNVs)。使用体细胞突变作为输入,判定系统可以计算相应径向SVM预测每个突变的得分,评估每个突变成为癌症驱动的潜在可能。 

判定第二步:从候选驱动突变癌症驱动基因。 

把从几十年的研究产生有价值的知识,我们就上径向SVM层之上添加一个层面,这一层面通过利用其对应基因的Phenolyzer得分衡量每一个突变的权重,这样根据以往的知识遗传评估每个突变基因型和表型的关联。然后过滤得到包含有害突变的基因并且根据自己的总加权分数进行排序。

判定第三步:从候选驱动基因候选药物 

为了更好地帮助研究者/临床研究的潜在个性化的治疗,我们增加判定的第三步,提供每个癌症基因驱动相关的优先级的药品目录。这一步寻找候选药物与我们的预测癌症基因驱动和重量它们使用相应靶基因的交互得分,并从检索数据库PubChem数据库获取药物活性分数。

 

Driver mutation的判定系统

RNA二级结构的分析

使用RNAsnp软件对SNVRNA二级结构的影响进行评价,评价结构如下:

 

10 SNVRNA二级结构的影响

转录调控因子的关联

通过联合分析ENCODE数据库对目标SNV进行转录因子的关联,找到SNV影响的转录因子的结合。

 

11 SNV对应位置的转录因子

 

转录后调控的网络

使用自主研发的转录后调控的网络分析系统RBP-Var,分析目标SNV对转录后调控的影响,找到调控的可能机制。

 

12 SNV对转录后调控的网络分析系统

 

癌症基因互作网络

使用dSysMap: exploring the edgetic role of disease mutations

 

13 突变基因的蛋白互作网络

突变体蛋白结构预测

通过预测软件对目标SNV对蛋白高级结构的影响,可以显示有害突变体与正常基因的蛋白结构变化。同时,也可以研究突变体对蛋白互作的影响。

 

14 SNV对蛋白高级结构的影响

 

同时,也可以研究突变体对蛋白互作的影响。

 

15 SNV对蛋白相互作用的影响