MPtools 分子表型处理工具

MPtools 全称是Molecular Phenotypic Tools,是一款专门用于分子表型数据处理的工具。它包括分子表型的数据处理、过滤、校正、分子系谱构建等功能。该软件是基于C++开发。

MPtools 功能:

1. 指定分子表型或样本提取和删除

--extract <ID文件> 提取指定表型ID文件的分子表型

--exclude <ID文件> 删除指定表型ID文件的分子表型

--keep <ID文件> 保留指定样本ID文件的样本

--remove <ID文件> 移除指定样本ID文件的样本

2. 非0值比例过滤

--pheno-rate <值> 分子表型在多个个体表达为0的比例超过阈值将被剔除

--sample-rate <值> 个体的多个分子表型值为0比例超过阈值将被剔除

3. 基于变异系数过滤分子表型

--CV-value <值> 变异系数过小的分子表型(如内参基因)需要过滤,变异系数超过阈值将保留

--CV-top <值> 变异系数排名靠前比例的分子表型将保留

4. 比例类型的分子表型校正(微生物组)

--count Count值转化成比例数据,

--clr 各样本的分子表型进行中心对数变换校正

--min-frac <值> 丰度为0替换成各样本最小分子表型的倍数

--GBM <值> 丰度为0进行几何贝叶斯填充

5. 非比例类型的分子表型校正(转录组、蛋白组、代谢组)

--quantile-norm <值> 分位数校正

--inverse-norm <值> 逆正态变换

6. 构建分子表型亲缘关系矩阵

--kinship 分子表型构建亲缘关系矩阵

--kin-lambda <值> 方差的幂校正,默认是1

--kin-bin <值> 生成二进制亲缘关系矩阵

更多关于 MPtools

开发者:蔡文涛

联系方式:caiwentao@caas.cn

MPtools 软件开发

MPtools V1.0.0 是用C++写的,可用于指定分子表型或样本提取和删除,0值过高的分子表型和样本过滤,过滤掉变异系数过小的分子表型, 比例类型的分子表型校正(微生物组),以及非比例类型的分子表型校正(转录组、蛋白组、代谢组),构建分子表型亲缘关系矩阵,用于下游IASbreeding软件的遗传参数估计和育种值计算。

安装MPtools

解压可直接使用

tar -xzvf MPtools-1.0.0-Linux-x86_64.tar.gz
./MPtools 

MPtools的使用

  • 指定分子表型或样本提取和删除
提取特定基因
./MPtools --txtfile Muscle.tpm.autosome.txt --extract extract.id --out Result
删除特定基因
./MPtools --txtfile Muscle.tpm.autosome.txt --exclude exclude.id --out Result
提取特定样本
./MPtools --txtfile Muscle.tpm.autosome.txt --keep keep.id --out Result
删除特定样本
./MPtools --txtfile Muscle.tpm.autosome.txt --remove remove.id --out Result
支持组合,比如提取特定样本的特定基因
./MPtools --txtfile Muscle.tpm.autosome.txt --keep keep.id --extract extract.id --out Result

  • 过滤掉变异系数过小的分子表型
提取变异系数前10%的基因
./MPtools --txtfile Muscle.tpm.autosome.txt --CV-top 10 --out Result
提取变异系数大于0.5的基因
./MPtools --txtfile Muscle.tpm.autosome.txt --CV-value 0.5 --out Result
  • 0值过高的分子表型和样本过滤
保留至少在15%以上的个体都表达(>0)的分子表型
./MPtools --txtfile  Muscle.tpm.autosome.txt --pheno-rate 0.15 --out Result
保留至少在85%以上的分子表型都表达(>0)的样本
./MPtools --txtfile  Muscle.tpm.autosome.txt --sample-rate 0.85 --out Result
  • 非比例类型的分子表型校正(如转录组、蛋白组、代谢组)
分位数校正
./MPtools --txtfile Muscle.tpm.autosome.txt --quantile-norm --out Result
逆正态变换
./MPtools --txtfile Muscle.tpm.autosome.txt --inverse-norm --out Result
支持多种组合,如提取特定样本的特定基因,在再保留至少在15%以上的个体都表达(>0)且变异系数较大的前95%基因,进行逆正态变换和逆正态变换
./MPtools --txtfile Muscle.tpm.autosome.txt --keep keep.id --extract extract.id --pheno-rate 0.15 --CV-top 95 --quantile-norm --inverse-norm --out Result

  • 比例类型的分子表型校正(适合微生物组)
count转换成比例数据
./MPtools --txtfile 1044otutab.filter.txt --count--out wwwdd
中心对数变换校正
./MPtools --txtfile 1044otutab.filter.txt --pheno-rate 0.15 --count --clr --out Result
对丰度为0的进行几何贝叶斯填充,再进行中心对数变换校正
./MPtools --txtfile 1044otutab.filter.txt --pheno-rate 0.15 --count --GBM --clr --out Correct

  • 构建分子表型亲缘关系矩阵
可以一步完成
./MPtools --txtfile 1044otutab.filter.txt --pheno-rate 0.15 --count --GBM --clr --kinship --out kinship
也可以先校正再用--kinship
./MPtools --txtfile 1044otutab.filter.txt --pheno-rate 0.15 --count --GBM --clr --out Correct
./MPtools --txtfile Correct.txt --kinship --out kinship
可以放大或者缩小各分子表型方差权重--kin-lambda 
./MPtools --txtfile 1044otutab.filter.txt --pheno-rate 0.15 --count --GBM --clr --kinship --kin-lambda 1.1 --out kinship
生成二进制矩阵
./MPtools --txtfile 1044otutab.filter.txt --pheno-rate 0.15 --count --GBM --clr --kinship --kin-lambda 1.1 --kin-bin --out kinship