MPtools 全称是Molecular Phenotypic Tools,是一款专门用于分子表型数据处理的工具。它包括分子表型的数据处理、过滤、校正、分子系谱构建等功能。该软件是基于C++开发。
1. 指定分子表型或样本提取和删除
--extract <ID文件> 提取指定表型ID文件的分子表型
--exclude <ID文件> 删除指定表型ID文件的分子表型
--keep <ID文件> 保留指定样本ID文件的样本
--remove <ID文件> 移除指定样本ID文件的样本
2. 非0值比例过滤
--pheno-rate <值> 分子表型在多个个体表达为0的比例超过阈值将被剔除
--sample-rate <值> 个体的多个分子表型值为0比例超过阈值将被剔除
3. 基于变异系数过滤分子表型
--CV-value <值> 变异系数过小的分子表型(如内参基因)需要过滤,变异系数超过阈值将保留
--CV-top <值> 变异系数排名靠前比例的分子表型将保留
4. 比例类型的分子表型校正(微生物组)
--count Count值转化成比例数据,
--clr 各样本的分子表型进行中心对数变换校正
--min-frac <值> 丰度为0替换成各样本最小分子表型的倍数
--GBM <值> 丰度为0进行几何贝叶斯填充
5. 非比例类型的分子表型校正(转录组、蛋白组、代谢组)
--quantile-norm <值> 分位数校正
--inverse-norm <值> 逆正态变换
6. 构建分子表型亲缘关系矩阵
--kinship 分子表型构建亲缘关系矩阵
--kin-lambda <值> 方差的幂校正,默认是1
--kin-bin <值> 生成二进制亲缘关系矩阵
MPtools V1.0.0 是用C++写的,可用于指定分子表型或样本提取和删除,0值过高的分子表型和样本过滤,过滤掉变异系数过小的分子表型, 比例类型的分子表型校正(微生物组),以及非比例类型的分子表型校正(转录组、蛋白组、代谢组),构建分子表型亲缘关系矩阵,用于下游IASbreeding软件的遗传参数估计和育种值计算。
解压可直接使用
tar -xzvf MPtools-1.0.0-Linux-x86_64.tar.gz
./MPtools
提取特定基因
./MPtools --txtfile Muscle.tpm.autosome.txt --extract extract.id --out Result
删除特定基因
./MPtools --txtfile Muscle.tpm.autosome.txt --exclude exclude.id --out Result
提取特定样本
./MPtools --txtfile Muscle.tpm.autosome.txt --keep keep.id --out Result
删除特定样本
./MPtools --txtfile Muscle.tpm.autosome.txt --remove remove.id --out Result
支持组合,比如提取特定样本的特定基因
./MPtools --txtfile Muscle.tpm.autosome.txt --keep keep.id --extract extract.id --out Result
提取变异系数前10%的基因
./MPtools --txtfile Muscle.tpm.autosome.txt --CV-top 10 --out Result
提取变异系数大于0.5的基因
./MPtools --txtfile Muscle.tpm.autosome.txt --CV-value 0.5 --out Result
保留至少在15%以上的个体都表达(>0)的分子表型
./MPtools --txtfile Muscle.tpm.autosome.txt --pheno-rate 0.15 --out Result
保留至少在85%以上的分子表型都表达(>0)的样本
./MPtools --txtfile Muscle.tpm.autosome.txt --sample-rate 0.85 --out Result
- 非比例类型的分子表型校正(如转录组、蛋白组、代谢组)
分位数校正
./MPtools --txtfile Muscle.tpm.autosome.txt --quantile-norm --out Result
逆正态变换
./MPtools --txtfile Muscle.tpm.autosome.txt --inverse-norm --out Result
支持多种组合,如提取特定样本的特定基因,在再保留至少在15%以上的个体都表达(>0)且变异系数较大的前95%基因,进行逆正态变换和逆正态变换
./MPtools --txtfile Muscle.tpm.autosome.txt --keep keep.id --extract extract.id --pheno-rate 0.15 --CV-top 95 --quantile-norm --inverse-norm --out Result
count转换成比例数据
./MPtools --txtfile 1044otutab.filter.txt --count--out wwwdd
中心对数变换校正
./MPtools --txtfile 1044otutab.filter.txt --pheno-rate 0.15 --count --clr --out Result
对丰度为0的进行几何贝叶斯填充,再进行中心对数变换校正
./MPtools --txtfile 1044otutab.filter.txt --pheno-rate 0.15 --count --GBM --clr --out Correct
可以一步完成
./MPtools --txtfile 1044otutab.filter.txt --pheno-rate 0.15 --count --GBM --clr --kinship --out kinship
也可以先校正再用--kinship
./MPtools --txtfile 1044otutab.filter.txt --pheno-rate 0.15 --count --GBM --clr --out Correct
./MPtools --txtfile Correct.txt --kinship --out kinship
可以放大或者缩小各分子表型方差权重--kin-lambda
./MPtools --txtfile 1044otutab.filter.txt --pheno-rate 0.15 --count --GBM --clr --kinship --kin-lambda 1.1 --out kinship
生成二进制矩阵
./MPtools --txtfile 1044otutab.filter.txt --pheno-rate 0.15 --count --GBM --clr --kinship --kin-lambda 1.1 --kin-bin --out kinship