一只土鳖 一只土鳖 综合讨论组
精华

关于基于PRS的专业版微解读代码和说明

多基因风险评分分析(Polygenic Risk Score)是一个用来评估个体患某种疾病风险的方法,它是通过综合GWAS统计数据的基因型效应值来计算的。

计算公式如下图所示:

WechatIMG6.jpeg

 
做微解读时候应该注意:
1. 我们最终要给出个体风险值相对人群平均风险值的倍数关系,所以最后结果一定是累积OR值相除,而不是累积beta值相除,不然结果会产生负数。
2. 收集GWAS文献中的snp信息时,注意文章给出的effect allele是否是基因组正链的,如果不是需要用碱基互补规则修正过来。
3. 每个位点都需要处理no call或不存在的情况,一般都是用maf值来折算,位点的人群maf可以从公共数据库dbsnp中查得,一般选东亚人群的。
 
这里给一个示例代码给大家参考下:

WechatIMG7.jpeg


WechatIMG8.jpeg

 
代码说明:
1. 正常情况下,下载该源码,只需将snp_info.txt中的snp信息修改成自己收集的信息(格式和列顺序不能改),不做其他更改即可使用。
2. 代码给出的是用beta值来计算,如果GWAS文章给的是OR值, 可先将其转化为beta值(beta = ln(OR)),也可以直接使用OR值计算(示例代码里也有,只是被注释掉了)
3. 另外虽然微解读支持python调用第三方库,但建议只使用python标准库来解决简单的数据处理问题,这样有利于微解读代码审核者发现问题。
 
代码下载地址:https://github.com/TuBieJun/wegene_weijiedu_example
 
希望大家都能做出自己的专业版微解读!

 
2022-01-27 • IP属地深圳
按热门排序    按默认排序

3 个回复

west - 早知道基因,早做健康管理哈
666!支持
大灰狼 - Don't worry, Be happy~
棒!
yhlhhhhh - 每日与生物工程斗智斗勇到谢顶
赞!

要回复问题请先登录注册