原标题:我国科学家开发高效基因组序列分析工具
人类的疾病易感性和生理特征等常见性状的差异,往往由DNA序列变化造成,这些DNA片段缺失、增加、异位等变化被统称为遗传变异。全基因组关联研究(Genome-Wide Association Study,GWAS)是通过比对大量人群的遗传信息,利用统计学检测遗传变异和性状之间关联性的方法。西湖大学的研究团队开发了可用于百万级生物样本库的全基因组关联研究的分析工具,相关成果在《Nature Genetics》发表,题为:A generalized linear mixed model association tool for biobank-scale data。
随着近年来十万级、甚至百万级大型生物样本库的出现,目前的GWAS分析工具已不能满足数据分析的需求。该研究团队开发了一款高效的广义线性混合模型,克服了传统分析工具耗时长等缺点,并且对硬件的要求较低。研究人员通过对包含两百万人的模拟样本进行分析,发现这种工具预算效率最高时可达已有技术的36倍。利用这种工具分析英国生物样本库中的2989个疾病相关性状也验证了其稳健高效的特征,研究人员已将所有的关联分析结果共享到在线数据平台上以供生物医学类研究参考。
此项成果不仅为超大型生物样本库关联分析研究提供了有力工具,也为揭示人类复杂疾病遗传奥秘带来了新希望。
注:此研究成果摘自《Nature Genetics》,文章内容不代表本网站观点和立场。
论文链接:
https://www.nature.com/articles/s41588-021-00954-4