近日,研究人员对刊登于《细胞—系统》的基于血浆和白细胞采样获取的两组基因表达数据,进行了系统性基因交互作用分析,发现5个关键基因不但可以完全判别样本是否感染新冠病毒,而且还能根据感染特征把确诊患者进一步划分到7种不同的新冠亚型。
这些基因表达数据包含19472个基因,来自100位新冠确诊患者和26位无新冠症状志愿者。2月3日,相关论文刊登于Journal of Data Science。研究人员表示,该发现有望把新冠感染检测准确性提高到100%和制定基于感染特征的个性化治疗方案。目前,其他基于基因表达数据的新冠病毒研究公布的最高判别准确率约为91.27%。
论文唯一作者、美国威斯康辛大学统计系教授张正军告诉《中国科学报》:“尚未有文献(包括新冠基因、癌症基因、艾滋病基因、白血病基因研究等)从几万个基因里精准筛选出几个关键基因。此次公布的新冠基因有助开发精准的新冠检测剂、更高效的二代疫苗,以及有效的抗新冠病毒药物和疗法。”
该研究引入了竞争因子效应,从认知科学的广度出发,借助一个全新的机器学习模型,基于基因的非线性交互关系确定了5个全新的关键基因(ABCB6 、KIAA1614 、MND1、SMG1、RIPK3)。这些基因中包含新冠肺炎重要基础信息。
例如,其中的SMG1属于无义介导的mRNA降解的基因。无义介导的mRNA降解是高度保守的mRNA质量监控系统,在真核生物细胞中广泛存在,能避免异常蛋白质的产生和累积,因此SMG1对开发第二代mRNA疫苗有重要的参考意义。
而且,作者还表示,在7类新冠亚型中,SMG1的作用和监控依不同亚型而不同,甚至其对一类亚型没有作用。这表明mRNA疫苗开发需要深入研究这些关系,非mRNA疫苗也需要重视,这些疫苗不能相互替代。此外,KIAA1614功能在文献中尚未被刻画出,而深入研究KIAA1614可以加深对新冠肺炎的认识。
另一方面,该成果有望直接用于精准检测新冠病毒。作者表示,相关部门通过血浆和白细胞采样并用文章给出的简易公式可以增加检测的准确性。而且,考虑到区域差别,不同国家或地区可根据本地居民的样本进一步完善和修正文中给出的公式。研究人员也可以应用文中提出的新机器学习模型尝试寻找新的关键基因,或者研究其他已知的与新冠肺炎有关的基因与文中报告的5个关键基因的关联关系,进而进一步提高对新冠病毒的认识。
此外,明确新冠肺炎患者属于哪种亚型,有助对症下药,做到个性化治疗。例如,控制RIPK3 对一个亚型可望达到治疗效果。
相关论文信息:https://doi.org/10.6339/21-JDS1005