为了支持中国HIV 传播网络、耐药检测/监测研究,实现快速、准确预测流行趋势,支持基于分子水平的HIV精准防控。中国疾病预防控制中心性病艾滋病预防控制中心、中国科学院微生物研究所国家微生物科学数据中心和军事科学院军事医学研究院微生物流行病研究所联合开发了“中国艾滋病病毒基因序列数据平台” (https://nmdc.cn/hiv/),为我国HIV研究和防控提供了一个集数据整合、多元分析和预测预警为一体的标准化的数据平台。
新平台助力中国HIV研究
平台整合了国内外公共HIV基因序列数据,开发了HIV分子网络、序列数据质控工具和分型工具,实现了在线一键分析的流程。同时,该平台还对HIV不同株型的全球分布、各大洲和国家的流行株特征和耐药突变位点进行深入分析,解析了基于全球真实数据的HIV传播规律和流行趋势。

重要价值
—收录HIV全长序列(≥ 7,000 bp)26,900条;片段序列(< 7000 bp)1,017,641条,其中86,925条是中国来源的数据。形成了一个最为完整且更新及时的参考数据库,有效支持了来自于中国序列的准确分型鉴定。
—建立了结合临床医学、基因组学和流行病学内容的HIV基因序列数据标准化采集平台,为中国HIV序列数据存储和使用提供保障。
—绘制了HIV-1病毒在中国和全球尺度上的时空分布图谱,揭示了不同亚型的地区特征和流行趋势。
—开发了方便易用的HIV核酸序列的质量控制工具、HIV基因分型和包括“HIV Trace”和“Cluster Picker”两种方法的分子网络分析工具。
平台主要功能和用户界面
数据提交
在数据提交模块,平台面向所有用户开放了个人数据提交和管理系统,允许用户上传、编辑、提交、查看和在线分析个人数据。平台提供标准化数据填写模板的下载和上传功能,实现线下填写,方便多样本或序列的信息录入。此外平台还自动进行数据质控,并将结果表格返回给用户。最重要的是提交后的数据可以用于在SCI或国内期刊的文章发表。

HIV序列质量控制
在输入框直接输入或上传fasta格式序列,即可一键生成变异位点文件,并自动判断查询序列是否发生超突变,并计算序列的移码框数、终止密码子。

HIV 序列分型
由于HIV病毒具有高复制率、高突变率,以及特有的重组机制,目前已检测到超过120个型别/重组型,而这其中的多个亚型则具有显著的地域特征或者传播途径特征。平台利用自建的数据库,整合进化树和相似性比对方法,实现在线准确的序列分型功能。

HIV 分子网络
由于HIV特殊的传播途径和序列特征,分子网络在了解HIV传播模式,准确判断潜在传播并确定活跃传播网络、引导针对高风险传染源的精准干预方面的应用越来越广泛。平台实现了基于基因距离的HIVTrace和基于系统进化树的Cluster Picker两种方法的流程整合,用户仅需要按照提示输入并上传序列文件和对应的元数据文件和运算参数,即可一键生成分子网络。

HIV时空分布图谱展示
利用完整的参考数据,结合序列信息、分型信息、基因序列和全球7大洲的样本收集时间和采样国家进行统计学分析,平台完成了HIV-1中国和全球的时空分布图谱绘制和在线可视化展示。HIV-1的时空分布图谱用来说明在中国和全球尺度上,不同亚型的地区特征和流行趋势。

突变和耐药位点分析
平台将所有HIV-1数据用自主开发突变位点比对流程进行了分析。总结了全球所有HIV数据的突变位点,按不同酶区分类为:蛋白酶区99个(包括2,456个突变型)、逆转录酶区560个(包括13,938个突变型)、整合酶区288个(包括7,115个突变型)。进一步将有突变的位点,与斯坦福HIV耐药数据库中的耐药位点进行了比对,明确了耐药位点的时空分布和发展趋势数据,为后续的耐药位点的进化与传播研究提供了重要数据支持。

2023年8月,中国科学院微生物研究所国家微生物科学数据中心、中国疾病预防控制中心性病艾滋病预防控制中心和军事科学院军事医学研究院微生物流行病研究所团队联合发表了题为“中国艾滋病毒基因序列数据管理及分析系统研究”的文章。

(冯毅 中国疾控艾防中心)
本篇文章来源于微信公众号: 中国疾控艾防中心