科研成果

Journal of Big Data | 袁志明/夏菡团队构建AI驱动的全球虫媒病毒领域知识-数据图谱


随着全球化、气候变化城市化进程的加速,虫媒病毒(arbovirus)对全球公共卫生的威胁持续升级。面对相关科研文献数量的持续增长研究者亟需智能化工具,实现对全球虫媒病毒研究领域的现状与趋势的实时动态追踪与洞察

2025924日,高致病性病毒与生物安全全国重点实验室/中国科学院武汉病毒研究所袁志明/夏菡团队联合广州海关技术中心、浙大城市学院等机构在国际学术期刊Journal of Big Data发表题为“AI-Driven Knowledge-Data Graph for Tracking Global Arbovirus Research”(AI驱动的全球虫媒病毒领域知识-数据图谱的研究论文。

该研究通过人工智能(AI)与人类专家的协同范式,开发了虫媒病毒领域专用大语言模型ArboBERT,对PubMed收录的7万余篇(1944-2024年)虫媒病毒文献进行高效率系统分类与深度解析构建全球虫媒病毒知识-数据图谱(图1A)图谱采用层级化架构,系统地整合了虫媒病毒研究领域框架细分主题及关联文献体系(图1B)。基于大语言模型技术优势,实现对病毒种类关联疾病、研究机构/学者时空地理分布等核心知识实体的精准识别与提取图1C),并将结构化的主题框架、文献内容与领域专业概念深度融合构建的知识-数据图谱支持科研合作网络、时间演进轨迹及地理分布态势等多维视角分析实现对全球虫媒病毒研究格局的时空模式解析。这一成果将为学界提供知识获取效率提升潜在合作者识别等智能化研究支持以及定位研究空白领域、发掘跨学科创新机遇数据驱动的问题发现。 

    浙大城市学院明朝燕副教授、武汉病毒所助理研究员黄英为论文共同第一作者,武汉病毒所夏菡青年研究员和广州海关技术中心师永霞主任医师为论文共同通讯作者,武汉病毒所袁志明研究员广州海关技术中心黄吉城主任医师等为该项研究的合作作者该研究得到国家重点研发计划等项目的资助。

图1. AI驱动的虫媒病毒知识-数据图谱。(A) 图谱构建流程; (B)研究主题分类;(C)研究主题、研究机构与学者发文量可视化分析。



文章链接:https://journalofbigdata.springeropen.com/articles/10.1186/s40537-025-01256-w