数字政府典型案例之六 | 构建“甬数宝”智慧统计大模型,赋能统计生产服务全流程
来源:宁波市数据局
近年来,宁波市深入推进数字政府建设,在经济调节数字化、市场监管数字化、社会治理数字化、公共服务数字化、生态环保数字化、数字机关建设、数据资源体系建设等方面工作中,涌现出一批具有代表性的场景案例,集中反映了我市数字政府建设的实践和成效。
构建“甬数宝”智慧统计大模型,赋能统计生产服务全流程
“甬数宝”智慧统计大模型是基于基础大语言模型和统计数据资源构建的统计领域垂直应用。目前“甬数宝”融合数据、算力、算法三要素,运用自然语言处理和向量检索等AI技术,已基本实现智慧查数、智慧问答、智慧分析和智慧办公四项核心功能,建立起集经济指标查询、统计知识问答、数据挖掘分析于一体的智慧统计服务体系,助力解决统计劳动生产率偏低、专业数据应用门槛高等工作堵点,全面赋能统计核心业务,助力统计服务质效提升。
图1 “甬数宝”主界面
一是汇聚海量语料,构建多源数据底座。通过集成2017年至今的本地综合数据库、5000余条省局统计大脑问答、2000余篇专业领域统计分析报告以及统计法规、制度、五经普等知识图谱,建立涵盖统计领域多维度、多层次资源的大型语料库,为大模型的智能化数据处理奠定扎实基础。
二是增强知识训练,定制统计垂直模型。基于千亿参数级基础大模型,针对海量统计语料库进行检索增强与多轮微调,形成高度专业化的统计领域大模型。借助多模型协同决策和高维语义向量技术,完成对统计问题的高效识别与精准应答。目前,已实现对宏观经济、金融、社会等8大专业领域数据的系统化学习与调用,涵盖约2TB的统计文本资源、500万条核心经济与社会指标、80万条自然语言指令及SQL样例。
三是集成多样场景,赋能统计生产服务。创新修复通用大模型“过度自信”问题,精准匹配统计语境和业务需求,支持近2000个综合统计指标、五大类万余条知识问答的便捷查询,自主输出多个专业领域的专题报告,灵活调用百余个业务指令,满足不同层级服务对象对统计信息的多元需求,大幅提升统计生产服务质效。
图2 智慧查数模块
(案例单位:宁波市统计局)