「为持续激发人工智能领域广大职工的创新热情和创造潜能,充分发挥广大职工在加快打造发展新质生产力重要阵地中的作用,在北京市总工会指导下,北京物联网智能技术应用协会特开展人工智能领域职工优秀创新成果征集活动。旨在挖掘一批具有创新性、实用性和推广价值的职工优秀创新成果,搭建人工智能领域职工创新成果交流展示平台,促进成果转化与应用,推动人工智能技术与产业深度融合,提升职工创新能力和产业竞争力,助力北京国际科技创新中心建设。现对最终入选的成果通过多渠道系列展示,并开展产业对接。诚邀各界开展合作交流,详情可咨询北物联李老师(联系电话:13521200337)。」
项目名称:大体量工程智能问数与技术分析平台
所属领域:建筑领域
单 位:中铁建工集团有限公司建筑工程研究院
成果完成人:鲍大鑫、严心军、陈一鑫、杨猛、占游云、张胜超、田仲翔
Company Profile
中铁建工集团有限公司建筑工程研究院成立于2018年12月,是围绕主业专门从事建筑工程技术研究与开发的机构,是中铁建工集团科技创新的研发平台,行业前瞻技术和新进领域技术研发主体,围绕“价值创造”开展科技研发活动,服务集团公司核心主业,引领集团公司科技发展,为打造“王牌”工程局赋能核心竞争力。
Introduction to Achievements
大体量工程智能问数与技术分析平台,通过自然语言交互即可直接查询业务数据库,采用人工智能大模型实现AI问数与技术分析,自动生成数据图表与分析报告,大幅降低数据使用门槛。研究包含三维数字人系统、AI问数引擎、专业知识库。

三维数字人系统方面,基于Three.js引擎开发VRM模型驱动框架,设计骨骼驱动优化算法,构建包含面部多个表情参数和全关节旋转向量的动画控制系统。进一步通过多模态交互管道设计,集成声学模型与唇形预测算法,建立情绪-语音-动作的跨模态映射模型,实现语义结论到数字人多维度表达的端到端合成;AI问数引擎方面,构建基于Transformer架构的领域大模型,实现自然语言到结构化查询(NL2SQL)的精准转换,通过Langchain框架动态解析业务数据库,生成包含数据结论、Echarts可视化图表及语义摘要的多模态输出;专业知识库方面,通过Dify框架构建专业知识库,将技术文档通过大语言模型整理为问答形式知识,平台通过API接口调用知识库内容。
(1)三维数字人底座系统

三维数字人底座系统包括表情唇型编辑控制、骨骼编辑控制器、动画编辑与解析管理器以及环境模拟模块,便于对数字人动作库、表情库进行自由拓展。
表情唇型编辑控制,依据数字人基本情绪表达需要,设计开心、伤心、惊讶、生气、放松等表情,通过数值驱动各表情状态。设计“aa”“ee”“ih”“oh”“ou”元音唇形,便于在语音转化为元音属性时,进行唇形控制;骨骼编辑控制器是通过利用Vrm模型中绑定的骨骼,在Three.js环境下遍历主要骨骼,创建几何体关联骨骼旋转、位移参数,通过控制器间接驱动骨骼态势,实现动作编辑,其中头部、手掌及脚踝处设计逆运动学驱动算法,进一步提高动作编辑灵活性;动画编辑与解析管理器是通过上述骨骼动作编辑,基于动画帧编辑器,组合构建为AnimationMixer混合动画;环境模拟模块是通过设计风作用空间向量,附加在头发、衣服等软骨骼组织上,通过数学模拟表达风力变化,模拟风环境效果。
数字人底座系统支持调用市场多类语音识别、TTS服务,集成声学模型与唇形预测算法,建立情绪-语音-动作的跨模态映射模型。在接收到语音时,快速进行语音-文字处理,并对文字内容进行校错,准确把握意图;在接收到后端包含动画、表情、唇形、语音等元素的数据时,按对话条目,有序驱动数字人与音频播放,实现语义结论到数字人多维度表达的端到端合成,从而形成良好的数字人底座系统。该技术依托Vue框架、Three.js开源技术搭建,具备良好的可移植性,可灵活融入于各业务系统。
(2)AI问数引擎
在物联网等数字化技术快速发展的当下,获取数据的能力得到显著增强,感知提升的同时为企业储备了海量数据资源。但迄今为止,大多数的数据资源仍没有得到应有的挖掘、应用,传统模式下通过固定图表、报表的形式,大大限制了数据价值。
AI大模型的迅猛迭代为数据资源的深度挖掘、应用建立了希望,本成果Langchain、NL2SQL、Echarts等技术设计AI数据引擎。通过Langchain框架的SQLDatabaseChain技术将自然语言转化为SQL语句并执行数据查询,结合大语言模型对SQL查询结果进行总结提炼形成语义摘要,针对必要内容转化为Echarts图表格式数据,Echarts图表类型由AI大模型根据数据查询结果自由定义。

(3)专业知识库
本成果为提高技术分析的专业性,通过私有化部署Dify,对相关技术文档进行预处理,通过大模型进行文本分段、清洗,并进行向量化、索引构建和存储,形成知识库。
Dify集成了行业通用大模型平台,满足对文档型技术方案的科学处理。
进一步设计工作流,知识库可以被集成到 Dify 应用中作为上下文,利用Deepseek对知识库进行检索、分析,提出专业性指导意见。
传统模式下通过发布应用,可以通过对话形式获取相关知识。
Innovation of Achievements
基于Three.js的三维数字人提供拟人化、多模态交互界面,使复杂的数据结论和技术分析更直观、易理解,提升体验和沟通效率。
(2)基于NL2SQL、Echarts与LLM的数据灵活分析
通过NL2SQL + Langchain + Echarts等技术建立针对自然语言的“AI问数引擎”,无需技术背景即可实时查询海量业务数据,自动获得图表与摘要,极大提升数据获取效率和决策速度,解决传统报表滞后、僵化痛点。
(3)基于专业知识库的技术分析
The generated effect and before application
(1)产生效果
该成果的核心目的与意义在于解决大型工程领域数据价值挖掘不足与技术分析智能化水平低下的双重挑战,立足以三维数字人的交互方式重构人机交互体验,打破数据应用壁垒,赋能专业分析智能化,推动工程行业数字化转型。
成果不仅解决工程数据“看得见、用不了”的痛点,更通过AI重构了数据分析、知识传递与人机协作方式,为工程行业降本增效与智能化升级提供核心技术支撑。
(2)实际应用效果
在雄安城际站的大体量桩基工程管理应用中,国铁站台投影范围内工程规模约17.3万m2,桩基数量多达5700余根,桩基种类多,工艺流程与作业参数复杂,巨大的数量造成进度、技术管理困难。将工程桩建设方案、相关施工规范与质量控制标准构建为知识图谱,并深度关联大体量桩基进度可视化管理APP施工数据库。针对工程建设的技术、进度等提出的自然语言咨询需求,通过基于AI数字人的可视化数据分析结论、技术分析交互。
通过基于AI数字人的可视化数据分析结论、技术分析交互,赋能高质量桩基工程管理,克服了传统基于文档型资料、固定式数字平台进行分析的效率低下、角度单一等困难。大体量工程智能问数与技术分析平台技术的成功应用,节省人为数据统计、技术资料查询的成本投入,提高工程数据价值,产生间接经济效益约37.2万元。
(3)应用前景
本成果向工程、制造、能源等数据密集型行业,拥有广阔应用前景。
颠覆数据交互方式:通过自然语言“AI问数引擎”,无需技术背景即可实时查询海量业务数据,自动获得图表与摘要,极大提升数据获取效率和决策速度,解决传统报表滞后、僵化痛点。
智能技术分析助手:集成基于Dify构建的领域专业知识库,结合大模型检索分析,为工程师提供精准、专业的技术指导和建议,提升分析质量与规范性。
沉浸式交互体验:基于Three.js的三维数字人提供拟人化、多模态(语音、表情、动作)交互界面,使复杂的数据结论和技术分析更直观、易理解,提升用户体验和沟通效率。
灵活集成与部署:基于Vue、Three.js等技术栈,灵活集成与部署。
|
