2025-04-07 16:06 阅读量:6k+
华人号:科创江苏近日,记者从安徽省量子计算工程研究中心获悉,本源量子、合肥综合性国家科学中心人工智能研究院等机构联合攻关,在中国第三代自主超导量子计算机“本源悟空”真机上,全球首次运行十亿参数AI大模型微调任务。实验结果显示,在参数量减少76%的前提下,训练效果反而提升8.4%。这一成果不仅验证了量子计算助力实现大模型轻量化的可行性,更为破解大模型“算力焦虑”开辟了新路径。
微调是指在通用大模型(如 DeepSeek、Qwen)的基础上,通过进一步训练特定领域数据,使其适应医疗诊断、金融风控等专业场景。传统低秩微调面临性能瓶颈、泛化能力有限等问题,量子计算凭借其叠加态和纠缠态特性可同时探索海量参数组合,可提升大模型微调的效率。
“就好比给经典模型装上了‘量子引擎’,让两者协同发力。”本源量子副总裁窦猛汉表示,团队创新设计了“量子加权张量混合参数微调”,通过量子计算特性实现智能“微调”——将模型权重转化为量子神经网络与张量网络混合架构,前者通过量子门操作提取高维非线性特征,张量网络则压缩参数规模。
在“本源悟空”的量子芯片上,单批次数据可生成数百个量子任务并行处理。实验数据显示,优化后的模型在心理咨询对话数据集(CPsyCountD)上训练损失降低15%,数学推理任务(R1-Distill-SFT)的严格准确率从68%提升至82%。合肥综合性国家科学中心人工智能研究院副研究员陈昭昀补充:“这是量子计算首次‘真机实战’大模型任务,证明现有硬件已能初步支撑大模型微调。”
据介绍,“本源悟空”是目前我国先进的可编程、已交付超导量子计算机,已为全球139个国家超2300万人次提供量子算力云服务,完成35万个量子运算任务,涵盖流体动力学、金融、生物医药等多个行业领域,成功完成全球最大规模的量子计算流体动力学仿真,并接入金融量子云实验平台用于探索金融领域更高效的问题解决方案。
记者 张宣
1、本站(网址:52hrtt.com)为用户提供信息存储空间等服务,用户保证对发布的内容享有著作权或已取得合法授权,不会侵犯任何第三方的合法权益。
2、刊载的文章由平台用户所有权归属原作者,不代表同意原文章作者的观点和立场。
3、因平台信息海量,无法杜绝所有侵权行为,如有侵权烦请联系我们(福建可比信息科技有限公司 邮箱:hrtt@52hrtt.com),以便及时删除。
© 2022 华人头条
服务热线 : 0591-83771172
福建可比信息科技有限公司 ©版权所有
直播备案号 闽ILS备201708250005
举报热线:0591-83771172
举报邮箱:hrtt@52hrtt.com
1、本站(网址:52hrtt.com)为用户提供信息存储空间等服务,用户保证对发布的内容享有著作权或已取得合法授权,不会侵犯任何第三方的合法权益。
2、刊载的文章由平台用户所有权归属原作者,不代表同意原文章作者的观点和立场。
3、因平台信息海量,无法杜绝所有侵权行为,如有侵权烦请联系我们(福建可比信息科技有限公司 邮箱:hrtt@52hrtt.com),以便及时删除。