2025-01-30 22:15
华人号:中美邮报【侨网讯】近日,中国人工智能公司深度求索(DeepSeek)发布的大模型DeepSeek-R1震动业界,该模型使用更低的成本和更小的算力规模,实现了足以匹敌美国顶尖AI模型的效果。北京时间1月27日,苹果App Store中国区免费榜显示,近一周全球刷屏的DeepSeek一举登上首位。同时,DeepSeek在美国区苹果App Store免费榜从前一日第六位飙升至第一位。令人惊叹的是,DeepSeek除夕(1月28日)又抛出新模型——Janus-Pro,且文生图测试优于OpenAI。
综合香港文汇报报道,北京时间1月27日早上,中国国产AI Deepseek在中国和美国区苹果App Store免费榜上一路从第六位飙升至第一位。超越ChatGPT及Meta公司旗下的社交媒体平台Threads,Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。DeepSeek现象引发美国各大媒体争相报道。美国媒体的报道称,DeepSeek-R1的出色表现已经给美国科技行业留下深刻印象,其开源模型成为行业关注与分析焦点。
深度求索在1月20日发布了DeepSeek-R1模型,该公司表示,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,其性能比肩美国OpenAI o1正式版。为促进技术社区的充分交流与创新协作,深度求索还公开了DeepSeek-R1训练技术。
28日,DeepSeek又发布开源多模态模型Janus-Pro,其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的DALL-E 3和Stability AI的Stable Diffusion。
英伟达高级研究科学家范麟熙(Jim Fan)称赞DeepSeek取得了突破,他在社交平台X上发文称,DeepSeek-R1完全由强化学习驱动,“这让人想起了AlphaZero,从零开始学习围棋、象棋和国际象棋,而不是先模仿人类大师的动作。”
DeepSeek-R1的表现引起美国科技行业的高度关注。硅谷风险投资家马克·安德森表示:“DeepSeek-R1是我见过的最令人惊叹、最令人印象深刻的突破之一。”
不仅如此,DeepSeek的开发成本和使用的算力规模都远低于美国顶尖AI公司。先前发布的DeepSeek-V3在仅使用2,048颗英伟达H800 GPU的情况下,完成了6,710亿参数模型的训练,成本约为560万美元,这远低于其他顶级模型的训练成本。美媒指出,H800的算力要弱于英伟达H100等芯片,美国限制对华出口此类高性能芯片。
清华大学新闻学院、人工智能学院教授沈阳指出,在开源的推动下,AI技术不再是少数几家技术巨头的专属领地,它开始向更多参与者开放。“这不仅仅是技术和资源的再分配,更在于全球技术创新的全新生态系统的建立。”“也许,未来的AI会更加民主化,更多创意和进步会从全球范围内的无数小型团队和初创公司中诞生,而非少数大型机构的闭门造车。”沈阳表示,开源同样是一剂强心剂,技术共享并非止于代码的开放,它还意味着思想的交汇、智慧的碰撞,开源让全球的研究人员和开发者能够站在一个共同的平台上,快速迭代、快速创新。
1、本站(网址:52hrtt.com)为用户提供信息存储空间等服务,用户保证对发布的内容享有著作权或已取得合法授权,不会侵犯任何第三方的合法权益。
2、刊载的文章由平台用户所有权归属原作者,不代表同意原文章作者的观点和立场。
3、因平台信息海量,无法杜绝所有侵权行为,如有侵权烦请联系我们(福建可比信息科技有限公司 邮箱:hrtt@52hrtt.com),以便及时删除。
© 2022 华人头条
服务热线 : 0591-83771172
福建可比信息科技有限公司 ©版权所有
直播备案号 闽ILS备201708250005
举报热线:0591-83771172
举报邮箱:hrtt@52hrtt.com
1、本站(网址:52hrtt.com)为用户提供信息存储空间等服务,用户保证对发布的内容享有著作权或已取得合法授权,不会侵犯任何第三方的合法权益。
2、刊载的文章由平台用户所有权归属原作者,不代表同意原文章作者的观点和立场。
3、因平台信息海量,无法杜绝所有侵权行为,如有侵权烦请联系我们(福建可比信息科技有限公司 邮箱:hrtt@52hrtt.com),以便及时删除。