华人号

登录更多 下载App

DeepSeek创始人回乡过年

2025-02-03 23:15 阅读量:4k+

华人号:豫商头条

近期,成立仅一年多的中国初创企业DeepSeek,凭借高性价比的大语言模型、独特的开源创新举措以及令人瞩目的市场表现,火得一塌糊涂。

就在1月27日,DeepSeek在苹果App Store的中国区和美国区免费榜中分别攀升至第一位。

不仅超越了ChatGPT、Threads、Google Gemini、Microsoft Copilot等国际巨头,还被海外称为“来自东方的神秘力量”。

这一消息再次震动了全球AI圈,也让人们纷纷聚焦于这个来自中国的AI创新力量。

在此背景下,DeepSeek的创始人梁文锋因为春节回老家过年,成为了话题焦点。

家乡人纷纷张贴横幅,欢迎他荣归故里,以庆祝他的成就。周围的游客也慕名而来,拍照留念。

梁文锋的成功不仅是个人的胜利,也象征着中国AI产业的崛起与突破。

从吴川到全球舞台

过往藏着成功的秘密

“高性价比”的DeepSeek在海外强势出圈,让家乡人开始关注到梁文锋。

此次回乡过年,梁文锋便受到了父老乡亲的热烈欢迎。村里挂起了写满溢美之词的横幅,像“热烈欢迎文锋荣归故里,家乡因你而骄傲!”等等。

就连办婚礼才用的双喜拱门也被拿来做宣传:“文锋回乡传佳绩,乡村振兴添动力”。

●图源:只是@CEO来信

梁文锋于除夕当日回到米历岭村过年,大年初一上午离开。

而梁文锋的成功从其成长轨迹就可窥见一斑。

梁文锋是广东湛江吴川人,成长于普通家庭,父母都是小学语文老师。

他自小便展现出了卓越的数学天赋,据同学回忆:早在初中他就已经学完了高中数学,甚至开始学习大学数学;比较内向,过年过节回家一般也不怎么出门。

2002年梁文锋考入浙江大学的电子信息工程专业,之后取得信息与电子工程学系本科和硕士学位,这为日后的创新发展打下了坚实的基础。

梁文锋在浙大期间便展示了超前的思维,他专注于前沿科技,并在实践中开始组建AI团队,探索理论与实践的结合。

他“超前”的思维也因此不被当时的同学所理解。

●图源:新闻联播

梁文锋创业初期并未直接进入大模型领域,而是通过量化交易的成功积累财富,进一步投资发展AI技术。

他的创业理念是自给自足,依靠积累的财富推进技术研发,不依赖外部资本,从而避免了过早商业化的压力。

DeepSeek成长史

从创立到创新突破

2023年7月17日,DeepSeek(杭州深度求索人工智能基础技术研究有限公司)在梁文锋的带领下正式成立。

作为一家专注于大语言模型(LLM)和人工智能技术的创新型科技公司,DeepSeek一开始便承载了突破传统科技界限的使命。

●图源:小红书@井兀晨曦

公司成立后的短短几个月里,梁文锋和他的团队便凭借着强大的技术创新和卓越的执行力,迅速取得了阶段性成果。

2023年11月2日,DeepSeek发布了首个开源代码大模型——DeepSeek Coder,支持多种编程语言的代码生成、调试和数据分析任务。

DeepSeek的这一举措,不仅大大降低了AI技术的门槛,也让全球开发者能够自由地使用、修改、开发基于DeepSeek模型的应用。此举为DeepSeek赢得了广泛的关注和认可。

2023年11月29日,DeepSeek推出了参数规模达670亿的通用大模型——DeepSeek LLM,包括7B和67B的base及chat版本。

2024年5月7日,DeepSeek发布第二代开源混合专家(MoE)模型——DeepSeek-V2,总参数达 2360 亿,推理成本降至每百万token仅1元人民币。

2024年12月26日,DeepSeek正式发布了新一代基于混合专家(MoE)架构的大型语言模型——DeepSeek-V3。

经海外专业人士比较得出结论:DeepSeek-V3与GPT-4o不相上下。

其总参数达6710亿,采用创新的MoE架构和FP8混合精度训练,训练成本仅为557.6万美元,远低于同类竞争对手的数亿美元成本。

在聊天机器人竞技场(Chatbot Arena)上排名第七,在开源模型中排名第一,复杂问题、代码领域表现排名全球前三,是全球性价比最高的大模型。

DeepSeek突破性的“降本增效”,迅速吸引了全球AI技术领域的目光,并被誉为2024年度开源大语言模型领域的最大黑马。

DeepSeek凭借着极低的训练成本和极高的计算效率,已经成为AI技术竞争的一个重要风向标。

近期的DeepSeek

挑战与机遇并存

2024年底,DeepSeek在全球AI技术领域迎来了更多挑战与机遇。

虽然DeepSeek-V3模型的发布让其在全球市场中大放异彩,但公司依然面临着来自各方的竞争与挑战。

尤其是在美国,DeepSeek的成功引发了AI行业的震动,也激起了美国科技巨头的焦虑。

2025年1月,DeepSeek-R1模型的发布进一步打破了行业格局。

●图源:小红书@夕夕

这一模型在数学推理、编程任务等方面展现了与OpenAI的ChatGPT o1模型相媲美的性能,558万美元的‌训练成本,仅占GPT-4o的约1/20‌12,同样震撼人心。

DeepSeek-R1的发布震惊了美国硅谷,成为了全球AI领域的一个重要里程碑,也让DeepSeek在全球市场的影响力急剧上升。

1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,同时在中国区也占据首位。而英伟达股价下跌接近十七个点。

然而DeepSeek的崛起,也伴随着来自各方的压力与挑战。

在1月27日,DeepSeek遭遇了来自黑客的恶意攻击,导致公司服务一度中断。

尽管DeepSeek在短时间内恢复了服务,但这一事件引发了广泛的讨论,关于开源技术的安全性和防护能力的问题也开始成为业界关注的焦点。

●图源:小红书@鱼小圈

1月28日DeepSeek官网连续发布两条公告,声称线上服务受到大规模恶意攻击。

奇安信安全专家称DeepSeek受到的网络攻击IP地址都来自美国,而华为和360分别伸出援助之手。

此外,DeepSeek还面临着竞争对手的强力反击,尤其是来自OpenAI、Google等全球科技巨头的挑战。

尽管如此,DeepSeek依然以其创新的技术和出色的性价比,稳步推进着全球AI市场的布局。

梁文锋也在公开场合表示,技术的不断迭代和开源的理念将是DeepSeek持续领先的关键。

写在结尾

截至目前,海外对DeepSeek使用了包括直接下达禁令、进行安全调查、黑客攻击、舆论抹黑、法律手段和技术封锁等多种手段进行打压。

这些手段旨在遏制DeepSeek的发展,维护美国在AI领域的霸权地位。

而DeepSeek的阶段性成功,标志着中国在人工智能技术领域逐渐超越了传统的技术“跟随者”角色,进入了“创新引领者”的行列。

随着DeepSeek不断深化技术创新和开源合作,未来的AI世界或许将更加开放与平等。

而中国的AI领域,虽任重道远,但未来可期。

以上就是小编为您分享《DeepSeek创始人回乡过年》的全部内容,更多有关全球华人最新消息、新闻,请多多关注华人头条频道。您还可以下载我们的手机APP,每天个性化推荐你想要看的华人资讯!
免责申明

1、本站(网址:52hrtt.com)为用户提供信息存储空间等服务,用户保证对发布的内容享有著作权或已取得合法授权,不会侵犯任何第三方的合法权益。

2、刊载的文章由平台用户所有权归属原作者,不代表同意原文章作者的观点和立场。

3、因平台信息海量,无法杜绝所有侵权行为,如有侵权烦请联系我们(福建可比信息科技有限公司 邮箱:hrtt@52hrtt.com),以便及时删除。

举报收藏
评论 (0条)
您需要登录后才能评论,点击此处进行登录。
登录后评论

下载华人头条

关于我们

© 2022 华人头条

服务热线 : 0591-83771172

福建可比信息科技有限公司 ©版权所有

ICP许可证号 闽ICP备10203582号

闽公网安备35010202000536号

直播备案号 闽ILS备201708250005

举报热线:0591-83771172

举报邮箱:hrtt@52hrtt.com

免责声明

1、本站(网址:52hrtt.com)为用户提供信息存储空间等服务,用户保证对发布的内容享有著作权或已取得合法授权,不会侵犯任何第三方的合法权益。
2、刊载的文章由平台用户所有权归属原作者,不代表同意原文章作者的观点和立场。
3、因平台信息海量,无法杜绝所有侵权行为,如有侵权烦请联系我们(福建可比信息科技有限公司 邮箱:hrtt@52hrtt.com),以便及时删除。