2025-04-01 02:13 阅读量:2.1万+
华人号:华人头条-贵州人类要通往AGI,该走哪条路?
即便是在采用开源、为AI推理带来一条新路径的DeepSeek爆火后,对于这一问题,答案仍然是多样的。
2024年末,全球新一轮AI热潮到来之前,《中国企业报》与蔻町智能CTO陈秋武有了一次深度对话。
对话里,陈秋武反复提及技术在AI革命中不可撼动的位置,“如果通往AGI的道路有很多条,那Coding是最适合的一条。如果只有一条路径,那Coding就是唯一的一条。”
这位曾供职于微软、百度等前沿互联网公司的资深算法工程师,在2024年初投身AI Coding的创业浪潮。与曾在投资领域有丰富经验的合伙人宿文,搭建起一支30余人的团队,从自研模型开始,最终实现“人人都有个性化应用”的愿景。
比起涵盖全人类的宏大愿景,这家取名为蔻町智能(AIGCode)显得“小”得多。北京量子银座大厦,在一众创业公司里,只有一小块简陋的logo牌作为公司标识。没有专属的会议室,也没有传统互联网公司标志性的茶水间,团队成员“接踵”办公,随时可以开启技术对话。
在陈秋武看来,这是不同于大厂,属于初创公司独有的技术氛围。狂飙两年半后,大模型分水岭已现,一部分留在牌桌上的大模型公司开始转向应用端,而他和团队则代表了一小部分技术派,坚持摸索出性能更优的模型。
这是一条非共识道路,尤其是在“开源盛世”的当下。陈秋武认为,要创造增量价值,仅靠现有的资源拼凑是远远不够的。在更长远的周期里,拥有0-1的创新技术突破能力才是一家大模型公司最为核心的竞争力。
当然,选择走小众路线的另一重原因是,无论是在市场,还是行业,大模型行业需要一个新故事。原本以“六小虎”为主的大模型赛道,无论在资金或商业模式上,新入局者都难现惊喜。
《中国企业报》:今年,DeepSeek带头开启了开源潮,大模型也进入“开源盛世”,自研底座模型的必要性在哪儿?
陈秋武:现在的大模型无非两条路,要么“暴力出奇迹”,把高质量的样本堆砌,要么拼算力。
大模型已经发展了两年,从整个发展进程来看,它的发展还在婴儿阶段,尚未到成熟期,难以完成商业应用闭环的构建。
具体商业可用性一直没被解决,商业闭环所需要的可用性是没有达到的。
为什么我们要反向去做模型的原因是模型侧提供技术水位不够,就像莱特兄弟的飞机最高6米,最长举例260米,无法商用一样。
一方面,高质量的样本目前产生速度完全跟不上算力的增长速度;另一方面就是困扰大模型行业很久的算力瓶颈问题。
不做模型很难解决增量问题。现在很多能拿资源凑起来的产品,在我看来都是没有增量价值的。
我们核心逻辑是,模型三因素(网络结构、样本、算力)既然算力增长不了,高质量样本增长慢,那就通过网络结构提升学习效率,把技术模型做扎实,确保最终的产品效果是能够为用户带来真正意义上的增量价值。
《中国企业报》:你把现阶段模型发展定义为婴儿阶段,这一阶段的模型有哪些问题?
陈秋武:这一阶段,行业里的分化现象很明显。最大规模的资金投资、人才密度、资源跟探索积累的力量,但因为技术上暂不能支撑落地,所以两年的时间里面并没有一个非常成熟的产品形态。
大模型光靠堆砌资本是远远不够的,不做预训练,很难做出好的产品。比如以Transformer 为架构的模型会出现对高难度、长尾、大量专业的样本,只是记住了概率位置,但其知识难以被模型学到。
如果把模型训练类比爬一座高度600米的山,没做过预训练的人在60米的时候会觉得吃力,就上不去了。再往上,到半山的时候,会涉及到技能、算法优化等高壁垒的事情,没有专业知识积累的那部分人和团队就会掉队。
AI代码编辑器Cursor多年未火但随着Claude3.5走红就证明了模型效果基座能力的好坏,决定了应用能力。
《中国企业报》:同样是在Coding赛道,你们跟Cursor的定位一样吗?
陈秋武:我们不像Cursor纯做产品,也不像OpenAI一样纯做模型,我们有点像是把发动机或者核心的技术预训练、生成式软件架构到产品应用,全链路打通的公司。
《中国企业报》:可能在你们仍在训练模型的阶段,已经有公司开始在应用层发力,并且实现了商业化。
陈秋武:各家都想商业化。国内在模型供给能力不行的公司,会想去做应用,用套壳的方式就让大家看到,赚一波快钱,套壳没有任何技术壁垒的,能短暂在红海里马上变现。
2023年,GitHub Copilot有3亿美元的收入,紧接着Cursor等企业陆续火了,硅谷的融资也都是以亿美元为单位,大家就觉得看到了一些商机。但实际上,Cursor也是历经模型迭代之后,用户才买单的,说明现在的应用是对模型侧基座能力的传导。
《中国企业报》:通常来看,代码更多是程序员的赛道,为什么要瞄准非技术背景、不会编程的用户群?
陈秋武:每一个人都有个性化应用的需求,但当一个程序员还是有门槛的。
我们经过调研发现,大量的用户个性化需求没有在通用应用上得到满足,现有的软件供给能力难以覆盖整体多样化的需求。
即便现在有定制化服务,除了成本高昂、效率不高之外,这类服务还很难精准满足个性化的需求。
这一块还有比较大的市场空间,大模型或许能够释放这其中一部分的供给效率。每一个具备明确软件需求的用户都能是“产品经理”。从技术的必然趋势来看,最终绝大部分的服务都可以被软件化。
Websim之所以火,一部分原因就是它展示了personal app的可能性,不过它是做前端部分,我们是把数据库、后端交互逻辑、架构、模型效果等全链路基本上打通了。
《中国企业报》:既做模型,又做产品,对于一家创业公司来说,这能同时实现吗?
陈秋武:我们会有自己的节奏,预训练的基座能力效果变好了,马上把它传递到产品效果,这跟其他像“六小虎”之类的大模型公司的follower角度会有所不同,专家解耦的大模型新网络架构为这个链路转化效率极大提升提供的完全不同解决方案。
本质上,我们是希望去定义Next Thing,明确我们整个大模型时代的下一步需要什么,才能在拆分清晰的未来赛道里,更快人一步。
目前这个领域相对比较新,我们也在不断的思考和探索。我们认为当前大模型赛道,在cursor、websim这些当红公司出来之后,L2 赛道已经是红海,作为初创公司,竞争优势不明显。与其花时间、精力挑战别人,还不如去尝试大家都没有挑战过的L3。
通用应用的个性化需求是长期被压抑的情况下,一旦软件服务供给能力跟上,这部分需求是能够井喷的,是蓝海。
第一阶段是GPU算力对应的token成本,第二阶段是典型原子功能完善后仅剩的业务翻译token成本。我们希望提供一款产品,可以让所有代码的生成边际成本几乎为零,让个性化应用的市场打开。让每个个体都能自己实现创建个性化应用,甚至用后即焚。
我们绕开IDE生态,直接在外部端到端地做交付,但是目前模型能力不够,所以得做模型。我们也跟LLama(3.1-405B)、Mixtral(8x22B)、 DeepSeek(V2)、 Qwen(2.5 72B)几款全球主流的模型做过对比,在参数量相差 10 倍以上的情况下,AIGCode 7B 的小模型在全球公认的七大核心任务上取得了四项第一的成绩。
《中国企业报》:当“Personal App is the End”的愿景实现后,对于整个软件行业来说意味着什么?尤其是程序员群体。
陈秋武:会改变现有的软件生产模式。智能编程最终会把一部分没有核心差异化技术能力的程序员替代掉,或者说,把程序员在很大一部分场景里替代掉。
我觉得代码应该端到端地去做生成,为用户把使用门槛大幅度降低,让大家变成能够提需求,就实现效果的人,每个人都可以是产品经理。
《中国企业报》:你在微软、腾讯这些大厂都有过丰富的工作经历,大厂最近在大模型领域也是加足马力,这种情况下,创业公司要走出来会变得更难吗?
陈秋武:初创公司和大厂比起来,要更灵活。独特的创新力,就是创业公司的突围路径之一。
大厂的人才密度、资金的确优于创业公司,但大模型时代处于幼童期,并不需要堆人才资源。从历史进程来看,变革式创新的时候往往由一两个人决定的,人才的密度让位于创新力才是核心技术突破的进步。
大厂工作流程上有其局限性。比如,遇到问题时,经常会着急地推动和迅速纠正,长此以往,团队自驱优化的核心动能就会受到剥夺,对于一支技术团队的创新力而言,自驱力是创新力的关键因素。而其决策的结果,往往最具备创新能力的人,是很难与掌握决策权的保持高度一致的,往往背道而驰。
《中国企业报》:互联网时代诞生了很多家至今都很巨头的公司,大模型时代所产生的巨头规模会远超互联网阶段吗?
陈秋武:我预判是更大的。核心原因在从闭环上的生产要素来看,大模型更多、更丰富而且更重要。
互联网时代做的是供求关系的链接,比如导航、搜索、推荐,用户获取内容的成本急剧下降,内容流转、供求链接的效率得到提升。
但是大模型时代有一个特点,比如图像、视频、文本等内容,大模型快速生成是没问题的,只是现阶段可能质量上会有参差。
但一旦代码、文本、视频到图像到软件服务都能生成满足商业化质量需求的时候,能串连起内容侧或者服务侧的供给,且接近零成本,而传统的供给方式是人工供给的。这背后的生产力体量,完全不是一个量级。
《中国企业报》:你觉得,目前在通往AGI的道路上,大家的方向是一致的吗?
陈秋武:AGI的核心表达是大模型能不能类人,它是用另一种方式定义提升我们的智商水平。
现在有一些模型更接近“文科生”,我认为是现在很多大模型的学习机制出了问题,以“文科生”产品为例,会发现有些越细节越专业的问题大模型回答得很不好,缺了人智商水平很重要的归纳、推演、总结,并且沉淀成型的方法论。
还有些观点认为大模型天然就不适合数理化,但我认为是学习机制的问题,如果学习机制没问题的话,只要样本形式稍微做一些变化就可以很好的系统学到这些知识。
《中国企业报》:很好的归纳推演总结能力,还需要把期待值给到ChatGPT5吗?
陈秋武:我原来从定义上给AGI智商水平设计了五层逻辑,第一层就是最简单的记忆能力;第二层是对知识点的理解、组织能力;第三层是分析能力以及对不同类型逻辑的理解能力;第四层是理解不同体系的能力,比如理解一套软件、一个系统接口、一门学科等。更深的层次就是像人一样,在学到东西之后,自我革新并形成一套自己的逻辑方法论,建立自学习机制。
目前第二层都没有得到很好的解决,第三层的推理能力进展方面也不是特别理想。OpenAI的o1就没有核心突破。
所以我对ChatGPT5的突破性蛮悲观的。如果预训练是“学”的能力, o1只带来了“用”方面的小部分微创新,核心的逻辑就是提高回答频次,中间只要设置合理的校验机制,下一步的决策空间就变小了。这能叫“推理”?为什么再推一次就不对了呢?因为它不是推理,还是概率,选中概率大的难度变小了,自然正确率就上去了。
ChatGPT5一定会比之前的都要好,但好的有限,因为技术上“学”的效率机制与“用”的真推理这两个核心难题都没看到有被解决的苗头。
《中国企业报》:你怎么评价DeepSeek?
陈秋武:DeepSeek是真正在做事情的团队,是技术流,基建能力强。但我们认为,模型的网络架构而非基建方面的技术创新,我相信我们走的更超前一些,作为基模,他们只做了代码补全,我们跟他们的产品定位形态不一样,不在一个赛道上,当然在基模上,我们是竞对。
《中国企业报》:在你的设想里,大模型时代的 Killer App未来形态可能是什么样的?
陈秋武:AI Coding的终局是为了生成任意应用。Killer App形态与端有关,它不是以APP的形式存在的,而是以足够聪明的超级智能体存在,或者说下个时代,通用APP的入口,会变成超级智能,之前moonshot、豆包、混元等的投流大部分打水漂就能看出。典型的不懂大模型时代入口迁移效应和逻辑的时代眼泪。
Killer App最终会在什么载体上存在暂时没办法准确勾勒,但它的底层一定是有超级智能的支持,这是未来每一家在奔赴在AGI道路上的公司最内核的东西。
《中国企业报》:怎么定义大模型时代的下一个十年?
陈秋武:互联网上一个十年,主要是供需链接平台及跑马圈地,大家追求短平快地超速发展。但现在野蛮生长的时代不再,下一个十年,任何一家公司要寻求增量,就需要有突破技术壁垒的核心能力,并打通技术、产品、商业全链路的闭环。
作者:邱慧
1、本站(网址:52hrtt.com)为用户提供信息存储空间等服务,用户保证对发布的内容享有著作权或已取得合法授权,不会侵犯任何第三方的合法权益。
2、刊载的文章由平台用户所有权归属原作者,不代表同意原文章作者的观点和立场。
3、因平台信息海量,无法杜绝所有侵权行为,如有侵权烦请联系我们(福建可比信息科技有限公司 邮箱:hrtt@52hrtt.com),以便及时删除。
© 2022 华人头条
服务热线 : 0591-83771172
福建可比信息科技有限公司 ©版权所有
直播备案号 闽ILS备201708250005
举报热线:0591-83771172
举报邮箱:hrtt@52hrtt.com
1、本站(网址:52hrtt.com)为用户提供信息存储空间等服务,用户保证对发布的内容享有著作权或已取得合法授权,不会侵犯任何第三方的合法权益。
2、刊载的文章由平台用户所有权归属原作者,不代表同意原文章作者的观点和立场。
3、因平台信息海量,无法杜绝所有侵权行为,如有侵权烦请联系我们(福建可比信息科技有限公司 邮箱:hrtt@52hrtt.com),以便及时删除。