首页 最新 热门 推荐

  • 首页
  • 最新
  • 热门
  • 推荐

颠覆 LLM?Meta 提出 LCM 这个新范式

  • 25-04-17 01:21
  • 4114
  • 8913
juejin.cn

从 token 到 concept,真正的“范式之争”已经开始了。

大模型热得烫手,ChatGPT、Claude、文心一言、通义千问,一个个跑分、长文、代码都卷出了天际。但你有没有一种感觉:这些模型生成的内容越来越“像人话”,但又不太像“有思想”?

这不是错觉。

原因很简单:LLM 只是学会了如何“预测语言”,却没有真正理解语言背后的“概念”与“世界”。

最近 Meta 推出的 LCM(Large Concept Model),正在试图打破这种局限:从 token 的世界抽身而出,走进真正的“语义空间”。

本篇就来聊聊这个值得被高看一眼的新范式:LCM,并和 LLM 做一场深度对话。

LCM vs LLM:不是替代,而是范式的分叉

“LCM不是来替代LLM的”,两者差异远远不只是处理单位从“token”换成了“concept”这么简单。

  • 一张图理解两者的本质区别:

image.png

LLM 是基于语言的统计建模器:它把我们输入的文字切成一堆 token,预测哪个 token 最有可能出现在当前位置。本质上,是在做概率排序。

LCM 是基于概念的语义建模器:它不处理 token,而是对整个句子进行语义编码,映射到一个高维嵌入空间。然后直接在概念空间中做推理与生成。

换句话说:LLM 是“会说话的鹦鹉” ,模仿说话的风格,但说不出“为什么这样说”; LCM 是“懂你想法的搭子” ,它可能不会每句话都修辞完美,但知道你在想什么,并能接着你的“思路”走。

SONAR:让概念具象化的语义引擎

很多人听完上面那段会问:“那你怎么把抽象的概念表达为计算机可处理的形式?”

这就是 SONAR 的登场时刻。

SONAR 是 LCM 背后的嵌入引擎,整体地编码一句话的语义,将其映射到一个高维空间中。 SONAR嵌入空间

在这个空间里:

  • 语义相近的句子距离更近;
  • 不同语言表达的相同含义,坐标几乎重合;
  • 图像、文本、语音都可以映射到这个统一空间中。

你可以把它理解成是“概念地图”的构建者。

image.png

这也意味着:LCM 可能才是真正意义上的“跨模态”入口。


Base-LCM vs Diffusion-LCM:模型架构决定边界

目前 Meta 提出两种架构:1、Base-LCM:最基础的序列建模器,直接在概念嵌入序列上做下一个嵌入的预测,类似于“概念级别的 GPT”。2、Diffusion-LCM引入了扩散生成模型思想,在语义嵌入空间中进行“加噪”+“去噪”过程,可以生成更加自然、多样的语义输出,更像人类的“联想式表达”。

为什么引入 Diffusion?很简单:

概念不是一刀切的“yes/no”,而是模糊、连续、多义的。 Diffusion 机制模拟了人类思维“逐步清晰”的过程:

image.png

这种方式更容易生成“语义多样性更强”的表达,摆脱 LLM 那种“重复性强、表面流畅”的瓶颈。


LCM 的未来:模型不止是工具,是伙伴

为什么我们要花这么多精力搞清楚 LCM?它能带来什么?

一个很可能的未来是:LLM 做语言接入接口(Prompt 输入、语法结构)、LCM 做语义处理中枢(思想建模、知识链接、推理)。

它不是谁替代谁,而是认知系统中的分工协作。

就像人类大脑:一部分负责语言输出(Broca 区域)、一部分负责抽象概念整合(前额叶皮层);

我们也许正在见证“AI 认知架构”的第一次系统解耦。

LCM 有可能推动 AI 从“语言模仿者”进化成“真实合作者”。

1_OpTgE9r2BVsxFfUIotaxWQ.gif

总结:我们需要的不是“更长的上下文”,而是“更深的理解”

当大家都在卷上下文长度、吞吐速度的时候,LCM 在另一个方向偷偷起飞:

不是再压榨语言结构的极限,而是改写语言结构的底层逻辑。

我们可以不再局限于 token,而直接操控 concept。

如果说 GPT 是写作的工具,那 LCM 可能是下一代的“思想编辑器”。

未来的 AI,也许不再只是回答你的问题,而是和你一起,构建问题的结构本身。


本次分享如上,点赞+收藏 == 学会~你们的鼓励是我持续输出的续航电池🔋✨

加薇 atar24 进日常抽奖群🎁

注:本文转载自juejin.cn的掘金安东尼的文章"https://juejin.cn/post/7493007002832519220"。版权归原作者所有,此博客不拥有其著作权,亦不承担相应法律责任。如有侵权,请联系我们删除。
复制链接
复制链接
相关推荐
发表评论
登录后才能发表评论和回复 注册

/ 登录

评论记录:

未查询到任何数据!
回复评论:

分类栏目

后端 (14832) 前端 (14280) 移动开发 (3760) 编程语言 (3851) Java (3904) Python (3298) 人工智能 (10119) AIGC (2810) 大数据 (3499) 数据库 (3945) 数据结构与算法 (3757) 音视频 (2669) 云原生 (3145) 云平台 (2965) 前沿技术 (2993) 开源 (2160) 小程序 (2860) 运维 (2533) 服务器 (2698) 操作系统 (2325) 硬件开发 (2492) 嵌入式 (2955) 微软技术 (2769) 软件工程 (2056) 测试 (2865) 网络空间安全 (2948) 网络与通信 (2797) 用户体验设计 (2592) 学习和成长 (2593) 搜索 (2744) 开发工具 (7108) 游戏 (2829) HarmonyOS (2935) 区块链 (2782) 数学 (3112) 3C硬件 (2759) 资讯 (2909) Android (4709) iOS (1850) 代码人生 (3043) 阅读 (2841)

热门文章

109
人工智能
关于我们 隐私政策 免责声明 联系我们
Copyright © 2020-2025 蚁人论坛 (iYenn.com) All Rights Reserved.
Scroll to Top