从能帮你预订机票、规划旅行的私人助理,到能自动编写、调试代码的程序员搭档,AI智能体的浪潮正汹涌而来。目前,构建这些智能体的主流方式,几乎都是把一个超大规模的语言模型(LLM),比如GPT-4,作为智能体的大脑。我们似乎都默认了一个逻辑:大脑越强,智能体就越聪明。
最近,来自英伟达和佐治亚理工学院的研究人员发表了一篇论文《小型语言模型是智能体AI的未来》(Small Language Models are the Future of Agentic AI)。他们大胆断言:当前以LLM为中心的智能体构建方式,不仅成本高昂、效率低下,而且可能根本不是未来的方向
一句话结论:在大多数实际的 Agent 场景里,小语言模型(SLM)已经足够强、更好管、更省钱。真正需要“谈笑风生、上天入地”时,再把LLM当备用核反应堆拉出来用——默认用小、必要时用大,才是更健康的工程范式
SLM(小语言模型):能在常见消费级设备上本地推理,并且延迟对单用户来说是可接受的。作者给出刻度是:<10B 参数基本可算小。(对应的,LLM就是不满足这些条件的一类)
更有意思的是:推理时增强(test-time compute)、自一致、Verifier 反馈、工具增强等拼装术,在小模型上更划算。换句话说,参数规模 ≠ 能力上限,尤其当你允许在推理时多跑几步/多投几票时
这类活儿最怕有时灵光、有时走神。SLM 更容易做成只会这一招、但永远不走样的专家,把格式、风格、约束写进后训练/微调,稳定性就上来了
Agent 的每一次工具/模型调用,本来就有指令模板和效果标签。加个安全合规的埋点 Logger,自然长出高质量专科数据,你就能持续把 LLM 的接口蒸馏/迁移成更便宜的 SLM
3.任务聚类:对调用与动作做无监督聚类,找出重复性高的候选子任务(意图识别、结构化抽取、某类文档摘要、特定工具的函数调用、代码片段生成等)
以上,谢谢你看我的文章。觉得还不错的话,点个赞/在看/转发就更好了~想第一时间收到更新,记得给我加个?星标。~我们,下次再见
扒灰小调公媳干仗艳丽是谁唱的此外,紧急情况下我们强调:奥斯曼-登贝莱与卢卡斯-埃尔南德斯两位球员目前受伤但仍被征召并留队的状况,需要紧急且负责任的决定。联邦医疗团队已如常收到巴黎圣日耳曼医疗团队清晰完整传输的所有相关临床及影像学资料。我们认为这些数据应引致对其状态的客观共商重估,以确保其身体完整性得到尊重。这两年,在银行工作的唐筱晓不得不频繁地和贷款逾期的客户拉扯,“电话不接,消息不回,也没什么其他好的办法,但上级又一遍遍催我把钱拿回来”。她告诉深一度,每天做着重复性的工作,还要拼命卷绩效、卷加班、卷关系,让她感到非常内耗。扒灰小调公媳干仗艳丽是谁唱的宝宝下面湿透了还嘴硬的原因从“尊重时间”到“严控考勤”,从“精简会议”到“审批邮件”,这弯转得也太急了点,高层的理念与中层的执行,展示出了令人惊讶的背道而驰。在周四比利时6-0大胜列支敦士登的比赛中,德布劳内依旧表现出色,并攻入一球,用实际表现证明自己仍是球队不可或缺的核心。
20250923 ?? 扒灰小调公媳干仗艳丽是谁唱的世预赛西班牙3-0大胜保加利亚一役,亚马尔在第79分钟被换下,原因是腰背部轻伤。西班牙队医估计,亚马尔问题不大,能继续出战。不过,巴萨方面不希望亚马尔冒险。过去2年,亚马尔作为巴萨、西班牙绝对主力,赛事任务繁重,一直没有得到轮换休息。y31成色好的y31在一个尚无稳定收入,甚至没有成熟产品的产业早期,传统的估值模型(PS、PE)完全失效。投资人形机器人零部件更像是一场豪赌。那么,PE机构是如何构建自己的估值模型,并平衡高估值与高风险的?
? 马晓炜记者 孙秀峰 摄
20250923 ? 扒灰小调公媳干仗艳丽是谁唱的其次是在系统交互方面,华为 Mate XTs 非凡大师支持自由多窗,可实现应用窗口显示比例的自由调节,不受比例的限制;支持 3 个应用同时运行,且文件可实现应用间的拖拽传输;搭配新一代折叠键盘使用,操作更精准。另外,还加入了全新搭档,即手写笔 M-Pen 3,它拥有精巧的“书写键”“智慧键”“空鼠键”三键设计,支持批注、摘录、速记、智搜和息屏速记功能,实际体验远不止一支笔,而是能结合三折叠大屏形态,成为激发效率与创意的工具。《日本MV与欧美MV的区别》值得一提的是,本轮国际比赛日法甲教练组接连传出意外消息。巴黎圣日耳曼主帅恩里克在周五骑行时摔倒,导致锁骨骨折,俱乐部随后确认他将接受手术治疗。
? 向廷海记者 王增敬 摄
? 高志凯:这次阅兵,全球瞩目的焦点,无疑是导弹系列。这次展出的导弹包括常规战术导弹和战略武器,其中多款型号是首次公开亮相。公开展示这些最先进的导弹,有其深意:漫蛙漫画(网页入口)