【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新性地提出了一种「拖拽式大语言模型」(DnD),它可以基于提示词快速生成模型参数,无需微调就能适应任务。不仅效率最高提升12000倍,而且具备出色的零样本泛化能力。 刚刚,包括尤洋教授在内的来自新加坡国立大学、得克萨斯大学奥斯汀分校等机构的研究人员,提出了一种全新的「拖拽式大语言模型」——Drag-and-Drop LLMs! 通过一个轻量级文本编码器与一个级联超卷积解码器的组合,DnD能在数秒内,仅根据无标签的任务提示词,生成针对该任务的LoRA权重矩阵。 通过观察,研究人员发现,LoRA适配器无非是其训练数据的一个函数:梯度下降会将基础权重「拖拽」至一个特定任务的最优状态。 为了赋予模型「拖拽」的能力,团队将这些数据集的提示词与收集到的LoRA权重进行随机配对,构成DnD模型的训练数据——即「提示词-参数」对。 在推理阶段,团队只需将来自全新数据集(训练中未见过)的提示词输入DnD,仅需一次前向传播,即可获得为该任务量身定制的参数。 实验结果表明,在零样本测试集上,团队的方法相较于训练所用的LoRA模型的平均性能,取得了惊人的提升,并且能够很好地泛化到多种真实世界任务和不同尺寸的LLM。 此前,他在中国科学技术大学获得人工智能学士学位。并曾在北卡罗来纳大学教堂山分校Huaxiu Yao教授的指导下进行实习,以及在中国科学技术大学数据科学实验室跟着导师Xiang Wang度过了两年的时光。 Zhangyang Wang目前是德克萨斯大学奥斯汀分校钱德拉家族电气与计算机工程系的终身副教授,并荣膺坦普尔顿基金会第7号捐赠教席。 他于2016年获伊利诺伊大学厄巴纳-香槟分校电气与计算机工程博士学位,师从计算机视觉泰斗黄煦涛(Thomas S.Huang)教授;并于2012年获中国科学技术大学电子工程与信息科学学士学位。 核心目标是创建结构化、模块化的模型表示:1)在过参数化模型空间中实现高效、鲁棒的学习;2)与符号知识及推理进行无缝连接。 此前,他在新加坡国立大学获得数据科学与机器学习博士学位,在中国科学院深圳先进技术研究院获得计算机技术硕士学位,在北京师范大学珠海校区获得学士学位。
鲁鲁射和鲁鲁的区别零跑表示,零跑旗舰D系列车型将于明年一季度量产,中央域控制器搭载两颗骁龙8797芯片,单片算计640TOPS,一颗用于智能座舱,一颗用于辅助驾驶。哈维-阿隆索面临的关键课题,是让两位天才在无球时同样投入。无论是协同压迫时的纪律性跑位,还是有序回防盯人,而非像本赛季这样仅用眼神防守。他们持球时是世界级,但无球时的“慷慨”却可能成为致命伤。鲁鲁射和鲁鲁的区别www.7788.gov.cm2025财年最新阿里合伙人名单,共17人:樊路远、蒋凡、蒋芳、蒋江伟、刘振飞、马云、邵晓锋、童文红、蔡崇信、万霖、王磊、闻佳、吴泳铭、吴泽明、俞思瑛、张建锋、郑俊芳。小米 YU7 汽车上市后订单火爆,但二手平台出现大量加价转让订单,最高加价 1.88 万元。小米汽车回应称不支持修改购车人,建议通过官方渠道购买。>> 查看详情
20251210 ? 鲁鲁射和鲁鲁的区别金正恩强调:“尽快修复驱逐舰是直接关乎国家权威的政治问题,而非单纯的业务性问题。”他还要求,在6月全会召开前“无条件”完成修复工作。金正恩指示成立调查小组,调查事故原因。www.zjzjzjzjzjy.gov.cnMichael 还表示,未来编程范式转变,而代码将变成可选项,逻辑设计与审美成为核心。其进一步解释表示,人类程序员未来更像是「逻辑设计师」,专注于构建意图而非语法细节。
? 王俐强记者 于丽萍 摄
20251210 ? 鲁鲁射和鲁鲁的区别“他依然在场上发挥着决定性的作用,能在这里拥有他是我们的荣幸。他能够赢得比赛,他一直都在这样做。他在比赛中创造了很多机会。希望他能在这里待更长的时间。”www.7788.gov.cm谷歌表示 Gemini 2.5 系列以平衡“成本-速度-性能”为核心设计目标,兼顾高效推理与经济性,伴随着稳定版上线,确保开发者能以更高信心构建复杂系统。
? 吴玉洁记者 李洪生 摄
? 据消息人士透露,这些费用可能使得每支新加入球队的扩张费达到约60亿美元。这意味着如果新增两支球队,现有的30位球队老板每人将获得大约4亿美元的收入。WWW.17cao.gov.cn




