【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新性地提出了一种「拖拽式大语言模型」(DnD),它可以基于提示词快速生成模型参数,无需微调就能适应任务。不仅效率最高提升12000倍,而且具备出色的零样本泛化能力。 刚刚,包括尤洋教授在内的来自新加坡国立大学、得克萨斯大学奥斯汀分校等机构的研究人员,提出了一种全新的「拖拽式大语言模型」——Drag-and-Drop LLMs! 通过一个轻量级文本编码器与一个级联超卷积解码器的组合,DnD能在数秒内,仅根据无标签的任务提示词,生成针对该任务的LoRA权重矩阵。 通过观察,研究人员发现,LoRA适配器无非是其训练数据的一个函数:梯度下降会将基础权重「拖拽」至一个特定任务的最优状态。 为了赋予模型「拖拽」的能力,团队将这些数据集的提示词与收集到的LoRA权重进行随机配对,构成DnD模型的训练数据——即「提示词-参数」对。 在推理阶段,团队只需将来自全新数据集(训练中未见过)的提示词输入DnD,仅需一次前向传播,即可获得为该任务量身定制的参数。 实验结果表明,在零样本测试集上,团队的方法相较于训练所用的LoRA模型的平均性能,取得了惊人的提升,并且能够很好地泛化到多种真实世界任务和不同尺寸的LLM。 此前,他在中国科学技术大学获得人工智能学士学位。并曾在北卡罗来纳大学教堂山分校Huaxiu Yao教授的指导下进行实习,以及在中国科学技术大学数据科学实验室跟着导师Xiang Wang度过了两年的时光。 Zhangyang Wang目前是德克萨斯大学奥斯汀分校钱德拉家族电气与计算机工程系的终身副教授,并荣膺坦普尔顿基金会第7号捐赠教席。 他于2016年获伊利诺伊大学厄巴纳-香槟分校电气与计算机工程博士学位,师从计算机视觉泰斗黄煦涛(Thomas S.Huang)教授;并于2012年获中国科学技术大学电子工程与信息科学学士学位。 核心目标是创建结构化、模块化的模型表示:1)在过参数化模型空间中实现高效、鲁棒的学习;2)与符号知识及推理进行无缝连接。 此前,他在新加坡国立大学获得数据科学与机器学习博士学位,在中国科学院深圳先进技术研究院获得计算机技术硕士学位,在北京师范大学珠海校区获得学士学位。
宝宝下面湿透了还嘴硬的原因比如遇到不认识的障碍物要绕行是为了安全、路上遇到特别慢的车适时变道超车是为了通行效率、按照红绿灯车道线道路标牌的指示开车是为了合规…….如今按照阿科曼多的说法,法布雷加斯执教的科莫目前在阿布德的争夺中领先于其他对手,而在意大利的俱乐部中,除了科莫以外,唯一明确了解过阿布德转会可能的是佛罗伦萨而非罗马。宝宝下面湿透了还嘴硬的原因9·1看短视频马泰奥-莫雷托表示,预计那不勒斯和米兰将会重启关于尤纳斯-穆萨转会至那不勒斯的谈判,并试图就最终的转会费达成全面协议。如今就业市场竞争激烈,很多大学生毕业后都面临着就业难的问题。像林宇这样能够找到一份稳定的工作,并且有着不错的收入和福利待遇,已经算是比较幸运的了。而且,每个人对于“有出息”的定义都不同,林宇认为,能够在工作中获得满足感,生活过得安稳,就是一种成功。他也理解父母的良苦用心,但他更希望按照自己的节奏去规划未来的生活。
20250812 🔞 宝宝下面湿透了还嘴硬的原因扎哈罗娃19日在圣彼得堡国际经济论坛间隙举行的新闻发布会上表示,当前中东紧张局势升级的最危险时期仍在持续,导致这一局面的原因是以色列违反联合国宪章和国际法准则,对主权国家伊朗发动无端侵略。以方所谓“对核不扩散的担忧”无法为其侵略辩护。17.c.cow起草前几年,抖音打造优质内容时,采取的是 “大水漫灌” 式的扶持——对一些品类在它们的模型预估分上做简单的系数加成,简单而言就是给这类内容直接买量加热,但最终发现效果非常不好。
📸 李明媚记者 李琳玉 摄
20250812 🔞 宝宝下面湿透了还嘴硬的原因弗拉门戈的这场逆转之战,打得相当漂亮。从场面上看,弗拉门戈进攻犀利,打法富有激情,渴望胜利。切尔西的攻防都存在严重问题:组织核心帕尔默全场隐身,中锋杰克逊出场仅4分钟就染红,简直是新版的“没头脑”和“不高兴”。特种兵营里被轮流的小说叫什么来着6月19日上午,上海市网信办依法约谈筑梦岛App运营企业主要负责人,要求平台立即整改,健全AI生成合成内容审核机制,提升技术把关能力,加强涉未成年人不良内容的整治清理,切实落实未成年人网络保护义务。
📸 梁勇记者 张海辉 摄
🔞 据了解,发生状况的这架客机与12日在印度坠毁的客机机型同为波音787-8。对此,全日空方面表示,此为个别事件,不予置评。(央视新闻)九十九夜xbox360