【新智元导读】刚刚,由上海交通大学人工智能学院Agents团队提出的AI专家智能体,在OpenAI权威基准测试MLE-bench中击败了业界AI顶流微软,夺冠登顶! MLE-bench是衡量AI在机器学习工程(MLE)中表现的权威基准。它精选Kaggle上的75个相关竞赛,构建多样任务,测试AI在模型训练、数据准备、实验运行等机器学习工程中的能力 类似于AlphaGo向AlphaZero的演进路径,该过程经历了从人类辅助训练到完全自主优化的阶段,体现出AI系统在自我演进上的潜力和可行性。 与先前方法相比,ML-Master在所有评价维度上均全面领先,尤其在中等难度任务上奖牌率提升2.2倍(20.2% vs 9.0%),计算效率翻倍(仅需12小时 vs 基线24小时)。 尽管大型语言模型(LLM)和自主智能体在AI4AI领域取得显著进展,但现有方法仍面临核心挑战:探索与推理的割裂限制了性能提升。 因此,如何有效整合探索与推理,让AI系统能够像人类专家一样在解决复杂问题时既能广泛探索又能深度思考,成为AI4AI领域的核心挑战。 动态优先级调整:根据潜在价值分配计算资源,实时评估不同分支的潜力,将更多计算资源投入到更有希望的方向,避免无效探索。 自适应记忆机制:精准提取关键洞察,避免信息过载,智能筛选历史探索中的有效信息,既保留宝贵经验又避免冗余干扰,让每次推理都建立在更相关的知识基础上。 情境化决策:基于历史经验进行有根据的分析,不再是「拍脑袋」决策,而是结合具体执行反馈和成功案例,让AI的每个决定都有据可依。 闭环学习系统:持续从执行反馈中学习优化,探索结果实时反哺推理过程,形成「探索→推理→优化→再探索」的良性循环,实现持续自我提升。 智能记忆构建:探索模块自动收集执行结果、代码片段和性能指标,同时选择性整合来自父节点和并行兄弟节点的关键信息,避免信息过载。 嵌入推理决策:记忆信息直接嵌入到推理模型的「think」部分中,让每次推理都基于具体的历史执行反馈和多样化探索的经验进行精准决策。 协同进化机制:推理结果指导后续探索方向,探索经验持续丰富推理过程,真正实现了探索驱动推理进化,推理反哺探索路径的良性循环。 该基准由75个来自Kaggle的真实机器学习任务组成,涵盖从代码编写、模型调参到结果提交的完整流程,是目前最权威、最贴近实际工程场景的AI测试之一。其中不少任务取材自CVPR等国际顶级学术会议。 除了推出面向机器学习的专家智能体ML-Master,上海交通大学人工智能学院Agents团队后续将依托上海交通大学AI-X研究院,陆续推出覆盖各领域的专家智能体,构建有影响力的智能体生态体系,为人工智能技术的创新发展与广泛应用注入新动能。 上海交通大学人工智能学院是上海交通大学顺应发展趋势、对接国家战略、服务城市先导产业而成立的实体学院,是举全校之力组建的特区学院。 学院通过高层次定位和全新体制机制,致力于培养中国自主的人工智能卓越人才,为国家高水平科技自立自强提供有力支撑。学院基础雄厚、生源拔尖、设施完备、条件优越,为上海交通大学百年徐汇校区注入了全新的活力。 学院秉承「用人工智能变革世界,用人才变革人工智能」的愿景,以「引育顶尖人才、产出顶尖成果、孵化顶尖企业」为目标,致力于构建全链条创新体系,打造中国人工智能领域的「黄埔军校」,引领中国人工智能发展。
17c.com.gov.cn我们认为天猫的目标绝不仅仅是冲击GMV,我们最重要的还是真实消费、真实交易。我们差不多在春节后就开始往“剔除退款后GMV”这个方向去调了。Notion/Evernote:云端AI助手,有功能也有顾虑。Notion引入了“Notion AI”写作助手,可用于自动摘要、头脑风暴、润色等。这些AI功能背后实际上由OpenAI等模型提供支持。Notion官方强调不会将用户数据用于训练AI模型,并且用户的数据传输是加密的。换言之,Notion AI会将你的笔记内容发送给合作AI服务来生成结果,但承诺不会让这些内容进入AI的学习库。然而,尽管有此承诺,数据毕竟离开了用户设备,隐私上仍需建立在对Notion及其AI伙伴的信任之上。同样地,Evernote也集成了基于GPT的AI功能(如智能摘要等)。这些云端AI确实提升了笔记整理的效率,但企业若处理机密信息,往往对这类云AI心存疑虑——担心数据在传输或处理过程中外泄。17c.com.gov.cn男欢女爱免费观看武则天电视剧该报道进一步指出,虽然莱比锡6000万欧元的要价对于意甲俱乐部来说会是一个难题,但如果球员渴望转会,那么这一数字就有可能会被降低。IT之家 6 月 21 日消息,工信部昨晚公布第 396 批《道路机动车辆生产企业及产品公告》新产品公示,其中包含奇瑞 iCAR X3L 方盒子 SUV(以上市名称为准)。
20250813 👄 17c.com.gov.cn6月23日晚,曾德钧曾公开发视频评价小米CEO雷军,提及雷军形象反差大,缺乏尊重,还提及十多年前的一桩旧事称:自己作为国内最早投身智能音箱领域的开拓者,带着项目与雷军旗下的顺为资本洽谈,却遭雷军一句“智能音箱有什么用?我们不要在上面浪费时间了”,随后起身离去,连看都没看他一眼。(新浪科技)《特殊的房产销售2》热火能否成功得到杜兰特的一个关键因素可能取决于球队是否愿意放弃21岁的潜力内线凯尔-韦尔,他是太阳队感兴趣的球员。
📸 唐兴邦记者 陈焱 摄
20250813 🩲 17c.com.gov.cn京东从舆论战开始,加上价格补贴(国补给的自信),让美团很难受,看着市场份额一直在跌,也只能硬着头皮跟。用兴哥的话叫:“美团会在遵循公平有序竞争的原则下,加大投入应对竞争。”而且,出海的仗也不好打,Keeta在香港地区发展得不错,兴哥又在“中国-巴西商业研讨会”上与巴西总统卢拉会面,也要马上登录巴西市场,计划5年内投入10亿美金发展业务。女人被男人进入后的心理变化流离失所的加沙民众:这是我第14次流离失所,我们要撤离,却不知道往哪里去。从早上开始,我们就一直在找地方住,但还没有找到一个可以坐下的地方,我们该怎么办?
📸 黄昭和记者 李改敏 摄
🤫 按照莫雷托的说法,加拉塔萨雷目前的确在追逐恰尔汗奥卢,未来几天他们预计就会和球员的经纪人戈登-斯蒂皮克在伊斯坦布尔进行直接的接触,不过就目前来说,加拉塔萨雷和国米之间依然不存在有关恰尔汗奥卢的谈判。17c官方网站