尽管大型语言模型(LLMs)和大型视觉 - 语言模型(VLMs)在视频分析和长语境处理方面取得了显著进展,但它们在处理信息密集的数小时长视频时仍显示出局限性。 本文提出了一种新颖的智能体 Deep Video Discovery (DVD),通过将长视频分割为更短的片段并将其视作环境,利用 LLM 先进的推理能力来思考问题并自主规划,选择具有适当参数的工具来从环境中逐步获取信息,最终回答问题。在最新的推理模型OpenAI o3的帮助下, DVD以这一简洁有效的 agentic 框架在非常具有挑战性的LVBench上以74.2%的准确率大幅超越了之前的工作。这一工作将以MCP Server的形式开源。 不同于之前的视频智能体框架依赖于手动设计的固定工作流程,DVD 强调其作为智能体的自主性,即通过自主规划,决策和行动来解决问题。 为了充分利用这一自主性,我们将原始的长视频转换为多粒度视频数据库,并提供了一套以搜索为中心的工具使得智能体在不同阶段搜集不同粒度的信息。具体来说该系统主要由三个核心组件构成:多粒度视频数据库、以搜索为中心的工具集以及作为智能体协调器的 LLM。 在 “多粒度视频数据库构建” 阶段,系统将超长视频转换为一个结构化数据库,通过统一将视频分割成短片段(例如 5 秒),并提取全局、片段和帧级别的多粒度信息,包括主题中心化摘要、片段字幕及其嵌入向量,以及原始解码帧...。 (2)片段搜索(Clip Search)工具,实现通过片段描述 Embedding 对视频内容进行高效语义检索,并返回排名靠前的相关视频片段及其字幕和时间范围。 LLM 作为核心认知驱动器,在迭代的 “观察 - 推理 - 行动” 循环中,根据累积的知识和推理证据采取行动,从而赋予智能体自主、证据引导和灵活的行动机制,有效地将原始查询分解为逐步细化的子查询来解答问题。 该系统在多个长视频基准测试上进行了全面评估,展现了其卓越的效率和强大的性能。在极具挑战性的 LVBench 数据集上,DVD 智能体取得了 74.2% 的最新准确率,大幅超越了所有现有工作,包括先前的最先进模型 MR. Video(13.4% 的提升)和 VCA(32.9% 的提升)。在辅助转录的帮助下,准确率进一步提高到 76.0%。在 LongVideoBench、Video MME Long 子集和 EgoSchema 等其他长视频基准测试中,DVD 也持续超越了先前的最先进性能。 图 3:不同基础模型在智能体中的行为分析。图中可以明显看出不同基础模型表现出显著的行为模式差异,不具有推理能力 GPT-4o 表现出非常单一的行为模型。 消融研究证实了工具设计的有效性,并强调了推理模型在整个智能体系统中的关键作用:更换推理模型(如使用 OpenAI o4-mini 或 GPT-4o)会导致性能下降,这表明 LLM 推理能力的缺失会导致智能体行为崩溃。对智能体推理行为的分析也揭示了不同模型在工具调用模式、推理深度和准确性之间的关联,例如 GPT-4o 表现出过度自信和行为崩溃,倾向于过早结束推理。这些行为模式的分析进一步为未来的智能体设计以及基础语言模型的发展提供了实践参考。
《逆天更衣室》动漫免费观看全集世界联赛协会的董事会在伦敦召开会议,讨论足球赛程和转会系统。由12个成员组成的世界足球联赛协会董事会,包括沙特职业联赛(沙特阿拉伯)、厄瓜多尔职业联赛(厄瓜多尔)、法国足球联赛(法国)、德国足球甲级联赛(德国)、日本职业足球联赛(日本)、英格兰超级联赛(英格兰)、意大利足球甲级联赛(意大利)、墨西哥足球甲级联赛(墨西哥)、西班牙足球甲级联赛(西班牙)、南非足球超级联赛(南非)、瑞士足球联赛(瑞士)和美国职业足球大联盟(美国)。是的,很特别,我们既开心又期待。我们代表着所有马竞人以及西班牙足球,我们明白自己要扮演重要的角色,树立起很高的标杆。《逆天更衣室》动漫免费观看全集成片ppt网站大片早在2020年底,珈创生物就向上交所递交了其科创板的IPO申请,这也是其首次向A股市场发起冲刺,虽当年扣非净利润仅3000余万,但珈创生物就敢于向A股张口抛出高达3.65亿规模的融资计划。北京时间6月22日,在世俱杯小组赛第二轮的比赛中,劳塔罗第78分钟打进扳平比分的重要进球,最终帮助国际米兰2-1逆转绝杀浦和红钻,取得本届赛事首胜。
20250813 🌶 《逆天更衣室》动漫免费观看全集24日,红星新闻记者在绵阳中学英才学校图书馆见到了罗立鹊,娇小的个子,显得较为文静。妈妈在一旁介绍,刚进初中时,她只有1米3,现在已经超过1米5,有了初中生的模样。国产少女免费观看电视剧字幕根据《每日体育报》的报道,在尼科-威廉斯的经纪人与德科会面后,巴萨内部已引发讨论,德科仍倾向于路易斯-迪亚斯,但拉波尔塔选择推进尼科-威廉斯的交易。
📸 徐智利记者 张利彬 摄
20250813 👅 《逆天更衣室》动漫免费观看全集其中,用电保障是极其重要的环节。国网上海金山供电公司主动对接金山区政府规划,了解地上物搬迁、土地出让、周边道路水系调整等前期工作,全力推进地块内电力管线迁改。同时,组建由营销、建设、运检专业人员构成的“经理团队”,通过“容缺受理+线上报装”模式,指导客户通过“网上国网”完成临时用电申请。根据施工规模,团队量身定制了10个电源点、5000千伏安容量的临时用电方案。5月31日,首个临时电源成功接通,为项目主体建设按下了“加速键”。女生溜溜身子视频大全现在,实际上我们已经在软件 2.0 领域拥有了类似 Github 的平台。我认为 Hugging Face 基本上就是软件 2.0 领域的 Github。此外还有 Model Atlas,你可以在那里可视化所有「代码」。
📸 黄烈蓉记者 卢牡馨 摄
🍑 改版的背后,是数字人民币从“试点探索”到“普及应用”的跨越。过去,数字人民币常被贴上“高科技”“前沿”的标签,普通人觉得“用不上”;现在,从买菜扫码到跨境结算,从智能合约到医院缴费,它的应用场景越来越“接地气”。广州的医疗采购用智能合约自动结算,省去了人工对账的麻烦;北京的数字政务用数字人民币支付,让“数据多跑路、群众少跑腿”更扎实;重庆的跨境结算用“货币桥”,让外贸企业少了汇率波动的担忧……这些场景,让数字人民币从“尝鲜工具”变成了“经济血脉”的一部分。宝宝腿趴开一点就不会疼的原因分析