尽管大型语言模型(LLMs)和大型视觉 - 语言模型(VLMs)在视频分析和长语境处理方面取得了显著进展,但它们在处理信息密集的数小时长视频时仍显示出局限性。 本文提出了一种新颖的智能体 Deep Video Discovery (DVD),通过将长视频分割为更短的片段并将其视作环境,利用 LLM 先进的推理能力来思考问题并自主规划,选择具有适当参数的工具来从环境中逐步获取信息,最终回答问题。在最新的推理模型OpenAI o3的帮助下, DVD以这一简洁有效的 agentic 框架在非常具有挑战性的LVBench上以74.2%的准确率大幅超越了之前的工作。这一工作将以MCP Server的形式开源。 不同于之前的视频智能体框架依赖于手动设计的固定工作流程,DVD 强调其作为智能体的自主性,即通过自主规划,决策和行动来解决问题。 为了充分利用这一自主性,我们将原始的长视频转换为多粒度视频数据库,并提供了一套以搜索为中心的工具使得智能体在不同阶段搜集不同粒度的信息。具体来说该系统主要由三个核心组件构成:多粒度视频数据库、以搜索为中心的工具集以及作为智能体协调器的 LLM。 在 “多粒度视频数据库构建” 阶段,系统将超长视频转换为一个结构化数据库,通过统一将视频分割成短片段(例如 5 秒),并提取全局、片段和帧级别的多粒度信息,包括主题中心化摘要、片段字幕及其嵌入向量,以及原始解码帧...。 (2)片段搜索(Clip Search)工具,实现通过片段描述 Embedding 对视频内容进行高效语义检索,并返回排名靠前的相关视频片段及其字幕和时间范围。 LLM 作为核心认知驱动器,在迭代的 “观察 - 推理 - 行动” 循环中,根据累积的知识和推理证据采取行动,从而赋予智能体自主、证据引导和灵活的行动机制,有效地将原始查询分解为逐步细化的子查询来解答问题。 该系统在多个长视频基准测试上进行了全面评估,展现了其卓越的效率和强大的性能。在极具挑战性的 LVBench 数据集上,DVD 智能体取得了 74.2% 的最新准确率,大幅超越了所有现有工作,包括先前的最先进模型 MR. Video(13.4% 的提升)和 VCA(32.9% 的提升)。在辅助转录的帮助下,准确率进一步提高到 76.0%。在 LongVideoBench、Video MME Long 子集和 EgoSchema 等其他长视频基准测试中,DVD 也持续超越了先前的最先进性能。 图 3:不同基础模型在智能体中的行为分析。图中可以明显看出不同基础模型表现出显著的行为模式差异,不具有推理能力 GPT-4o 表现出非常单一的行为模型。 消融研究证实了工具设计的有效性,并强调了推理模型在整个智能体系统中的关键作用:更换推理模型(如使用 OpenAI o4-mini 或 GPT-4o)会导致性能下降,这表明 LLM 推理能力的缺失会导致智能体行为崩溃。对智能体推理行为的分析也揭示了不同模型在工具调用模式、推理深度和准确性之间的关联,例如 GPT-4o 表现出过度自信和行为崩溃,倾向于过早结束推理。这些行为模式的分析进一步为未来的智能体设计以及基础语言模型的发展提供了实践参考。
17.c.cow起草第一次结婚在内地,育有一子,之后离婚,到香港和另一个男人结婚,拿下香港身份证,现在她住的公屋,也是离婚后在香港排下来的。警察资源是社会公共资源,应该用于维护社会的安全和稳定,处理真正的违法犯罪行为。而家长因为一点小事就报警,不仅浪费了警力资源,也让警察陷入了一些不必要的纠纷中。17.c.cow起草无人区一区二区区别是什么呢不过,当AI需要理解更复杂的人性时,就要向认知心理学“借眼睛”了。人类的注意力像一束智能聚光灯,总是优先照亮关键信息。这个发现催生了AI的注意力机制。例如,人工智能大模型ChatGPT写作时会像人类划重点一样,扫描上下文并精准锁定高频词。Transformer模型处理文本时,通过计算词与词之间的关联,动态分配“注意力权重”。这些权重如同聚光灯,决定模型聚焦哪些词,从而影响内容生成。“我当时已经三天三夜没睡觉没吃东西了,从德黑兰到口岸期间发生了很多突发事件,时间一直处于紧绷状态,当我推开那个小绿门,黑蒙蒙的,我就看到那个红色的五星红旗,对面是咱们中国人,使领馆和阿塞拜疆的人来接应我们,当时我就软下来了,心里可太激动了,这辈子可能只有这么一次。”刘女士说道。
20250812 🍓 17.c.cow起草然而,尽管产量在下滑,社会库存量仍然在增加。中国酒业协会发布的《2024中国白酒市场中期研究报告》显示,2024年上半年有超过60%经销商表示库存增加。库存压力让经销商的资金周转困难,超过30%经销商表示面临现金流压力,超过50%表示利润空间有所减少。满18岁免费观看高清电视剧推荐所以,星愿不仅仅是一款吉利银河的爆款产品,更是改写了A0级市场的整体走势和格局。A0级市场过去被比亚迪海豚和五菱缤果瓜分,星愿出现后迅速改变了竞争格局,现在,星愿5月份的销量,远超海豚、缤果两款同级产品销量之和。
📸 郝会敏记者 董小强 摄
20250812 🥵 17.c.cow起草贝克马托夫是最早尝试中方技术的乌兹别克斯坦棉农之一。2020年,新疆天业节水灌溉股份有限公司研发管理中心项目主管杨开文向他许下“1000天内把棉花亩产提高到400公斤”的诺言。经过试验,棉花亩产果然超过400公斤,还节省了大量水资源,贝克马托夫心服口服。免费观看已满十八岁电视剧下载安装不仅如此,AI 测评还会根据你当前的不足之处,提出有针对性的优化建议,帮助你进一步提升竞争力,拉近与理想院校的距离,真正做到选校不再迷茫,规划更有方向!
📸 刘军拴记者 董增仁 摄
🔞 龚翔宇职业生涯中曾出征三届奥运会,随中国女排摘得2016年里约奥运会金牌,2018年女排世锦赛上夺得铜牌,2019年女排世界杯11战全胜夺冠。女性一晚上3次纵欲导致不孕