尽管大型语言模型(LLMs)和大型视觉 - 语言模型(VLMs)在视频分析和长语境处理方面取得了显著进展,但它们在处理信息密集的数小时长视频时仍显示出局限性。 本文提出了一种新颖的智能体 Deep Video Discovery (DVD),通过将长视频分割为更短的片段并将其视作环境,利用 LLM 先进的推理能力来思考问题并自主规划,选择具有适当参数的工具来从环境中逐步获取信息,最终回答问题。在最新的推理模型OpenAI o3的帮助下, DVD以这一简洁有效的 agentic 框架在非常具有挑战性的LVBench上以74.2%的准确率大幅超越了之前的工作。这一工作将以MCP Server的形式开源。 不同于之前的视频智能体框架依赖于手动设计的固定工作流程,DVD 强调其作为智能体的自主性,即通过自主规划,决策和行动来解决问题。 为了充分利用这一自主性,我们将原始的长视频转换为多粒度视频数据库,并提供了一套以搜索为中心的工具使得智能体在不同阶段搜集不同粒度的信息。具体来说该系统主要由三个核心组件构成:多粒度视频数据库、以搜索为中心的工具集以及作为智能体协调器的 LLM。 在 “多粒度视频数据库构建” 阶段,系统将超长视频转换为一个结构化数据库,通过统一将视频分割成短片段(例如 5 秒),并提取全局、片段和帧级别的多粒度信息,包括主题中心化摘要、片段字幕及其嵌入向量,以及原始解码帧...。 (2)片段搜索(Clip Search)工具,实现通过片段描述 Embedding 对视频内容进行高效语义检索,并返回排名靠前的相关视频片段及其字幕和时间范围。 LLM 作为核心认知驱动器,在迭代的 “观察 - 推理 - 行动” 循环中,根据累积的知识和推理证据采取行动,从而赋予智能体自主、证据引导和灵活的行动机制,有效地将原始查询分解为逐步细化的子查询来解答问题。 该系统在多个长视频基准测试上进行了全面评估,展现了其卓越的效率和强大的性能。在极具挑战性的 LVBench 数据集上,DVD 智能体取得了 74.2% 的最新准确率,大幅超越了所有现有工作,包括先前的最先进模型 MR. Video(13.4% 的提升)和 VCA(32.9% 的提升)。在辅助转录的帮助下,准确率进一步提高到 76.0%。在 LongVideoBench、Video MME Long 子集和 EgoSchema 等其他长视频基准测试中,DVD 也持续超越了先前的最先进性能。 图 3:不同基础模型在智能体中的行为分析。图中可以明显看出不同基础模型表现出显著的行为模式差异,不具有推理能力 GPT-4o 表现出非常单一的行为模型。 消融研究证实了工具设计的有效性,并强调了推理模型在整个智能体系统中的关键作用:更换推理模型(如使用 OpenAI o4-mini 或 GPT-4o)会导致性能下降,这表明 LLM 推理能力的缺失会导致智能体行为崩溃。对智能体推理行为的分析也揭示了不同模型在工具调用模式、推理深度和准确性之间的关联,例如 GPT-4o 表现出过度自信和行为崩溃,倾向于过早结束推理。这些行为模式的分析进一步为未来的智能体设计以及基础语言模型的发展提供了实践参考。
y31成色好的y31对于金雪峰意外离世一事,15日,上游新闻记者联系上吴圩镇政府。镇工作人员表示已知晓此事。“有听说过这个事情,也上报过,但(死因)不太清楚。”对于圣龙潭潜水风险性一事,该工作人员表示:“圣龙潭挺危险的,每年都有点事发生。另外,据我所知,圣龙潭好像是承包出去了,应该是一个潜水俱乐部的,具体我也不太清楚。”“G7峰会对基辅来说是一次彻底的失败,表明其失去了美国的支持。”俄新社18日称,在加拿大结束的G7峰会表明,乌克兰在国际舞台上的地位有所削弱,美国外交政策的优先事项发生了变化。华盛顿反对加强对俄罗斯的制裁,并将关注重点明显转向中东。美国对乌克兰的军事援助正迅速减少,华盛顿越来越多地将支持基辅的负担转移给欧洲。然而,欧洲既没有财政资源,也没有军事资源来大规模援助乌克兰。对泽连斯基来说,这是一个负面的情景。y31成色好的y31漫蛙漫画(网页入口)当前,徐汇区正加快建设具有国际竞争力的人工智能创新高地。依托“模速空间”,徐汇已集聚大模型企业580家,累计推动50个备案大模型落地,约占上海全市的61%。区内既有稀宇科技、阶跃星辰等具有行业引领性的大模型企业,还吸引了乐推、新榜、悦普、群玉山等数字营销服务商和创意内容机构扎堆。在City Matters的倡导下,俱乐部承诺,虽然由于俱乐部持续参与杯赛,可能会调整英超比赛的票价,但在任何情况下,本赛季英超普通门票的价格都不会上涨。
20250813 💫 y31成色好的y313. Audition and Interview:试奏/试演和面试对于申请音乐专业的申请者来说非常重要。一般情况下,学生需要先在线上提供初步材料(包括音频或者视频),预筛选通过后学校会发送试奏/试演的邀请,并告知日期,根据不同专业所需准备的内容和时长都不一样,大家可以前往学校官网查看哦。乳头被男人吸过乳头会皲裂吗于佳宁同样提到,最紧迫的问题集中在监管合规与合规环境的可预期性不足之间的矛盾。一方面,香港等地监管框架的逐步明晰,为境内机构提供了试点与出海的落地场景,另一方面,内地仍未形成对稳定币明确的法律界定与许可机制。在监管协调尚未统一的背景下,机构在资源配置、业务设计与风险管理上承受较高的不确定性,难以对中长期投入进行清晰评估。尤其在跨境业务设计中,如何同时满足多个司法辖区的要求,成为制度协调之外的核心操作难点。
📸 米加山记者 李廷英 摄
20250813 🥵 y31成色好的y31随后宋茜疑似“抢压轴”一事就引起网友热议,还有媒体疑似用了早就准备好的压轴文案替宋茜宣传,虽然后来又重新编辑了,但也引起不小的误会和讨论。日本mv与欧美mv的区别截至目前,驭势科技机场无人驾驶解决方案已在香港国际机场、广州白云机场、乌鲁木齐天山机场、杭州萧山机场、深圳宝安机场及新加坡樟宜机场、卡塔尔哈马德机场等超20个海内外知名机场实现落地应用,机坪“真无人”驾驶里程超200万公里。
📸 范英记者 薛伯政 摄
🍆 皇家贝蒂斯表示,萨巴利是球队提升竞技水平的重要一员,他的付出不仅让球队稳定地出现在欧战赛场,更在2022年夺得西班牙国王杯冠军。俱乐部对萨巴利在效力期间为球队防线作出的贡献表示深切感谢,并祝愿他在职业生涯新阶段好运。少女国产免费观看高清电视剧大全