尽管大型语言模型(LLMs)和大型视觉 - 语言模型(VLMs)在视频分析和长语境处理方面取得了显著进展,但它们在处理信息密集的数小时长视频时仍显示出局限性。 本文提出了一种新颖的智能体 Deep Video Discovery (DVD),通过将长视频分割为更短的片段并将其视作环境,利用 LLM 先进的推理能力来思考问题并自主规划,选择具有适当参数的工具来从环境中逐步获取信息,最终回答问题。在最新的推理模型OpenAI o3的帮助下, DVD以这一简洁有效的 agentic 框架在非常具有挑战性的LVBench上以74.2%的准确率大幅超越了之前的工作。这一工作将以MCP Server的形式开源。 不同于之前的视频智能体框架依赖于手动设计的固定工作流程,DVD 强调其作为智能体的自主性,即通过自主规划,决策和行动来解决问题。 为了充分利用这一自主性,我们将原始的长视频转换为多粒度视频数据库,并提供了一套以搜索为中心的工具使得智能体在不同阶段搜集不同粒度的信息。具体来说该系统主要由三个核心组件构成:多粒度视频数据库、以搜索为中心的工具集以及作为智能体协调器的 LLM。 在 “多粒度视频数据库构建” 阶段,系统将超长视频转换为一个结构化数据库,通过统一将视频分割成短片段(例如 5 秒),并提取全局、片段和帧级别的多粒度信息,包括主题中心化摘要、片段字幕及其嵌入向量,以及原始解码帧...。 (2)片段搜索(Clip Search)工具,实现通过片段描述 Embedding 对视频内容进行高效语义检索,并返回排名靠前的相关视频片段及其字幕和时间范围。 LLM 作为核心认知驱动器,在迭代的 “观察 - 推理 - 行动” 循环中,根据累积的知识和推理证据采取行动,从而赋予智能体自主、证据引导和灵活的行动机制,有效地将原始查询分解为逐步细化的子查询来解答问题。 该系统在多个长视频基准测试上进行了全面评估,展现了其卓越的效率和强大的性能。在极具挑战性的 LVBench 数据集上,DVD 智能体取得了 74.2% 的最新准确率,大幅超越了所有现有工作,包括先前的最先进模型 MR. Video(13.4% 的提升)和 VCA(32.9% 的提升)。在辅助转录的帮助下,准确率进一步提高到 76.0%。在 LongVideoBench、Video MME Long 子集和 EgoSchema 等其他长视频基准测试中,DVD 也持续超越了先前的最先进性能。 图 3:不同基础模型在智能体中的行为分析。图中可以明显看出不同基础模型表现出显著的行为模式差异,不具有推理能力 GPT-4o 表现出非常单一的行为模型。 消融研究证实了工具设计的有效性,并强调了推理模型在整个智能体系统中的关键作用:更换推理模型(如使用 OpenAI o4-mini 或 GPT-4o)会导致性能下降,这表明 LLM 推理能力的缺失会导致智能体行为崩溃。对智能体推理行为的分析也揭示了不同模型在工具调用模式、推理深度和准确性之间的关联,例如 GPT-4o 表现出过度自信和行为崩溃,倾向于过早结束推理。这些行为模式的分析进一步为未来的智能体设计以及基础语言模型的发展提供了实践参考。
暴躁少女csgo高清大图特点问题六:能不能用一个类似于人力资本投资的概念来总结一下1949~1979年的社会化育儿的特点?这个历史时期育儿机构中的保育员的性别比例是怎样的?甚至台媒称大S的猝然离世,最令徐家人的伤痛的是眼睁睁地看着大S在国外就这么离开,她们三个女人无法释怀,无法接受这一个残酷的事实。暴躁少女csgo高清大图特点7788.gov.cm“这份新合同几乎满足了他的一切要求,包括更多的钱、特权和股份。因为我们知道整个联赛的现在和部分未来,都依赖于C罗的存在。”这如同在泰国政府和军方以及民众之间扔下一枚“炸弹”。佩通坦通话中的低姿态引发不满,而她对军方的批评更引发政府与军队关系生变的担忧。受此事件影响,执政联盟的第二大党自豪泰党宣布退出联合政府,敦促佩通坦就通话录音事件担责。
20251209 ? 暴躁少女csgo高清大图特点直播吧6月27日讯 世俱杯小组赛最后一轮,曼城和尤文上演强强对话。本场比赛之前,曼城主帅瓜迪奥拉接受了DAZN的采访,他对自己的排兵布阵进行了解释。www.51cao.gov.cn这家公司的两位创始人是哈佛的校友,其中一位创始人Nicholas Sleeper的家族在美国缅因州经营了一家100年历史的杂货铺,他每天亲眼目睹父亲经历的各种运营杂货店的挑战。他发现,经营一家独立杂货店,利润微薄。例如,他们会因为缺货导致销售额损失增加,员工会因为在工作时滑倒等危险增加了店铺的责任风险,影响了销售额,微薄的利润又导致杂货店无法雇佣后台工作人员,而这些琐事又分散了门店经理在优先事项——客户服务上的注意力。
? 高宝峰记者 卢俊峰 摄
20251209 ? 暴躁少女csgo高清大图特点正如董修惠所说,过去一汽丰田给中国汽车市场带来的,不仅是一款款经典“神车”,更是一种企业专心、用户安心的造车哲学和文化。51cao.gov.cn新华社德黑兰6月26日电 伊朗最高领袖哈梅内伊26日在社交媒体上发文说,美国从这场战争中并没有取得任何成果,伊朗取得了胜利,并狠狠地给了美国一记耳光。
? 张志伟记者 贾桂珍 摄
? 第一盘,双方打得非常激烈,确实属于大满贯冠军之间的强强对话。第一局,莱巴金娜率先发球,萨巴伦卡把握住第3个破发点之后完成破发,不过第二局自己的发球局,被莱巴金娜马上回破,再到第六局再度被破发,比分2-4处于落后。www.51cao.gov.cn




