输入上下文窗口高达100万tokens,输出可达10万tokens。支持MCP(模型上下文协议)与并行工具调用。动态处理短时与长时推理,集成 Code Interpreter 与其他工具。性能更快、更可靠、更少幻觉、提升长期对话记忆与逻辑处理能力。 Lobster可以通过极少的输入快速生成结构完整、功能准确的代码,非常适合处理凌乱的遗留代码,可以自动优化代码结构、清除冗余,同时管理大型软件项目中的依赖关系。 例如一名用户让Lobster和另一个模型同时创建交互式神经网络动画,Lobster一次性就生成了一个带有彩色节点的解决方案,而另一个模型在代码运行中出现错误。 另外Lobster据悉也集成了o3系列模型的高级推理能力,能在简单任务中使用快速响应模式,在复杂任务中触发深层推理模块,更擅长逻辑推理以及解决数学问题。 支持文本、图像、工具调用等多模态,具备类似Agent的多步骤组合执行能力,可以让其同时完成解释图像、编写代码和使用工具等任务,而无需像GPT-4一次只能处理一类输出。 Lobster将是编码、推理、多模态理解的融合,将OpenAI之前彼此独立的模型集合在一起,让用户直接拥有一个功能更强大的工作助手,轻松执行复杂的多步骤任务。 微软正试行新版Copilot的“Smart 模式”(或称 “magic mode”),能够智能判断何时调用GPT?5的深度推理与多模态能力,以简化用户无需手动选择模型的流程。这项功能显示微软极可能在GPT?5发布后第一时间集成该模型至Copilot及Microsoft 365生态中,Azure也在为集成GPT-5做准备。 尽管GPT-5在能力上会远超GPT-4,但GPT-5仍然是难以控制的,会继续犯一些难以预料的低级错误,甚至不会完全听从指令操作。GPT-5仍然难以处理一些复杂的物理、心理和数学推理任务。幻觉依旧普遍,且误导性更高,更容易生成看起来正确但实际内容错误的输出。自然语言输出仍然无法可靠地链接到下游系统(如数据库、虚拟助手等),自然语言指令难以准确映射到用户意图上。GPT-5不会是像AGI一样的通用人工智能,仍旧需要其它工具协助完成复杂场景任务。系统仍将无法稳定地遵循有用无害的人类价值观,在输出回答时可能隐含部分偏见。GPT-5只是基础的规模扩展,未来AGI将朝向更结构化、具备显性知识与规划能力发展,与更广泛的其它技术集成,而这些都是GPT系列所缺乏的。


