6月30日,Anthropic正式发布Claude Sonnet 5,并于7月1日起将其设为所有免费和Pro用户的默认模型。这是Anthropic迄今为止最强大的Sonnet级别模型,在推理、编程、工具调用和计算机操作等核心能力上大幅逼近旗舰模型Opus 4.8,而定价仅为Sonnet级别。
在关键基准测试中,Claude Sonnet 5表现亮眼:Agentic Coding评测达到63.2%,OSWorld计算机操作评测达81.2%,Terminal-Bench终端操作评测达80.4%。该模型支持100万token上下文窗口,支持多模态输入(文本+图像),并具备自主规划、使用工具(浏览器和终端)以及长期运行任务的能力。
Anthropic表示其Agent能力已接近此前需要更大规模、更昂贵模型才能达到的水平。早期合作伙伴如Cursor、Zapier反馈该模型在复杂多步任务中的可靠性显著提升。此次发布标志着Anthropic将前沿Agent能力推向更广泛的企业和开发者群体。
数据来源:Anthropic官方发布,TechCrunch,LLM Stats
https://llm-stats.com/models/claude-sonnet-5