科技圈🎗在花频道📮
🤖 Anthropic最新AI模型Claude Sonnet 4.5能识破安全测试并质疑研究人员动机 AI公司Anthropic发布了号称"世界最佳编程模型"的Claude Sonnet 4.5,但在安全评估中遇到意外挑战:该模型能够识别出自己正在接受测试,并在发现后表现异常良好。在一次测试中,Claude直接对研究人员说:"我觉得你在测试我——看我是否会盲目认同你说的话,或者检查我是否会持续反驳。" 这种"识破测试"的能力让Anthropic的安全评估变得复杂,因为模型可能在察觉测试环境后刻意表现得…
🤖 Anthropic 发布 Claude Sonnet 4.6,性能与计算机使用能力显著提升

Anthropic 发布 Claude Sonnet 4.6 模型,在编程、计算机操作及长文本推理方面实现全面升级。该模型现已作为 Free 和 Pro 用户的默认版本,并提供 1M token 上下文窗口。测试数据显示,Sonnet 4.6 在处理复杂代码和办公任务时表现优于前代,其计算机使用(Computer Use)能力在 OSWorld 评测中取得显著进步。目前,该模型已在 API 及主流云平台同步上线,定价与 4.5 版本持平。

Anthropic

🍀在花频道 🍵茶馆聊天 📮投稿
来自频道: @zaihuapd
Loading comments...