速核 AI
首页 / 模型广场 / 文本生成 / Claude 4.6 Sonnet
A
文本生成 推荐 原厂直连

Claude 4.6 Sonnet

来自 Anthropic · 1M Token 上下文 · 更新于 2026-03-18

Claude 4.6 Sonnet 是 Anthropic 在 2026 年发布的中型旗舰模型,在通用推理、复杂工具调用、长上下文理解三项能力上达到行业前沿。尤其擅长 Agent 工作流——可以稳定调用多个工具、维持上下文一致性,并在 1M token 长文档中进行结构化检索。

能力维度
综合分 96/100
推理能力98
编码能力95
工具调用97
长文理解96
中文表现88
响应速度82
在线体验 接入代码 能力与场景 评测对比 参数文档 相似模型

在线体验 (演示用,登录后获完整 Playground)

打开完整 Playground →
Temperature 0.7
Max Tokens
Top-p
本次预估费用:¥0.002
写一个 Python 函数,使用二分查找在排序数组中找到目标元素。
A
def binary_search(arr, target):
    """在已排序数组中二分查找 target,返回索引或 -1"""
    lo, hi = 0, len(arr) - 1
    while lo <= hi:
        mid = (lo + hi) // 2
        if arr[mid] == target: return mid
        if arr[mid] < target: lo = mid + 1
        else: hi = mid - 1
    return -1
用时 1.2s · 154 tokens · ¥0.0017
Integration

3 行代码接入 Claude 4.6 Sonnet

完整 API 文档 →
# pip install openai
from openai import OpenAI

client = OpenAI(
    api_key="sk-suke-************",
    base_url="https://api.sukernel.ai/v1",
)

resp = client.chat.completions.create(
    model="claude-4-6-sonnet",
    messages=[
        {"role": "system", "content": "你是资深的算法工程师。"},
        {"role": "user", "content": "二分查找的时间复杂度推导"},
    ],
    max_tokens=2048,
    temperature=0.7,
)
print(resp.choices[0].message.content)
Capabilities & Use Cases

这个模型适合做什么

长文档分析

1M token 上下文,可一次性吃下 200 万字的合同 / 财报,精准抽取与结构化。

Agent / 工作流

业内最稳定的工具调用,适合搭建多步骤 Agent、自动化工作流、客服机器人。

代码与编程

复杂代码生成与重构、调试推理、跨文件引用追踪。HumanEval / SWE-bench 顶级。

知识库 / RAG

长文检索 + 大上下文混合策略,企业知识库问答精度更高、幻觉率更低。

Benchmarks

第三方评测

数据来源:LMSys、HELM、SWE-bench 公开数据,截至 2026-04。

评测集 Claude 4.6 Sonnet GPT-5 Gemini 2.5 Pro DeepSeek V3.5
MMLU-Pro 86.2 87.1 85.8 82.4
HumanEval (代码) 94.0 92.5 89.2 91.0
SWE-bench Verified 61.5 58.8 42.1 51.3
τ-bench (工具调用) 73.8 71.2 63.5 59.0
C-Eval (中文) 79.4 81.2 80.0 85.6
长文召回 (RULER 128K) 98.1 96.4 95.0 90.2
Parameters

参数与限制

通用参数列出在此,全部参数请参考完整 API 文档

参数 类型 默认值 说明
modelstring模型 ID:claude-4-6-sonnet
messagesarray对话消息列表,包含 system / user / assistant 角色
max_tokensinteger2048输出最大 Token 数,上限 64K
temperaturenumber0.7采样温度,0–2
top_pnumber1.0核采样阈值,0–1
streambooleanfalse是否流式返回
toolsarraynull工具定义列表,用于函数调用 / Agent
最大上下文
1,000,000 tokens
最大输出
64,000 tokens
默认 QPS
200 可申请上调