文本生成推荐原厂直连

Claude 4.6 Sonnet

来自 Anthropic · 1M Token 上下文 · 更新于 2026-03-18

Claude 4.6 Sonnet 是 Anthropic 在 2026 年发布的中型旗舰模型，在通用推理、复杂工具调用、长上下文理解三项能力上达到行业前沿。尤其擅长 Agent 工作流——可以稳定调用多个工具、维持上下文一致性，并在 1M token 长文档中进行结构化检索。

能力维度

综合分 96/100

推理能力98

编码能力95

工具调用97

长文理解96

中文表现88

响应速度82

稳定运行中 · 平均延迟 380ms

输入 Token

¥0.034 ¥0.024 / 1K

输出 Token

¥0.10 ¥0.072 / 1K

展开缓存 / 多模态 3 种规格 ¥0.009 起

cache_text ¥0.009 / 1K

cache_image ¥0.015 / 1K

image_input ¥0.059 / 1K

较 Anthropic 官方刊例便宜 28%，月用量 > ¥10w 再享阶梯

阶梯价（输入）

月用量 < ¥1w¥0.024

¥1w – ¥10w¥0.022

¥10w – ¥50w¥0.020

> ¥50w联系商务

立即体验查看接入代码

原厂直连

数据零保留

10k QPS

99.99% SLA

在线体验接入代码能力与场景评测对比参数文档相似模型

在线体验 (演示用，登录后获完整 Playground)

打开完整 Playground →

Temperature 0.7

Max Tokens

Top-p

本次预估费用：¥0.002

你

写一个 Python 函数，使用二分查找在排序数组中找到目标元素。

def binary_search(arr, target):
    """在已排序数组中二分查找 target，返回索引或 -1"""
    lo, hi = 0, len(arr) - 1
    while lo <= hi:
        mid = (lo + hi) // 2
        if arr[mid] == target: return mid
        if arr[mid] < target: lo = mid + 1
        else: hi = mid - 1
    return -1

用时 1.2s · 154 tokens · ¥0.0017

Integration

3 行代码接入 Claude 4.6 Sonnet

完整 API 文档 →

# pip install openai
from openai import OpenAI

client = OpenAI(
    api_key="sk-suke-************",
    base_url="https://api.sukernel.ai/v1",
)

resp = client.chat.completions.create(
    model="claude-4-6-sonnet",
    messages=[
        {"role": "system", "content": "你是资深的算法工程师。"},
        {"role": "user", "content": "二分查找的时间复杂度推导"},
    ],
    max_tokens=2048,
    temperature=0.7,
)
print(resp.choices[0].message.content)

// npm i openai
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "sk-suke-************",
  baseURL: "https://api.sukernel.ai/v1",
});

const resp = await client.chat.completions.create({
  model: "claude-4-6-sonnet",
  messages: [
    { role: "system", content: "你是资深的算法工程师。" },
    { role: "user", content: "二分查找的时间复杂度推导" },
  ],
  max_tokens: 2048,
});
console.log(resp.choices[0].message.content);

curl https://api.sukernel.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-suke-************" \
  -d '{
    "model": "claude-4-6-sonnet",
    "messages": [
      {"role":"system","content":"你是资深的算法工程师。"},
      {"role":"user","content":"二分查找的时间复杂度推导"}
    ]
  }'

Capabilities & Use Cases

这个模型适合做什么

长文档分析

1M token 上下文，可一次性吃下 200 万字的合同 / 财报，精准抽取与结构化。

Agent / 工作流

业内最稳定的工具调用，适合搭建多步骤 Agent、自动化工作流、客服机器人。

代码与编程

复杂代码生成与重构、调试推理、跨文件引用追踪。HumanEval / SWE-bench 顶级。

知识库 / RAG

长文检索 + 大上下文混合策略，企业知识库问答精度更高、幻觉率更低。

Benchmarks

第三方评测

数据来源：LMSys、HELM、SWE-bench 公开数据，截至 2026-04。

评测集	Claude 4.6 Sonnet	GPT-5	Gemini 2.5 Pro	DeepSeek V3.5
MMLU-Pro	86.2	87.1	85.8	82.4
HumanEval (代码)	94.0	92.5	89.2	91.0
SWE-bench Verified	61.5	58.8	42.1	51.3
τ-bench (工具调用)	73.8	71.2	63.5	59.0
C-Eval (中文)	79.4	81.2	80.0	85.6
长文召回 (RULER 128K)	98.1	96.4	95.0	90.2

Parameters

参数与限制

通用参数列出在此，全部参数请参考完整 API 文档。

参数	类型	默认值	说明
model	string	—	模型 ID：claude-4-6-sonnet
messages	array	—	对话消息列表，包含 system / user / assistant 角色
max_tokens	integer	2048	输出最大 Token 数，上限 64K
temperature	number	0.7	采样温度，0–2
top_p	number	1.0	核采样阈值，0–1
stream	boolean	false	是否流式返回
tools	array	null	工具定义列表，用于函数调用 / Agent

最大上下文

1,000,000 tokens

最大输出

64,000 tokens

默认 QPS