Skip to main content

AI LLM API

  • 场景
    • 补全
    • 对话
    • 代码生成
    • Agentic / Coding Agent
  • 标准
    • OpenAI API
      • 大多数早期应用,事实标准
      • Codex - 使用量少
    • Anthropic API
      • Claude Code - 非常核心的应用场景
    • Gemini API
      • Gemini CLI - 场景越来越多,主要是开源驱动

功能

  • 输入
    • 对话管理
    • Batch
    • 缓存管理 - 成本考虑核心,特别是 代码生成 场景
    • WebSearch
    • Assistant
    • Image
    • File/Workspace
  • 过程
    • Computer Use
    • MCP
    • 工具/Tool
    • Code Interpreter
    • Reasoning
  • 输出
    • Streaming
    • JSON & JSON Schema / 结构化输出
    • Sampling
      • seed
      • temperature
      • top_p
      • top_k
      • top_logprobs
      • presence_penalty
      • frequency_penalty
      • max_completions_tokens
tip
  • 第一阶段
    • 只需要直接往后生成
    • /v1/completions
  • 第二阶段
    • 对话
    • 客户端同步管理对话状态和上下文
    • /v1/chat/completions
  • 第三阶段
    • Workflow
    • 复杂对话场景
    • 交互式对话、工具调用、外部集成
    • 服务端管理对话状态
    • 服务端异步处理对话
    • 服务端精细化缓存控制
    • 有状态
    • /v1/responses
  • 第四阶段 - 个人猜测
    • Workspace & Context
    • LSP
    • Dynamic MCP

Endpoints

  • OpenAI
    • /chat/completions
    • /completions
  • Anthropic
    • /v1/messages

Response

BatchAPI

Mock

FAQ

Limits

Anthropic

类别项目限制触发条件/备注
请求大小Messages API / Token Counting API32 MB超过返回 413 request_too_large
请求大小Batch API256 MB 或 100,000 Message 请求(先达者)批量异步
文件Files API(单文件)500 MB仅文件上传
图像尺寸单张图像(Vision)最大 8000 × 8000 像素仍受 32 MB 请求总大小约束
图像尺寸多张图(>20 张提交)每张最大 2000 × 2000 像素适用于一次提交大量图像
图像大小单张文件大小5 MB超过需压缩/裁剪
图像数量claude.ai 前端最多 20 张交互界面
图像数量API最多 100 张编程调用
统一说明请求总体图像+文本合计不得超 32 MB超限需拆分

注意:图像限制同时受单图尺寸、单图文件大小与整体请求 32 MB 约束。超过任一限制返回 413 request_too_large。

OpenAI

组织级

维度项目 / 场景限制说明
存储组织总文件体积100 GB可申请提升;与 Assistants / 前端共享
存储单用户总文件体积10 GBChatGPT / GPTs 前端
请求常见单请求载荷约 25 MB超限触发 413 / Maximum content size
上下文(隐含)受模型上下文 / token 规则视模型而定大文件需分块 / 检索式拼接

功能与资源级

分类项目 / 场景限制说明 / 关键点
Assistantscode_interpreter 附件数20 个运行临时文件
Assistantsfile_search 向量库文件数10,000 个Vector Store 总数
Assistants单文件大小512 MB仍受 tokens 限制
Assistants单文件最大 tokens5,000,000 tokens预处理后计数
Batch API单批输入文件大小100 MB
Batch API单批请求数50,000异步执行
Batch API/v1/embeddings 批次总输入50,000 条与 embeddings 规则一致
Embeddings单批全部输入50,000 条需分批控制
图像生成dall-e-2PNG < 4 MB通常方形
图像生成gpt-image-1PNG / WebP / JPG < 25 MB
音频Audio API 输入文件25 MB转写 / 语音处理
语音合成TTS 文本输入4096 字符按字符计
ChatGPT 前端通用文件(单文件)512 MB与 Assistants 对齐
ChatGPT 前端文本/文档 tokens2,000,000 tokens表格类除外
ChatGPT 前端CSV / 表格文件约 50 MB取决列/行结构
ChatGPT 前端单张图像20 MB

  • 错误风险
    • 413 / content size
    • Token 超限
  • 优化建议
    • 大文件处理 - 分块 + embeddings 检索 - 避免整块发送
    • 预处理 - 统计 token - 防止超限浪费
    • 文件策略 - 结构化→解析→向量库 - 不直接塞原始大文本
    • 监控 - 记录大小 / token / 批次命中率 - 提升成本效率

/v1/completions vs /v1/chat/completions vs /v1/responses

  • /v1/chat/completions
    • messages
  • /v1/completions
    • 已弃用 不推荐在新项目中使用
    • prompt
  • /v1/responses
  • /v1/conversations
    • 对话管理