1. OpenAI
you-token文档
  • 引言
    • 获取令牌
    • 一个完整的请求案例
    • 关于缓存创建与命中
    • 联系客服
    • 定价说明
    • 常见接口错误类型说明
  • 模型介绍
    • GPT 系列
    • Claude 系列
    • Gemini 系列
    • DeepSeek系列
    • 百度文心一言
    • 阿里通义千问
  • 模型接口
    • 模型查询相关
      • 模型列表查询
      • 令牌用量查询
      • 获取账号信息
    • 聊天(Chat)
      • OpenAI
        • 基础聊天(ChatCompletions格式)
          • 基础文本对话
          • 流式响应
          • 内容补全(早期接口)
          • PDF文件分析
          • 代码生成(codex)
          • 结构化输出
          • 联网搜索
          • GPTs对话
        • 会话聊天(Responses格式)
          • 基础文本响应
          • 图像分析响应
          • 网络搜索工具
          • 文件搜索工具
          • 计算机模拟
          • 深度研究
          • 函数调用
          • 推理能力
      • Google Gemini
        • 文本聊天
        • 媒体识别
        • 视频理解
      • Anthropic Claude
        • 文本生成
        • 图片理解
        • 深度思考
        • 函数调用
        • 联网搜索
        • 带缓存创建的文本对话
    • 图像(Images)
      • Midjourney
        • 文生图(Imagine)接口
        • 按钮点击(Action)接口
        • 图片融合(Blend)接口
        • 窗口执行(Modal)接口
        • 图生文(Describe)接口
        • 缩短提示词(Shorten)接口
        • 换脸(FaceSwap)接口
        • 上传(upload)接口
        • 查询接口
        • 批量查询接口
        • 获取种子(Seed)接口
        • 编辑图片(Edit)接口
        • 生成视频(Video)接口
      • OpenAI
        • 图片生成 / gpt-image-1.5
          POST
        • 图片生成 / dall-e-3
          POST
        • 图片编辑 / edits接口
          POST
        • 图片变体生成
          POST
        • gpt-4-all(生成图片)
          POST
      • Google Gemini
        • OpenAI聊天格式
          • 图片生成(Nano-banana2)
          • 图片生成 / Imagen 4
        • Gemini原生格式
          • 图像生成
      • 豆包(Doubao)
        • 文生图(纯文本输入单图输出)
        • 图文生图(单图输入单图输出)
        • 多图融合(多图输入单图输出)
        • 组图输出(多图输出)
      • 阿里通义千问
        • 文生图-Z-Image
        • 文生图
        • 文生图V2版
        • 文生图V1版
    • 视频(Videos)
      • OpenAI兼容接口
        • Veo 视频生成(OpenAI 兼容格式)
        • 查询视频生成状态 Copy
        • luma
        • runway
      • Veo 3
        • Veo 视频生成
        • 查询视频生成状态
      • Sora-2
        • Sora-2(创建视频)
        • Sora2官方接口(Chat格式)
        • 查询视频(异步任务)
        • 获取视频内容
      • 阿里通义千问
        • 通义万相2.6(创建视频)
        • 查询视频(异步任务)
      • 豆包(Doubao)
        • 豆包-文生视频
        • 查询视频
      • 可灵AI(Kling)
        • 可灵AI-文生视频
        • 可灵AI-文生视频kling-video-o1
        • 可灵AI-图生视频
      • 即梦(Jimeng)
        • 即梦AI-文生视频S2.0Pro
    • 音频(Audio)
      • 原生OpenAI格式
        • 文本转语音 / TTS
        • 语音转文本 / whisper-1
        • 语音转文本 / gpt-4o-transcribe
        • 音频翻译
        • Audio接口 / 输出
        • Audio接口 / 输入
        • MiniMax语音合成TTS
        • 豆包语音2.0
      • 原生Gemini格式
    • 音乐(Music)
      • Suno
        • 生成歌曲
        • 生成歌词
        • 上传音乐
        • 歌曲拼接
        • 单个查询任务
        • 批量查询任务
      • Udio
        • Udio(Chat格式)
    • 嵌入(Embeddings)
      • 创建文本嵌入(OpenAI)
      • 批量创建嵌入(OpenAI)
      • 创建文本嵌入(Gemini)
    • 重排序 (Rerank)
      • Jina AI 重排序格式
      • Cohere 重排序格式
      • Xinference 重排序格式
    • 审查(Moderations)
      • 创建内容审核
  1. OpenAI

图片编辑 / edits接口

POST
v1/images/edits
根据一个或多个原始图片和提示创建编辑或扩展的图片。此端点支持 dall-e-2 和 gpt-image-1 模型。
官方文档:https://platform.openai.com/docs/api-reference/images/createEdit
注意事项:
还在世的艺术家名称(如「宫崎骏」、「新海诚」等)会触发 moderation_blocked 报错,导致生成失败。你可以通过「吉卜力」、「明亮的现代日式动漫风格」等非敏感词来规避。衣着暴露或含有暗示的图片同理。
总的来说,「风格」比「艺术家」安全,像是「皮克斯」也是支持的。
更稳妥的做法是采用已故艺术家或对应的风格,如「梵高」、「蒙娜丽莎」等。
对于单次请求生成 2-10 张图片的情况,如果系统检测到请求涉嫌违反平台政策,该请求中的违规部分将不会被生成。这可能导致实际生成图片数量少于用户请求数量,然而多图的情况下,不会抛出 moderation_blocked。 因此,请在创作中主动规避潜在的知识产权(IP)或版权问题,以减少生成被系统拦截的风险,确保创作顺利完成。
✍️ 关键提示:
避免直接使用已知的受版权保护角色、品牌标志、名人肖像等
可以采用「风格借鉴」「创意改编」「泛指描述」等方式表达
若需引用特定元素,请提前确认该元素是否处于公有领域
实用提示
支持任何语言,中文绘制也很稳定,但我们也不建议绘制大量的文本
size 参数不支持显示传入 size=“auto”,默认即 auto
画幅比例可以在 prompt 中指定,支持 2:3、3:2、1:1,也可以在 size 参数中设置。
支持控制敏感度的 moderation 参数,但这个参数设为 low 也可能被拒,比如说维纳斯过于暴露
edits 端口不支持 moderation 参数
文本描述和参考图搭配,融图效果更准确
上传的图片可以做压缩预处理,提升速度
支持透明背景,免抠图。——只需要在 Prompt 中补充要求

请求参数

Authorization
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
Body 参数application/json必填

示例
{
    "model": "dall-e-3",
    "quality": "hd",
    "prompt": "a white siamese cat",
    "n": 1,
    "size": "1024x1024"
}

请求示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'v1/images/edits' \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data-raw '{
    "model": "dall-e-3",
    "quality": "hd",
    "prompt": "a white siamese cat",
    "n": 1,
    "size": "1024x1024"
}'

返回响应

🟢200成功
application/json
Body

示例
{
    "created": 1760483997,
    "data": [
        {
            "revised_prompt": "A white Siamese cat with sleek fur and bright blue eyes, sitting elegantly on a soft cushion by a sunny window. The sunlight is streaming through the window, creating a warm and cozy ambiance. The background features a blurred view of a garden outside the window, hinting at flowers and greenery, while the cat exudes an air of grace and poise.",
            "url": "https://dalleprodsec.blob.core.windows.net/private/images/971071d6-3b7f-4a71-ab81-a5799a148628/generated_00.png?se=2025-10-15T23%3A20%3A12Z&sig=ko7zSeMfSXPv2X5o0RJal5KbURn5qUUgCHtwMEmJHtk%3D&ske=2025-10-15T19%3A00%3A58Z&skoid=e52d5ed7-0657-4f62-bc12-7e5dbb260a96&sks=b&skt=2025-10-08T19%3A00%3A58Z&sktid=33e01921-4d64-4f8c-a055-5bdaffd5e33d&skv=2020-10-02&sp=r&spr=https&sr=b&sv=2020-10-02"
        }
    ]
}
修改于 2026-03-16 14:55:01
上一页
图片生成 / dall-e-3
下一页
图片变体生成
Built with