1. 引言
you-token文档
  • 引言
    • 获取令牌
    • 一个完整的请求案例
    • 关于缓存创建与命中
    • 联系客服
    • 定价说明
    • 常见接口错误类型说明
  • 模型介绍
    • GPT 系列
    • Claude 系列
    • Gemini 系列
    • DeepSeek系列
    • 百度文心一言
    • 阿里通义千问
  • 模型接口
    • 模型查询相关
      • 模型列表查询
      • 令牌用量查询
      • 获取账号信息
    • 聊天(Chat)
      • OpenAI
        • 基础聊天(ChatCompletions格式)
          • 基础文本对话
          • 流式响应
          • 内容补全(早期接口)
          • PDF文件分析
          • 代码生成(codex)
          • 结构化输出
          • 联网搜索
          • GPTs对话
        • 会话聊天(Responses格式)
          • 基础文本响应
          • 图像分析响应
          • 网络搜索工具
          • 文件搜索工具
          • 计算机模拟
          • 深度研究
          • 函数调用
          • 推理能力
      • Google Gemini
        • 文本聊天
        • 媒体识别
        • 视频理解
      • Anthropic Claude
        • 文本生成
        • 图片理解
        • 深度思考
        • 函数调用
        • 联网搜索
        • 带缓存创建的文本对话
    • 图像(Images)
      • Midjourney
        • 文生图(Imagine)接口
        • 按钮点击(Action)接口
        • 图片融合(Blend)接口
        • 窗口执行(Modal)接口
        • 图生文(Describe)接口
        • 缩短提示词(Shorten)接口
        • 换脸(FaceSwap)接口
        • 上传(upload)接口
        • 查询接口
        • 批量查询接口
        • 获取种子(Seed)接口
        • 编辑图片(Edit)接口
        • 生成视频(Video)接口
      • OpenAI
        • 图片生成 / gpt-image-1.5
        • 图片生成 / dall-e-3
        • 图片编辑 / edits接口
        • 图片变体生成
        • gpt-4-all(生成图片)
      • Google Gemini
        • OpenAI聊天格式
          • 图片生成(Nano-banana2)
          • 图片生成 / Imagen 4
        • Gemini原生格式
          • 图像生成
      • 豆包(Doubao)
        • 文生图(纯文本输入单图输出)
        • 图文生图(单图输入单图输出)
        • 多图融合(多图输入单图输出)
        • 组图输出(多图输出)
      • 阿里通义千问
        • 文生图-Z-Image
        • 文生图
        • 文生图V2版
        • 文生图V1版
    • 视频(Videos)
      • OpenAI兼容接口
        • Veo 视频生成(OpenAI 兼容格式)
        • 查询视频生成状态 Copy
        • luma
        • runway
      • Veo 3
        • Veo 视频生成
        • 查询视频生成状态
      • Sora-2
        • Sora-2(创建视频)
        • Sora2官方接口(Chat格式)
        • 查询视频(异步任务)
        • 获取视频内容
      • 阿里通义千问
        • 通义万相2.6(创建视频)
        • 查询视频(异步任务)
      • 豆包(Doubao)
        • 豆包-文生视频
        • 查询视频
      • 可灵AI(Kling)
        • 可灵AI-文生视频
        • 可灵AI-文生视频kling-video-o1
        • 可灵AI-图生视频
      • 即梦(Jimeng)
        • 即梦AI-文生视频S2.0Pro
    • 音频(Audio)
      • 原生OpenAI格式
        • 文本转语音 / TTS
        • 语音转文本 / whisper-1
        • 语音转文本 / gpt-4o-transcribe
        • 音频翻译
        • Audio接口 / 输出
        • Audio接口 / 输入
        • MiniMax语音合成TTS
        • 豆包语音2.0
      • 原生Gemini格式
    • 音乐(Music)
      • Suno
        • 生成歌曲
        • 生成歌词
        • 上传音乐
        • 歌曲拼接
        • 单个查询任务
        • 批量查询任务
      • Udio
        • Udio(Chat格式)
    • 嵌入(Embeddings)
      • 创建文本嵌入(OpenAI)
      • 批量创建嵌入(OpenAI)
      • 创建文本嵌入(Gemini)
    • 重排序 (Rerank)
      • Jina AI 重排序格式
      • Cohere 重排序格式
      • Xinference 重排序格式
    • 审查(Moderations)
      • 创建内容审核
  1. 引言

定价说明

什么是模型#

AI 大模型,就是经过海量数据训练后固化下来的「神经网络结构+权重参数+推理逻辑」的整体,可以理解成 AI 的大脑本体。不同模型,能力、精度、成本、擅长任务完全不同。

为什么接口调用总以 model 参数为基准#

1.
定位唯一算力实例:服务商后台跑着很多不同模型/版本,model 是告诉服务器「用哪个大脑处理请求」。
2.
统一路由与计费:模型直接绑定算力、计费标准、功能权限,接口靠它做调度、计价、限流。
3.
行业通用规范:不管是 OpenAI、阿里、字节还是开源中转,都用 model 做最核心的标识,保证调用格式统一、可兼容。
一句话:model 是接口找到对应 AI 大脑的唯一钥匙。

关于模型的定价#

模型的官网定价规则是极为复杂的,但本中转平台屏蔽复杂细节,设计出标准定价模式
模型定价与官网正价对齐,不同模型的定价不同

三种定价方式#

定价方式适用场景计费基础
按tokens计费聊天、文本补全等大多数模型Token 数量
按次计费Midjourney、Suno、Sora 等任务型模型每次请求固定价格
按秒计费视频生成任务(如 Remix)秒数 × 模型价格

1. 按tokens计费#

计费公式:
最终额度 = (输入 tokens × 模型倍率 + 输出 tokens × 模型倍率 × 补全倍率) × 分组倍率 × 单位额度
涉及的倍率:
倍率类型配置键默认值说明
模型倍率ModelRatio模型特定基础计费倍率,每个模型不同
补全倍率CompletionRatio模型特定输出 tokens 的额外倍率
缓存倍率CacheRatio模型特定缓存读取的折扣倍率
缓存创建倍率CacheCreationRatio1.25缓存创建的额外倍率
分组倍率GroupRatio1.0用户分组的倍率
图片倍率ImageRatio1.0图片生成的倍率
音频倍率AudioRatio1.0音频输入的倍率
音频补全倍率AudioCompletionRatio1.0音频输出的倍率

2. 按次计费#

计费公式:
最终额度 = 模型价格 × 分组倍率 × 单位额度

3. 按秒计费#

计费公式:
最终额度 = 模型价格 × 秒数 × 分组倍率 × 单位额度
修改于 2026-03-16 14:55:01
上一页
联系客服
下一页
常见接口错误类型说明
Built with