Grok Imagine 图片生成

更新时间：2026-05-29

本文说明如何在本站调用 Grok Imagine 图片模型。用户只需要使用本站稳定模型名和 OpenAI 兼容图片接口。

1. 可用模型

模型	适用场景	计费口径
`grok-imagine-image`	标准文生图、图片编辑	按输出图片、输入图片等组件计费
`grok-imagine-image-quality`	更高质量的文生图、图片编辑	按质量档、清晰度、图片数量等组件计费

推荐普通生成和编辑先使用 grok-imagine-image。需要更高质量或更高分辨率时使用 grok-imagine-image-quality。

2. 接口概览

2.1 推荐：异步图片任务

POST /v1/images/tasks
GET  /v1/images/tasks/{task_id}

异步任务适合 Grok 这类可能耗时较长的媒体生成。它支持文生图、图生图，且能透传本站支持的媒体参数，例如 resolution、aspect_ratio、output_format、num_images。

2.2 兼容：OpenAI 图片接口

POST /v1/images/generations
POST /v1/images/edits

这两个接口适合已经按 OpenAI 图片格式接入的客户端。/v1/images/edits 支持 JSON 图片 URL，也支持 multipart/form-data 上传图片文件。

2.3 认证

所有接口都使用 Bearer Token：

Authorization: Bearer sk-***
Content-Type: application/json

3. 快速开始

3.1 异步文生图

curl -X POST "{BASE_URL}/v1/images/tasks" \
  -H "Authorization: Bearer sk-***" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-image",
    "task_type": "text2image",
    "prompt": "高端腕表广告图，黑色背景，金属反光克制，产品细节清晰，商业摄影，柔和轮廓光",
    "aspect_ratio": "1:1",
    "resolution": "1k",
    "output_format": "jpeg",
    "num_images": 1,
    "response_format": "url"
  }'

提交成功后会返回任务 ID：

{
  "task_id": "task_xxx",
  "status": "queued",
  "progress": "0%",
  "result_url": "",
  "metadata": {
    "task_type": "text2image"
  },
  "error": null
}

查询任务：

curl "{BASE_URL}/v1/images/tasks/task_xxx" \
  -H "Authorization: Bearer sk-***"

完成后的典型响应：

{
  "code": "success",
  "message": "",
  "data": {
    "task_id": "task_xxx",
    "status": "succeeded",
    "progress": "100%",
    "result_url": "https://example.com/result-1.jpeg",
    "metadata": {
      "task_type": "text2image",
      "result_count": 1,
      "result_urls": [
        "https://example.com/result-1.jpeg"
      ]
    },
    "error": null
  }
}

3.2 异步图片编辑

curl -X POST "{BASE_URL}/v1/images/tasks" \
  -H "Authorization: Bearer sk-***" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-image-quality",
    "task_type": "image2image",
    "prompt": "保持主体结构不变，把画面改成奢侈品广告摄影风格，黑金色调，背景干净，产品边缘清晰",
    "image": "https://example.com/source-watch.png",
    "aspect_ratio": "auto",
    "resolution": "2k",
    "output_format": "webp",
    "num_images": 2,
    "response_format": "url"
  }'

3.3 多参考图编辑

curl -X POST "{BASE_URL}/v1/images/tasks" \
  -H "Authorization: Bearer sk-***" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-image-quality",
    "task_type": "image2image",
    "prompt": "把第一张图的产品放到第二张图的展台环境里，保持产品比例和材质一致，输出商业海报风格",
    "images": [
      "https://example.com/product.png",
      "https://example.com/stage.png"
    ],
    "aspect_ratio": "16:9",
    "resolution": "2k",
    "output_format": "png",
    "num_images": 1,
    "response_format": "url"
  }'

3.4 同步文生图兼容调用

curl -X POST "{BASE_URL}/v1/images/generations" \
  -H "Authorization: Bearer sk-***" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-image",
    "prompt": "一张科技产品发布会主视觉，银色设备悬浮在深色舞台中央，灯光克制，高级感",
    "n": 1,
    "response_format": "url"
  }'

典型响应：

{
  "created": 1773980459,
  "data": [
    {
      "url": "https://example.com/image.png",
      "revised_prompt": ""
    }
  ]
}

3.5 同步图片编辑兼容调用

JSON 图片 URL：

curl -X POST "{BASE_URL}/v1/images/edits" \
  -H "Authorization: Bearer sk-***" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-image",
    "prompt": "保留人物身份，把背景替换成夜晚城市街头，电影感，浅景深",
    "image": "https://example.com/person.png",
    "n": 1,
    "response_format": "url"
  }'

multipart 文件上传：

curl -X POST "{BASE_URL}/v1/images/edits" \
  -H "Authorization: Bearer sk-***" \
  -F "model=grok-imagine-image" \
  -F "prompt=保留主体，改成高级棚拍产品图" \
  -F "n=1" \
  -F "response_format=url" \
  -F "image=@/path/to/source.png"

4. 参数说明

参数	类型	必填	说明
`model`	string	是	`grok-imagine-image` 或 `grok-imagine-image-quality`
`prompt`	string	是	生成或编辑提示词
`task_type`	string	否	异步任务使用，`text2image` 或 `image2image`；不传时平台会按是否有图片输入推断
`image`	string	图生图必填	单张输入图片 URL；同步编辑和异步编辑都支持
`images`	string[]	多图编辑必填	多张参考图 URL；推荐新接入使用该字段
`image_url`	string	否	单图 URL 兼容字段
`image_urls`	string[]	否	多图 URL 兼容字段
`aspect_ratio`	string	否	输出比例；文生图常用 `1:1`、`16:9`、`9:16`、`4:3`、`3:4`，图片编辑可用 `auto`
`resolution`	string	否	清晰度档，常用 `1k`、`2k`；推荐在 `/v1/images/tasks` 中使用
`output_format`	string	否	`jpeg`、`png`、`webp`
`num_images`	integer	否	生成图片数量，通常 `1-4`；异步任务推荐使用
`n`	integer	否	OpenAI 兼容数量字段，默认 `1`
`response_format`	string	否	推荐 `url`

输入图建议：

单图用 image。
多图用 images。
不要同时混用 image、image_url、images、image_urls，避免重复输入。

5. 计费说明

Grok 图片在本站使用组件式计费，公开价格以模型广场展示为准。

场景	主要计费项
文生图	输出图片数量、清晰度档、质量档
图片编辑	输入图片数量、输出图片数量、清晰度档、质量档

公开价格以模型广场展示的组件单价为准，例如“输出图片 / 张”“输入图片 / 张”“高清输出图片 / 张”。提交时可能存在预扣，但预扣是任务风控和余额锁定，不等同于最终公开单价。

6. 常见错误

把视频模型发到图片接口

grok-imagine 是视频模型，应调用 /v1/videos 或兼容视频任务接口。

图片编辑没有传图片

/v1/images/edits 和 task_type=image2image 都必须传 image 或 images。

文生图传 `aspect_ratio=auto`

auto 更适合图片编辑。文生图建议明确传 1:1、16:9、9:16 等比例。

同步接口和异步接口混用字段

如果需要 resolution、num_images 等 Grok 媒体参数，优先使用 /v1/images/tasks。同步兼容接口适合简单 OpenAI 图片客户端。

1. 可用模型​

2. 接口概览​

2.1 推荐：异步图片任务​

2.2 兼容：OpenAI 图片接口​

2.3 认证​

3. 快速开始​

3.1 异步文生图​

3.2 异步图片编辑​

3.3 多参考图编辑​

3.4 同步文生图兼容调用​

3.5 同步图片编辑兼容调用​

4. 参数说明​

5. 计费说明​

6. 常见错误​

把视频模型发到图片接口​

图片编辑没有传图片​

文生图传 aspect_ratio=auto​

同步接口和异步接口混用字段​