Grok Imagine 图片生成
更新时间:2026-05-29
本文说明如何在本站调用 Grok Imagine 图片模型。用户只需要使用本站稳定模型名和 OpenAI 兼容图片接口。
1. 可用模型
| 模型 | 适用场景 | 计费口径 |
|---|---|---|
grok-imagine-image | 标准文生图、图片编辑 | 按输出图片、输入图片等组件计费 |
grok-imagine-image-quality | 更高质量的文生图、图片编辑 | 按质量档、清晰度、图片数量等组件计费 |
推荐普通生成和编辑先使用 grok-imagine-image。需要更高质量或更高分辨率时使用 grok-imagine-image-quality。
2. 接口概览
2.1 推荐:异步图片任务
POST /v1/images/tasks
GET /v1/images/tasks/{task_id}
异步任务适合 Grok 这类可能耗时较长的媒体生成。它支持文生图、图生图,且能透传本站支持的媒体参数,例如 resolution、aspect_ratio、output_format、num_images。
2.2 兼容:OpenAI 图片接口
POST /v1/images/generations
POST /v1/images/edits
这两个接口适合已经按 OpenAI 图片格式接入的客户端。/v1/images/edits 支持 JSON 图片 URL,也支持 multipart/form-data 上传图片文件。
2.3 认证
所有接口都使用 Bearer Token:
Authorization: Bearer sk-***
Content-Type: application/json
3. 快速开始
3.1 异步文生图
curl -X POST "{BASE_URL}/v1/images/tasks" \
-H "Authorization: Bearer sk-***" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-imagine-image",
"task_type": "text2image",
"prompt": "高端腕表广告图,黑色背景,金属反光克制,产品细节清晰,商业摄影,柔和轮廓光",
"aspect_ratio": "1:1",
"resolution": "1k",
"output_format": "jpeg",
"num_images": 1,
"response_format": "url"
}'
提交成功后会返回任务 ID:
{
"task_id": "task_xxx",
"status": "queued",
"progress": "0%",
"result_url": "",
"metadata": {
"task_type": "text2image"
},
"error": null
}
查询任务:
curl "{BASE_URL}/v1/images/tasks/task_xxx" \
-H "Authorization: Bearer sk-***"
完成后的典型响应:
{
"code": "success",
"message": "",
"data": {
"task_id": "task_xxx",
"status": "succeeded",
"progress": "100%",
"result_url": "https://example.com/result-1.jpeg",
"metadata": {
"task_type": "text2image",
"result_count": 1,
"result_urls": [
"https://example.com/result-1.jpeg"
]
},
"error": null
}
}
3.2 异步图片编辑
curl -X POST "{BASE_URL}/v1/images/tasks" \
-H "Authorization: Bearer sk-***" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-imagine-image-quality",
"task_type": "image2image",
"prompt": "保持主体结构不变,把画面改成奢侈品广告摄影风格,黑金色调,背景干净,产品边缘清晰",
"image": "https://example.com/source-watch.png",
"aspect_ratio": "auto",
"resolution": "2k",
"output_format": "webp",
"num_images": 2,
"response_format": "url"
}'
3.3 多参考图编辑
curl -X POST "{BASE_URL}/v1/images/tasks" \
-H "Authorization: Bearer sk-***" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-imagine-image-quality",
"task_type": "image2image",
"prompt": "把第一张图的产品放到第二张图的展台环境里,保持产品比例和材质一致,输出商业海报风格",
"images": [
"https://example.com/product.png",
"https://example.com/stage.png"
],
"aspect_ratio": "16:9",
"resolution": "2k",
"output_format": "png",
"num_images": 1,
"response_format": "url"
}'
3.4 同步文生图兼容调用
curl -X POST "{BASE_URL}/v1/images/generations" \
-H "Authorization: Bearer sk-***" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-imagine-image",
"prompt": "一张科技产品发布会主视觉,银色设备悬浮在深色舞台中央,灯光克制,高级感",
"n": 1,
"response_format": "url"
}'
典型响应:
{
"created": 1773980459,
"data": [
{
"url": "https://example.com/image.png",
"revised_prompt": ""
}
]
}
3.5 同步图片编辑兼容调用
JSON 图片 URL:
curl -X POST "{BASE_URL}/v1/images/edits" \
-H "Authorization: Bearer sk-***" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-imagine-image",
"prompt": "保留人物身份,把背景替换成夜晚城市街头,电影感,浅景深",
"image": "https://example.com/person.png",
"n": 1,
"response_format": "url"
}'
multipart 文件上传:
curl -X POST "{BASE_URL}/v1/images/edits" \
-H "Authorization: Bearer sk-***" \
-F "model=grok-imagine-image" \
-F "prompt=保留主体,改成高级棚拍产品图" \
-F "n=1" \
-F "response_format=url" \
-F "image=@/path/to/source.png"
4. 参数说明
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | string | 是 | grok-imagine-image 或 grok-imagine-image-quality |
prompt | string | 是 | 生成或编辑提示词 |
task_type | string | 否 | 异步任务使用,text2image 或 image2image;不传时平台会按是否有图片输入推断 |
image | string | 图生图必填 | 单张输入图片 URL;同步编辑和异步编辑都支持 |
images | string[] | 多图编辑必填 | 多张参考图 URL;推荐新接入使用该字段 |
image_url | string | 否 | 单图 URL 兼容字段 |
image_urls | string[] | 否 | 多图 URL 兼容字段 |
aspect_ratio | string | 否 | 输出比例;文生图常用 1:1、16:9、9:16、4:3、3:4,图片编辑可用 auto |
resolution | string | 否 | 清晰度档,常用 1k、2k;推荐在 /v1/images/tasks 中使用 |
output_format | string | 否 | jpeg、png、webp |
num_images | integer | 否 | 生成图片数量,通常 1-4;异步任务推荐使用 |
n | integer | 否 | OpenAI 兼容数量字段,默认 1 |
response_format | string | 否 | 推荐 url |
输入图建议:
- 单图用
image。 - 多图用
images。 - 不要同时混用
image、image_url、images、image_urls,避免重复输入。
5. 计费说明
Grok 图片在本站使用组件式计费,公开价格以模型广场展示为准。
| 场景 | 主要计费项 |
|---|---|
| 文生图 | 输出图片数量、清晰度档、质量档 |
| 图片编辑 | 输入图片数量、输出图片数量、清晰度档、质量档 |
公开价格以模型广场展示的组件单价为准,例如“输出图片 / 张”“输入图片 / 张”“高清输出图片 / 张”。提交时可能存在预扣,但预扣是任务风控和余额锁定,不等同于最终公开单价。
6. 常见错误
把视频模型发到图片接口
grok-imagine 是视频模型,应调用 /v1/videos 或兼容视频任务接口。
图片编辑没有传图片
/v1/images/edits 和 task_type=image2image 都必须传 image 或 images。
文生图传 aspect_ratio=auto
auto 更适合图片编辑。文生图建议明确传 1:1、16:9、9:16 等比例。
同步接口和异步接口混用字段
如果需要 resolution、num_images 等 Grok 媒体参数,优先使用 /v1/images/tasks。同步兼容接口适合简单 OpenAI 图片客户端。