跳到主要内容
AI
MarkdownLLMs.txt

Grok Imagine 图片生成

更新时间:2026-05-29

本文说明如何在本站调用 Grok Imagine 图片模型。用户只需要使用本站稳定模型名和 OpenAI 兼容图片接口。

1. 可用模型

模型适用场景计费口径
grok-imagine-image标准文生图、图片编辑按输出图片、输入图片等组件计费
grok-imagine-image-quality更高质量的文生图、图片编辑按质量档、清晰度、图片数量等组件计费

推荐普通生成和编辑先使用 grok-imagine-image。需要更高质量或更高分辨率时使用 grok-imagine-image-quality

2. 接口概览

2.1 推荐:异步图片任务

POST /v1/images/tasks
GET /v1/images/tasks/{task_id}

异步任务适合 Grok 这类可能耗时较长的媒体生成。它支持文生图、图生图,且能透传本站支持的媒体参数,例如 resolutionaspect_ratiooutput_formatnum_images

2.2 兼容:OpenAI 图片接口

POST /v1/images/generations
POST /v1/images/edits

这两个接口适合已经按 OpenAI 图片格式接入的客户端。/v1/images/edits 支持 JSON 图片 URL,也支持 multipart/form-data 上传图片文件。

2.3 认证

所有接口都使用 Bearer Token:

Authorization: Bearer sk-***
Content-Type: application/json

3. 快速开始

3.1 异步文生图

curl -X POST "{BASE_URL}/v1/images/tasks" \
-H "Authorization: Bearer sk-***" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-imagine-image",
"task_type": "text2image",
"prompt": "高端腕表广告图,黑色背景,金属反光克制,产品细节清晰,商业摄影,柔和轮廓光",
"aspect_ratio": "1:1",
"resolution": "1k",
"output_format": "jpeg",
"num_images": 1,
"response_format": "url"
}'

提交成功后会返回任务 ID:

{
"task_id": "task_xxx",
"status": "queued",
"progress": "0%",
"result_url": "",
"metadata": {
"task_type": "text2image"
},
"error": null
}

查询任务:

curl "{BASE_URL}/v1/images/tasks/task_xxx" \
-H "Authorization: Bearer sk-***"

完成后的典型响应:

{
"code": "success",
"message": "",
"data": {
"task_id": "task_xxx",
"status": "succeeded",
"progress": "100%",
"result_url": "https://example.com/result-1.jpeg",
"metadata": {
"task_type": "text2image",
"result_count": 1,
"result_urls": [
"https://example.com/result-1.jpeg"
]
},
"error": null
}
}

3.2 异步图片编辑

curl -X POST "{BASE_URL}/v1/images/tasks" \
-H "Authorization: Bearer sk-***" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-imagine-image-quality",
"task_type": "image2image",
"prompt": "保持主体结构不变,把画面改成奢侈品广告摄影风格,黑金色调,背景干净,产品边缘清晰",
"image": "https://example.com/source-watch.png",
"aspect_ratio": "auto",
"resolution": "2k",
"output_format": "webp",
"num_images": 2,
"response_format": "url"
}'

3.3 多参考图编辑

curl -X POST "{BASE_URL}/v1/images/tasks" \
-H "Authorization: Bearer sk-***" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-imagine-image-quality",
"task_type": "image2image",
"prompt": "把第一张图的产品放到第二张图的展台环境里,保持产品比例和材质一致,输出商业海报风格",
"images": [
"https://example.com/product.png",
"https://example.com/stage.png"
],
"aspect_ratio": "16:9",
"resolution": "2k",
"output_format": "png",
"num_images": 1,
"response_format": "url"
}'

3.4 同步文生图兼容调用

curl -X POST "{BASE_URL}/v1/images/generations" \
-H "Authorization: Bearer sk-***" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-imagine-image",
"prompt": "一张科技产品发布会主视觉,银色设备悬浮在深色舞台中央,灯光克制,高级感",
"n": 1,
"response_format": "url"
}'

典型响应:

{
"created": 1773980459,
"data": [
{
"url": "https://example.com/image.png",
"revised_prompt": ""
}
]
}

3.5 同步图片编辑兼容调用

JSON 图片 URL:

curl -X POST "{BASE_URL}/v1/images/edits" \
-H "Authorization: Bearer sk-***" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-imagine-image",
"prompt": "保留人物身份,把背景替换成夜晚城市街头,电影感,浅景深",
"image": "https://example.com/person.png",
"n": 1,
"response_format": "url"
}'

multipart 文件上传:

curl -X POST "{BASE_URL}/v1/images/edits" \
-H "Authorization: Bearer sk-***" \
-F "model=grok-imagine-image" \
-F "prompt=保留主体,改成高级棚拍产品图" \
-F "n=1" \
-F "response_format=url" \
-F "image=@/path/to/source.png"

4. 参数说明

参数类型必填说明
modelstringgrok-imagine-imagegrok-imagine-image-quality
promptstring生成或编辑提示词
task_typestring异步任务使用,text2imageimage2image;不传时平台会按是否有图片输入推断
imagestring图生图必填单张输入图片 URL;同步编辑和异步编辑都支持
imagesstring[]多图编辑必填多张参考图 URL;推荐新接入使用该字段
image_urlstring单图 URL 兼容字段
image_urlsstring[]多图 URL 兼容字段
aspect_ratiostring输出比例;文生图常用 1:116:99:164:33:4,图片编辑可用 auto
resolutionstring清晰度档,常用 1k2k;推荐在 /v1/images/tasks 中使用
output_formatstringjpegpngwebp
num_imagesinteger生成图片数量,通常 1-4;异步任务推荐使用
nintegerOpenAI 兼容数量字段,默认 1
response_formatstring推荐 url

输入图建议:

  • 单图用 image
  • 多图用 images
  • 不要同时混用 imageimage_urlimagesimage_urls,避免重复输入。

5. 计费说明

Grok 图片在本站使用组件式计费,公开价格以模型广场展示为准。

场景主要计费项
文生图输出图片数量、清晰度档、质量档
图片编辑输入图片数量、输出图片数量、清晰度档、质量档

公开价格以模型广场展示的组件单价为准,例如“输出图片 / 张”“输入图片 / 张”“高清输出图片 / 张”。提交时可能存在预扣,但预扣是任务风控和余额锁定,不等同于最终公开单价。

6. 常见错误

把视频模型发到图片接口

grok-imagine 是视频模型,应调用 /v1/videos 或兼容视频任务接口。

图片编辑没有传图片

/v1/images/editstask_type=image2image 都必须传 imageimages

文生图传 aspect_ratio=auto

auto 更适合图片编辑。文生图建议明确传 1:116:99:16 等比例。

同步接口和异步接口混用字段

如果需要 resolutionnum_images 等 Grok 媒体参数,优先使用 /v1/images/tasks。同步兼容接口适合简单 OpenAI 图片客户端。