2026 年 6 月 1 日,一家叫 Sapiens AI 的新加坡公司宣布,把旗下三款 AI 模型的 API 全部免费开放。文本、图像、视频——全模态、无限制、不收费。
这类消息日常被当作 PR 稿看。但实际用了一圈下来,有一些超出预期的地方,也有几个必须记下来的坑。
这篇文章把整个流程走了一遍:注册、配 key、调图片、调视频、踩坑、对比。
Agnes AI 是谁
Sapiens AI 这个名字你可能不熟。它家有几个指标值得注意:
- 进入 Artificial Analysis 多个榜单 Top 10(Image Editing、Image to Video)
- 注册用户 400 万+,日活 30 万
- 拿了 2000 万美元融资
产品线覆盖得不小:主应用 Agnes(对话)、Pixa(图片生成)、Echo(语音)、AgnesClaw(Agent 自动化)。这次免费的是 API 层的三个模型。
三款模型的能力
| 模型 | 能力 | 免费额度 |
|---|---|---|
| Agnes Chat Completion | 文本对话、代码、推理 | 无限免费 |
| Agnes Image 2.0/2.1 Flash | 文生图、图生图、多图合成 | 无限免费 |
| Agnes Video V2.0 | 文生视频、图生视频,支持原生音频 | 无限免费 |
“无限免费”的限制条件不多:有合理的速率限制(具体配额没明说,实测连续调几十次没出过问题),图片和视频生成有 2-5 秒排队。质量不是顶级水平——比如文生图打不过 wan2.7-image,视频的精细度比百炼稍差——但日常够用。

注册与配置
注册地址:platform.agnes-ai.com。创建 API Key 后,你拿到的是 sk- 开头的密钥。
API 地址:https://apihub.agnes-ai.com
配置到环境变量:
export AGNES_API_KEY="sk-xxxxx"
export AGNES_BASE_URL="https://apihub.agnes-ai.com"
Agnes 的 API 格式兼容 OpenAI,也就是说如果你之前用过 OpenAI 的 SDK,改一下 base_url 和 api_key 就能切过来。
配 Key 时的坑
sk- 开头的字符串在很多系统里会被安全机制截断。我写进 .env 后读出来发现只有前十几个字符——后面的没了。
# 验证方法
grep "^AGNES_API_KEY=" ~/.hermes/.env | head -1 | wc -c
正常返回应该是 64-66 字节。如果发现长度不对,说明被截断了。
解决方案:用 base64 编码后再写入,或做一次 encode/decode 处理。
import base64
key = base64.b64decode(b64_encoded_string).decode()
# 将 key 写入 .env
这个坑不止 Agnes 有。所有 sk- 前缀的 key(OpenAI、Claude、DeepSeek 等)都可能被同样的机制截断。
图片生成实测
Agnes 图片 API 的端点和 OpenAI 一致:
curl -X POST "https://apihub.agnes-ai.com/v1/images/generations" \
-H "Authorization: Bearer $AGNES_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "agnes-image-2.1-flash",
"prompt": "A luminous floating city above a misty canyon at sunrise, cinematic realism",
"size": "1024x768",
"n": 1,
"extra_body": {"response_format": "url"}
}'
测试了三种模式:
- 文生图:纯 prompt + model + size,基础用法
- 图生图:prompt + image 数组(传入一张或多张参考图)
- 多图合成:多张 URL 作为
image数组传入,合并风格
响应延迟 ~1-2 秒。生成的图片存储在 Google Cloud Storage。
图生图的细节
传 image 字段是必须的——如果你写了一个类似图生图的 prompt 但没传图片,API 不会报错,但会当作文生图处理,结果是一张重新生成的图而不是基于输入图的转换。
{
"model": "agnes-image-2.1-flash",
"prompt": "Apply watercolor style to this photo",
"image": ["https://example.com/input-photo.jpg"],
"extra_body": {"response_format": "url"}
}
response_format 的位置容易搞错
response_format 不能放在顶层,必须嵌套在 extra_body 里:
✅ {"extra_body": {"response_format": "url"}}
❌ {"response_format": "url"} // → HTTP 400
视频生成实测
视频是异步任务模式,先提交任务,再轮询结果。
import urllib.request, json, time
url = "https://apihub.agnes-ai.com/v1/videos"
payload = {
"model": "agnes-video-v2.0",
"prompt": "A cat walking on a neon-lit street at night, cinematic quality",
"num_frames": 121,
"frame_rate": 24
}
req = urllib.request.Request(url, data=json.dumps(payload).encode(),
headers={"Authorization": f"Bearer {api_key}",
"Content-Type": "application/json"})
resp = json.loads(urllib.request.urlopen(req).read())
task_id = resp["task_id"]
# 轮询状态
while True:
status_url = f"https://apihub.agnes-ai.com/agnesapi?video_id={task_id}"
status_resp = json.loads(urllib.request.urlopen(
urllib.request.Request(status_url,
headers={"Authorization": f"Bearer {api_key}"})).read())
if status_resp.get("status") == "completed":
# 实际的 MP4 下载 URL
video_url = status_resp.get("remixed_from_video_id")
print(f"Video ready: {video_url}")
break
time.sleep(15)

视频的坑
num_frames 必须满足 8n+1。传 100 或 200 会返回 400。合法值:1, 9, 17, 25, … 121, … 441(最大)。121 帧在 24fps 下约 5 秒。
进度卡住是正常的。请求提交后进度会停在 30% 大约 90 秒,然后直接跳到 100%。不是卡了,是推理阶段进度反馈粗粒度。15 秒轮询一次就好,总共大约 2 分钟。
视频 URL 字段名有误导。返回值里装视频下载地址的字段叫 remixed_from_video_id——名字里带 _video_id,但值是完整的 MP4 URL。按名字猜会以为是个 ID,其实直接 GET 就能下载。
与其他方案对比
| 方案 | 图片生成 | 视频生成 | 价格 |
|---|---|---|---|
| 百炼 DashScope | wan2.7-image(主力) | Wan系列(按秒计费) | 部分免费 |
| 商汤 SenseNova | 文生图(1500次/5h) | ❌ 不支持 | 免费 |
| OpenAI | 按量付费 | 额外付费 | 贵 |
| Agnes AI | 文生图+图生图 | 文生视频+图生视频 | 全免费 |
一个实际的降级策略:
文生图: wan2.7-image(百炼)→ sensenova(商汤)→ agnes-image
图生图: wan2.6-image(百炼)→ agnes-image
文生视频: 百炼 Wan → Agnes Video
百炼的 wan2.7-image 质量最好,做主要方案。Agnes 的免费图生图和免费视频生成填补了其他免费方案的空白——商汤只支持文生图,不支持图生图和视频。
总结
Agnes AI 的定位很清楚:不是最好的模型,是最便宜的全模态方案。如果你需要:
- 批量图片生成,不追求极致画质 → 优先用免费的 Agnes Image
- 图生图但不想花百炼的额度 → Agnes 的图生图免费,好用
- 低成本视频原型验证 → Agnes Video 免费跑,通过后再切付费方案
- 高精度单张图或高质量视频 → 用百炼 wan 系列,付费也值
六年前的开发者福音是 GitHub Copilot 免费。现在我觉得类似的故事在 API 层重演——免费的全模态 API 把调用成本降到了零,唯一的障碍变成了你会不会写那几行 curl。