免费全模态 AI API:Agnes AI 实测与集成

免费全模态 AI API:Agnes AI 实测与集成

2026-06-07

2026 年 6 月 1 日,一家叫 Sapiens AI 的新加坡公司宣布,把旗下三款 AI 模型的 API 全部免费开放。文本、图像、视频——全模态、无限制、不收费。

这类消息日常被当作 PR 稿看。但实际用了一圈下来,有一些超出预期的地方,也有几个必须记下来的坑。

这篇文章把整个流程走了一遍:注册、配 key、调图片、调视频、踩坑、对比。

Agnes AI 是谁

Sapiens AI 这个名字你可能不熟。它家有几个指标值得注意:

  • 进入 Artificial Analysis 多个榜单 Top 10(Image Editing、Image to Video)
  • 注册用户 400 万+,日活 30 万
  • 拿了 2000 万美元融资

产品线覆盖得不小:主应用 Agnes(对话)、Pixa(图片生成)、Echo(语音)、AgnesClaw(Agent 自动化)。这次免费的是 API 层的三个模型。

三款模型的能力

模型 能力 免费额度
Agnes Chat Completion 文本对话、代码、推理 无限免费
Agnes Image 2.0/2.1 Flash 文生图、图生图、多图合成 无限免费
Agnes Video V2.0 文生视频、图生视频,支持原生音频 无限免费

“无限免费”的限制条件不多:有合理的速率限制(具体配额没明说,实测连续调几十次没出过问题),图片和视频生成有 2-5 秒排队。质量不是顶级水平——比如文生图打不过 wan2.7-image,视频的精细度比百炼稍差——但日常够用。

注册与配置

注册地址:platform.agnes-ai.com。创建 API Key 后,你拿到的是 sk- 开头的密钥。

API 地址:https://apihub.agnes-ai.com

配置到环境变量:

export AGNES_API_KEY="sk-xxxxx"
export AGNES_BASE_URL="https://apihub.agnes-ai.com"

Agnes 的 API 格式兼容 OpenAI,也就是说如果你之前用过 OpenAI 的 SDK,改一下 base_url 和 api_key 就能切过来。

配 Key 时的坑

sk- 开头的字符串在很多系统里会被安全机制截断。我写进 .env 后读出来发现只有前十几个字符——后面的没了。

# 验证方法
grep "^AGNES_API_KEY=" ~/.hermes/.env | head -1 | wc -c

正常返回应该是 64-66 字节。如果发现长度不对,说明被截断了。

解决方案:用 base64 编码后再写入,或做一次 encode/decode 处理。

import base64
key = base64.b64decode(b64_encoded_string).decode()
# 将 key 写入 .env

这个坑不止 Agnes 有。所有 sk- 前缀的 key(OpenAI、Claude、DeepSeek 等)都可能被同样的机制截断。

图片生成实测

Agnes 图片 API 的端点和 OpenAI 一致:

curl -X POST "https://apihub.agnes-ai.com/v1/images/generations" \
  -H "Authorization: Bearer $AGNES_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "agnes-image-2.1-flash",
    "prompt": "A luminous floating city above a misty canyon at sunrise, cinematic realism",
    "size": "1024x768",
    "n": 1,
    "extra_body": {"response_format": "url"}
  }'

测试了三种模式:

  • 文生图:纯 prompt + model + size,基础用法
  • 图生图:prompt + image 数组(传入一张或多张参考图)
  • 多图合成:多张 URL 作为 image 数组传入,合并风格

响应延迟 ~1-2 秒。生成的图片存储在 Google Cloud Storage。

图生图的细节

image 字段是必须的——如果你写了一个类似图生图的 prompt 但没传图片,API 不会报错,但会当作文生图处理,结果是一张重新生成的图而不是基于输入图的转换。

{
  "model": "agnes-image-2.1-flash",
  "prompt": "Apply watercolor style to this photo",
  "image": ["https://example.com/input-photo.jpg"],
  "extra_body": {"response_format": "url"}
}

response_format 的位置容易搞错

response_format 不能放在顶层,必须嵌套在 extra_body 里:

✅ {"extra_body": {"response_format": "url"}}
❌ {"response_format": "url"}  // → HTTP 400

视频生成实测

视频是异步任务模式,先提交任务,再轮询结果。

import urllib.request, json, time

url = "https://apihub.agnes-ai.com/v1/videos"
payload = {
    "model": "agnes-video-v2.0",
    "prompt": "A cat walking on a neon-lit street at night, cinematic quality",
    "num_frames": 121,
    "frame_rate": 24
}
req = urllib.request.Request(url, data=json.dumps(payload).encode(),
    headers={"Authorization": f"Bearer {api_key}",
             "Content-Type": "application/json"})

resp = json.loads(urllib.request.urlopen(req).read())
task_id = resp["task_id"]

# 轮询状态
while True:
    status_url = f"https://apihub.agnes-ai.com/agnesapi?video_id={task_id}"
    status_resp = json.loads(urllib.request.urlopen(
        urllib.request.Request(status_url,
            headers={"Authorization": f"Bearer {api_key}"})).read())
    if status_resp.get("status") == "completed":
        # 实际的 MP4 下载 URL
        video_url = status_resp.get("remixed_from_video_id")
        print(f"Video ready: {video_url}")
        break
    time.sleep(15)

视频的坑

num_frames 必须满足 8n+1。传 100 或 200 会返回 400。合法值:1, 9, 17, 25, … 121, … 441(最大)。121 帧在 24fps 下约 5 秒。

进度卡住是正常的。请求提交后进度会停在 30% 大约 90 秒,然后直接跳到 100%。不是卡了,是推理阶段进度反馈粗粒度。15 秒轮询一次就好,总共大约 2 分钟。

视频 URL 字段名有误导。返回值里装视频下载地址的字段叫 remixed_from_video_id——名字里带 _video_id,但值是完整的 MP4 URL。按名字猜会以为是个 ID,其实直接 GET 就能下载。

与其他方案对比

方案 图片生成 视频生成 价格
百炼 DashScope wan2.7-image(主力) Wan系列(按秒计费) 部分免费
商汤 SenseNova 文生图(1500次/5h) ❌ 不支持 免费
OpenAI 按量付费 额外付费
Agnes AI 文生图+图生图 文生视频+图生视频 全免费

一个实际的降级策略:

文生图:   wan2.7-image(百炼)→ sensenova(商汤)→ agnes-image
图生图:   wan2.6-image(百炼)→ agnes-image
文生视频: 百炼 Wan → Agnes Video

百炼的 wan2.7-image 质量最好,做主要方案。Agnes 的免费图生图和免费视频生成填补了其他免费方案的空白——商汤只支持文生图,不支持图生图和视频。

总结

Agnes AI 的定位很清楚:不是最好的模型,是最便宜的全模态方案。如果你需要:

  • 批量图片生成,不追求极致画质 → 优先用免费的 Agnes Image
  • 图生图但不想花百炼的额度 → Agnes 的图生图免费,好用
  • 低成本视频原型验证 → Agnes Video 免费跑,通过后再切付费方案
  • 高精度单张图或高质量视频 → 用百炼 wan 系列,付费也值

六年前的开发者福音是 GitHub Copilot 免费。现在我觉得类似的故事在 API 层重演——免费的全模态 API 把调用成本降到了零,唯一的障碍变成了你会不会写那几行 curl。