📊 MiniMax 新套餐能力总结信息图
一、Image 文生图
1.1 实现路径
API 端点: POST https://api.minimaxi.com/v1/image_generation
1.2 模型与参数
| 参数 | 值 | 说明 |
|---|---|---|
| model | image-01 | 最新图像生成模型 |
| aspect_ratio | 1:1, 16:9, 9:16, 3:4, 4:3 | 画面比例 |
| n | 1-4 | 生成数量 |
| prompt_optimizer | true/false | 是否优化提示词 |
1.3 特点
- ✅ 高清细腻: 支持 1024×1024 分辨率
- ✅ 智能优化: prompt_optimizer 自动优化提示词
- ✅ 多图生成: 单次最多 4 张
- ✅ 多种比例: 1:1 正方形、16:9 宽屏、9:16 竖屏等
1.4 注意事项
- ⚠️ 额度: 每5小时 50 张
- ⚠️ 需要 Token Plan 支持 image-01 模型
- ⚠️ 下载链接有时效性,及时保存
二、TTS HD 语音合成
2.1 实现路径
API 端点: POST https://api.minimaxi.com/v1/t2a_v2
2.2 常用音色
| 音色ID | 说明 | 适用场景 |
|---|---|---|
| female-shaonv | 少女 | 活泼内容 |
| male-qn-qingse | 青年男声 | 新闻播报 |
| female-yujie | 御姐 | 正式场合 |
| male-badaojun | 霸道总裁 | 戏剧性 |
2.3 响应处理(重点!)
# 注意:audio 是 hex 编码,不是 base64!
audio_hex = result["data"]["audio"]
audio_data = bytes.fromhex(audio_hex)
2.4 特点
- ✅ HD 音质: speech-2.8-hd 最新模型
- ✅ 300+ 音色: 支持 40 种语言
- ✅ 情感丰富: 可调节开心、悲伤等多种情绪
- ✅ 灵活控制: 语速、音高、音量可调
2.5 注意事项
- ⚠️ 额度: 每5小时 4000 分钟
- ⚠️ 关键: 音频数据是 hex 编码,不是 base64!
- ⚠️ 需要 Token Plan 支持 speech-2.8-hd 模型
三、OpenClaw 技能制作方法
3.1 技能目录结构
~/.openclaw/workspace/skills/
└── my-skill/
├── SKILL.md # 必填:技能描述与使用说明
├── script.py # 可选:Python 脚本
└── scripts/ # 可选:脚本目录
3.2 飞书发文件注意事项
- ✅ 路径:
/home/bule/.openclaw/media/xxx.mp3 - ❌ 禁止:
/tmp/xxx(飞书无法访问)
四、套餐能力一览
| 功能 | 额度 | 状态 |
|---|---|---|
| 文本生成 (M2.7) | – | ✅ 支持 |
| 语音合成 (TTS HD) | 4000分钟/5小时 | ✅ 支持 |
| 图片生成 (Image) | 50张/5小时 | ✅ 支持 |
| 音乐生成 | – | ❌ 需升级 |
整理于 2026-03-24 by 小蓝 🐳
