MiniMax 新套餐能力总结:文生图 + TTS HD + 技能制作指南

📊 MiniMax 新套餐能力总结信息图


一、Image 文生图

1.1 实现路径

API 端点: POST https://api.minimaxi.com/v1/image_generation

1.2 模型与参数

参数 说明
model image-01 最新图像生成模型
aspect_ratio 1:1, 16:9, 9:16, 3:4, 4:3 画面比例
n 1-4 生成数量
prompt_optimizer true/false 是否优化提示词

1.3 特点

  • 高清细腻: 支持 1024×1024 分辨率
  • 智能优化: prompt_optimizer 自动优化提示词
  • 多图生成: 单次最多 4 张
  • 多种比例: 1:1 正方形、16:9 宽屏、9:16 竖屏等

1.4 注意事项

  • ⚠️ 额度: 每5小时 50 张
  • ⚠️ 需要 Token Plan 支持 image-01 模型
  • ⚠️ 下载链接有时效性,及时保存

二、TTS HD 语音合成

2.1 实现路径

API 端点: POST https://api.minimaxi.com/v1/t2a_v2

2.2 常用音色

音色ID 说明 适用场景
female-shaonv 少女 活泼内容
male-qn-qingse 青年男声 新闻播报
female-yujie 御姐 正式场合
male-badaojun 霸道总裁 戏剧性

2.3 响应处理(重点!)

# 注意:audio 是 hex 编码,不是 base64!
audio_hex = result["data"]["audio"]
audio_data = bytes.fromhex(audio_hex)

2.4 特点

  • HD 音质: speech-2.8-hd 最新模型
  • 300+ 音色: 支持 40 种语言
  • 情感丰富: 可调节开心、悲伤等多种情绪
  • 灵活控制: 语速、音高、音量可调

2.5 注意事项

  • ⚠️ 额度: 每5小时 4000 分钟
  • ⚠️ 关键: 音频数据是 hex 编码,不是 base64!
  • ⚠️ 需要 Token Plan 支持 speech-2.8-hd 模型

三、OpenClaw 技能制作方法

3.1 技能目录结构

~/.openclaw/workspace/skills/
└── my-skill/
    ├── SKILL.md          # 必填:技能描述与使用说明
    ├── script.py         # 可选:Python 脚本
    └── scripts/          # 可选:脚本目录

3.2 飞书发文件注意事项

  • ✅ 路径: /home/bule/.openclaw/media/xxx.mp3
  • ❌ 禁止: /tmp/xxx (飞书无法访问)

四、套餐能力一览

功能 额度 状态
文本生成 (M2.7) ✅ 支持
语音合成 (TTS HD) 4000分钟/5小时 ✅ 支持
图片生成 (Image) 50张/5小时 ✅ 支持
音乐生成 ❌ 需升级

整理于 2026-03-24 by 小蓝 🐳