返回万音首页
🔊 给 AI 提供发声能力的能力层

先做成 skill, 再长成平台

万音第一版不追求大而全,先把最关键的闭环跑通: AI 输出文本 → 调用灵音能力 → 生成语音结果 → 可播放 / 可发送 / 可集成。 这里可以这样理解:万音是整个项目,灵音是第一阶段发声能力,当前网站则负责把方向、Demo 和规划展示清楚。

能力 01

文本转语音:把任意 AI 输出快速转成可用音频,作为第一层基础能力。

能力 02

声音角色:支持不同 AI 绑定不同音色、风格和声音身份,形成多 Agent 发声系统。

能力 03

渠道输出:支持网页播放、Bot 发送、工作流播报,逐步抽象成统一接口。

第一版 MVP 功能

优先场景

接下来要做的事

Step 1:定第一版输入输出 明确文本来源、声音模板、音频输出格式和回传方式,先收口,不做发散功能。
Step 2:打通最小闭环 先实现“AI 回复 → 语音生成 → 页面播放 / 消息发送”,证明能力层真的能跑起来。
Step 3:向 Skill / API 抽象 把页面能力抽成可复用接口,让别的 AI、Bot、workflow 也能直接调用。
当前功能页已切换为万音第一版规划页,后续可继续接入真实 demo 与 API 文档。