你是否厌倦了依赖网络的TTS服务?担心隐私泄露、延迟卡顿,或在无网环境下无法朗读文档?Supertonic 是一款真正「装进手机就能用」的本地语音合成引擎——它不连云端、不传数据、不占内存,却能以接近真人语调,实时把文字变成高质量语音。无论是听小说、读邮件、辅助学习,还是为App嵌入无障碍语音功能,它都只需几行代码或一个App即可启动。
核心功能
- 全离线运行:基于 ONNX Runtime 深度优化,所有语音合成计算均在设备端完成(iOS/Android/macOS/Windows/Linux 均支持),彻底告别网络请求与API密钥
- 极速响应:平均单句合成耗时 <150ms(A15芯片实测),输入文字后“秒出声”,适合实时交互场景如语音助手、即时翻译朗读
- 31种语言全覆盖:从中文(普通话、粤语)、日语、韩语,到英语、法语、西班牙语、阿拉伯语、泰语、越南语等,v3版本新增印度尼西亚语、葡萄牙语(巴西)、土耳其语等小语种支持
- 高保真自然度:显著减少传统TTS常见的重复词、跳字、断句生硬等问题;支持语速、音调、停顿精细调节,阅读长文更流畅
- 开发者友好生态:提供 Swift / Python / Rust / Node.js / Java / C# / Go / C++ 多语言绑定,iOS原生集成仅需3步,Web端可通过 WebAssembly 轻松接入
- 个人声音可定制:通过官方 Voice Builder 工具,上传1分钟自己录音,即可生成专属语音模型——所有权永久归你,模型可导出部署至任意边缘设备
适合哪些人用
✅ 独立App开发者:想为iOS/Android应用快速添加离线语音播报、无障碍朗读、教育类内容配音功能,无需自建服务器或支付云TTS按量费用;
✅ 隐私敏感用户:学生党读论文、上班族听长邮件、视障朋友用读屏工具——所有文本永远留在本地,连Wi-Fi都不用开;
✅ 边缘AI实践者:IoT设备、车载系统、智能硬件工程师,需要低功耗、小体积(模型仅 ~15MB)、高兼容性的TTS方案;
✅ 多语种内容创作者:运营跨境社交媒体、制作双语教学视频、开发语言学习App,一套工具覆盖全球主流语种;
✅ 声音爱好者与创作者:用 Voice Builder 把自己的声音变成可编程的“数字分身”,用于播客、有声书、游戏角色配音等长期创作场景。
快速上手
👉 iOS开发者:CocoaPods 一行集成:pod 'Supertonic', '~> 3.0',调用 Supertonic.shared.speak("你好,世界") 即可发声;
👉 Python用户:pip安装后3行代码搞定:pip install supertonic → from supertonic import TTS → tts = TTS(lang="zh-CN").speak("今天天气真好");
👉 普通用户:访问 Hugging Face 在线Demo,无需注册、不下载、直接输入文字试听31种语言效果;
👉 想用自己的声音? 打开 Voice Builder,按提示录制并提交,10分钟内获取专属ONNX模型文件,全程离线训练、自主可控。
项目信息
Lightning-Fast, On-Device, Multilingual TTS — running natively via ONNX.
4.4k
今日 +859 stars today
Stars
445
Forks
Swift
MIT
编程语言:Swift(主框架),同时提供 Python/Rust/Node.js 等多语言接口
GitHub Star 数:4400+
开源协议:MIT
GitHub 项目地址
如果你想要一个不联网、不收费、不说“抱歉,当前网络不可用”的TTS工具——Supertonic 就是那个已经跑在你iPhone里、却还没被你发现的“静音播音员”。





