说明:
官网入口 官方网站主页;
IOS App Store 下载,支持 iPhone/iPad/Mac;
安卓 Google Play / 应用宝下载;
客户端 Mac/Windows/iOS/Android 官方下载;
插件 浏览器插件(默认 Chrome);
GitHub / HuggingFace / ModelScope 模型或项目托管地址;
API 模型/软件接口地址;
MCP 官网的 MCP 栏目入口。
若未显示,表示暂无对应渠道,欢迎补充或纠错。
AIGC官网收录 │
2026-01-24 │
136 次 │
人工核对 │
官网认证 │
定期更新 │
AIGC音频工具
Live Captions 图文介绍:
Live Captions 2021 年诞生于英国伦敦,定位为“消费级 AI 实时字幕工厂”。平台通过自研大模型与云端 GPU 集群,对麦克风、直播推流或音视频文件进行实时语音转写,自动输出高准确率字幕、时间轴、说话人分段与可编辑字幕文件,并支持一键嵌入 Zoom、Teams、YouTube、OBS 与线下 LED 屏,帮助教师、主播、活动方在数分钟内完成“语音→字幕→投放”闭环,官方称平均转写准确率 99%,延迟 <200ms,已服务 120 万小时语音。
一、这个 AI 是干什么的?
Live Captions = AI 语音转写员 + 实时字幕生成器 + 多场景投放适配器。
它用端到端 Transformer 模型对音频流进行实时解码,自动添加标点、时间轴与说话人标签,并支持一键导出 SRT/VTT/ASS 等格式,实现“开口→字幕”一站式。
二、核心功能
- 实时转写:支持麦克风、RTMP、Zoom、Teams、YouTube 直播流,延迟 <200ms。
- 高准确率:自研模型在通用场景下准确率 99%,支持中英德法西等 18 种语言。
- 说话人分段:自动识别不同说话人,输出带 Speaker ID 的字幕文件。
- 实时编辑:支持在线修改字幕、添加标点、屏蔽词汇,修改实时同步到直播。
- 多格式导出:一键下载 SRT/VTT/ASS/TXT/PDF,支持含时间轴与不含时间轴两种模式。
- 线下投屏:支持 OBS、Zoom 字幕通道、LED 屏字幕叠加,字号与颜色可调。
- 双语字幕:支持同步输出中英双语,适合国际会议与课程。
- API & 白标:提供 REST,教育机构可隐藏品牌、自定义价格体系。
三、实际使用场景
- 线上课程:教师用平台实时生成中英双语字幕,学生听力障碍者出勤率提升 40%。
- 企业直播:CEO 用 OBS 集成实时字幕,观众留存时长提升 25%。
- 国际会议:主办方用双语字幕投屏,节省 50% 同传费用。
- 线下活动:演唱会用 LED 屏叠加实时字幕,观众满意度提升 30%。
- 内容创作:UP 主用平台生成 SRT 字幕,10 分钟完成 1 小时视频字幕,节省 80% 时间。
四、优点 & 不足
优点
- 支持 18 种语言实时转写,通用场景准确率 99%;
- 延迟 <200ms,适合直播与线下投屏;
- 自动说话人分段与实时编辑,减少后期工作量;
- 支持 OBS、LED 屏叠加,线下线上场景全覆盖;
- 提供 API 与白标,适合机构批量集成。
不足
- 免费版仅 30 分钟/月,重度使用需付费;
- 对极度嘈杂或重叠语音偶现识别错误,需人工校正;
- 离线环境需额外购买本地 GPU 节点;
- 企业版定价需联系销售,无公开价格表;
- 暂不支持歌词同步与音乐节拍对齐。
五、与同类工具对比
- Zoom 内置字幕:语言少且准确率一般;Live Captions 支持 18 种语言与 99% 准确率。
- YouTube 自动字幕:延迟高且不可编辑;Live Captions 实时编辑与投屏。
- 讯飞听见:中文强但缺双语;Live Captions 支持中英双语实时输出。
- 自建 Whisper+API:需开发;Live Captions 零代码即用,上线快。
- 传统同传:成本高;Live Captions 成本<10%,适合大规模活动。
六、是否免费 & 使用建议
- 免费版:0 元,30 分钟/月,带品牌水印,不可商用;
- Pro:$19/月,10 小时,全功能,商用授权;
- Business:$49/月,50 小时,API 1 万次,白标;
- 企业版:$199/月起,本地部署,无限小时,专属模型。
使用建议:
- 先用免费版测试准确率与延迟,确认满足需求再付费;
- 用实时编辑功能屏蔽敏感词汇,避免直播事故;
- 线下投屏前测试 LED 屏字体大小与颜色对比度;
- 用双语功能时提前导入专业词汇表,提升准确率;
- 若月时长>500 小时,选择企业版并申请本地部署满足合规。
Live Captions 用 AI 把“语音→实时字幕→多格式导出”压缩成一键开启,让非专业用户也能在数分钟内完成高准确率、低延迟的字幕投放。它并非替代人工同传,而是将通用语音转写自动化,显著降低字幕与翻译成本。若你需要快速为直播、会议、课程或视频添加字幕,Live Captions 是当前最省时、最多语言的 AIGC 音频工具之一。
©️版权声明:
本网站(AIGC官网)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
本网站(AIGC官网)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

唱鸭是一款专为音乐爱好者设计的AI音频工具,即使不会乐器,用户也能轻松实现自弹自唱,创作和分享自己的音乐作品。