苹果最新的Speech API转录速度惊人,较OpenAI的Whisper快55%
发布时间:2025-06-18 11:19:56 | 责任编辑:张毅 | 浏览量:4 次
科技媒体 macstories 发布了一篇关于苹果新推出的 Speech API 的博文,引发了业界的广泛关注。通过对一段时长34分钟、大小达7GB 的4K 视频文件进行转录测试,结果显示,苹果的新 Speech API 仅耗时45秒,速度远超其他同类工具。相较之下,OpenAI 的 Whisper 转录时间为101秒,苹果的技术优势可见一斑,提升了约55% 的效率。
苹果在2025年全球开发者大会 WWDC 上首次宣布了这一 Speech 框架,框架中包含了 SpeechAnalyzer 和 SpeechTranscriber 两款模块。这一技术的推出,标志着苹果在语音处理领域的进一步突破,尤其是在速度和准确性方面的提升。
在具体的测试中,媒体使用了基于新模块开发的 Yap 应用进行转录。通过对比不同工具的表现,Yap 以45秒的快速转录时间,成为了市场上表现最优的选择。相对而言,MacWhisper(基于 OpenAI 的 Whisper 开源语音转录模型)需要1分41秒,而 VidCap 则需要1分55秒。更早版本的 MacWhisper(V2)甚至要耗时3分55秒。
虽然所有测试工具在识别专有名词时都出现了一定误差,比如 “AppStories” 的识别,但 Yap 在本地化运算上的优势,确保了其在处理多段视频时的效率更为显著。通过计算每周处理多段视频所节省的时间,用户可以显著提高工作效率。
这项技术的快速发展,不仅为视频内容创作者提供了便利,也为后续的应用场景拓展奠定了基础。未来,随着 AI 技术的不断演进,苹果在语音识别领域可能会推出更多创新的解决方案,进一步提升用户体验。
划重点:
🌟 苹果新 Speech API 转录34分钟4K 视频仅需45秒,速度超越竞争对手。
⏱️ 与 OpenAI Whisper 相比,苹果技术提升了约55% 的效率,表现显著。
📈 本地化运算优势使 Yap 在多段视频处理上效率更高,为用户节省大量时间。
根据最新的测试结果,苹果新发布的 Speech API 在转录速度上确实表现出色。在一项针对 34 分钟、7GB 的 4K 视频文件的转录测试中,苹果的 Speech API 仅用了 45 秒就完成了转录。相比之下,基于 OpenAI Whisper 的 MacWhisper(V3 Turbo)需要 1 分 41 秒。这意味着苹果的 Speech API 在转录速度上比 OpenAI Whisper 快了约 55%。
苹果 Speech API 优势
苹果的 Speech API 之所以能够实现如此快速的转录,主要得益于其本地化计算的优势。在处理多段视频时,这种速度优势尤为明显,能够显著节省用户的时间。此外,苹果在 2025 年全球开发者大会(WWDC)上推出的 Speech 框架包含 SpeechAnalyzer 和 SpeechTranscriber 两个模块,进一步提升了语音处理的效率和准确性。
OpenAI Whisper 性能
尽管 OpenAI Whisper 在转录速度上稍逊一筹,但它在某些方面仍然表现出色。例如,Whisper 在专有名词和数字识别方面表现良好,且能够自动添加标点符号和大写,提高了转录文本的可读性。此外,Whisper 的不同模型版本(如 tiny、small、medium 和 large)在速度和准确性之间提供了多种选择。
总结
苹果的新 Speech API 在转录速度上确实胜过了 OpenAI Whisper,尤其适合需要快速处理大量视频内容的场景。然而,Whisper 依然在某些细节处理上表现出色,例如文本格式化和专有名词识别。用户可以根据自己的需求选择合适的工具。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。