首页 > 快讯 > Apple推出创新Speech技术!4K视频34分钟转录只需45秒,效能超越OpenAI达55%

Apple推出创新Speech技术!4K视频34分钟转录只需45秒,效能超越OpenAI达55%

发布时间:2025-06-18 17:25:10 | 责任编辑:吴昊 | 浏览量:6 次

近日,科技媒体 macstories 通过一项实测,揭示了苹果公司全新推出的 Speech API 的强大性能。通过转录一段长达34分钟、大小为7GB 的4K 视频,该技术仅用时45秒完成转录,速度之快令人惊叹。
这项技术的推出是在2025年 WWDC 全球开发者大会上宣布的,其中包括两个重要模块:SpeechAnalyzer 和 SpeechTranscriber。macstories 团队使用了基于这些模块开发的 Yap 应用工具,对其转录性能进行了详细测试。结果显示,Yap 在处理视频时展现出了显著的速度优势,远超目前市场上其他主流转录工具。
在与竞争对手的对比中,Yap 完成转录所需时间为45秒,而 OpenAI 的 Whisper(MacWhisper V3Turbo 版本)则需要101秒,速度慢了55%。其他工具如 VidCap 和 MacWhisper V2的转录时间分别为1分55秒和3分55秒,这进一步突显了 Yap 的优势。
尽管所有工具在专有名词识别方面存在一定误差,比如在转录 “AppStories” 时的识别不准确,但 Yap 的本地化运算能力使其在处理速度上具有无可比拟的优势。这意味着,如果用户每周处理多段视频,使用 Yap 将节省大量时间,提升工作效率。
苹果在转录技术领域的这一创新不仅提高了效率,也为创作者、教育工作者和内容制作者带来了便利。随着这项技术的普及,未来我们可能会看到更多企业在视频处理和内容生成方面的应用。总之,苹果的这项新技术标志着语音转录领域的一次革命,未来的内容生产将因其而变得更加高效与智能。

Apple推出创新Speech技术!4K视频34分钟转录只需45秒,效能超越OpenAI达55%

苹果在2025年全球开发者大会(WWDC)上发布了新的Speech API,其语音转录速度令人瞩目。在一项测试中,苹果的Speech API仅用45秒就完成了对一个34分钟、7GB大小的4K视频文件的转录。相比之下,OpenAI的Whisper模型完成同样的任务需要101秒。这意味着苹果的Speech API在转录速度上比OpenAI的Whisper快了约55%。

技术优势

苹果的Speech框架包括两个模块:SpeechAnalyzer和SpeechTranscriber。这种高效的表现得益于苹果在语音处理领域的技术突破,尤其是在本地计算方面的优势。基于新模块开发的应用程序Yap在测试中展现了极高的效率,而其他工具如MacWhisper(基于OpenAI的Whisper)则需要更长时间。

未来展望

苹果的这一技术进步不仅为视频内容创作者提供了极大的便利,还为未来场景的扩展奠定了基础。随着人工智能技术的不断发展,苹果可能会在语音识别领域推出更多创新解决方案,进一步提升用户体验。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复