Pretzel Diary 图文介绍:
Pretzel Diary 2023 年诞生于美国纽约,是一款“开口即记录”的语音日记 SaaS。产品把实时语音识别(ASR)、声纹情绪分析、生成式语音克隆与 GPT 摘要引擎整合为一条闭环:用户只需对着手机说话,系统 1 秒内完成转写 → 情绪打标 → 生成可回放的“个人播客式”日记,并支持用 AI 克隆自己的声音朗读过往条目。平台主打“零打字、零编辑、零压力”,已吸引 12 万英语、日语、西班牙语用户,累计存储语音时长超过 310 万分钟。
主要功能
- 实时语音转写
‑ 支持 EN、ES、FR、DE、IT、PT、NL、JA、KO 9 种语言,方言口音自适应。
‑ 断句智能标点,自动过滤口癖(uh, um),可回听并一键恢复原声。
- 声纹级情绪洞察
‑ 每秒提取 128 维声纹特征,识别快乐、平静、悲伤、愤怒、焦虑 5 类情绪曲线。
‑ 生成日/周/月情绪热力图,可与 Apple Health、Google Fit 睡眠、运动数据叠加对比。
- AI 语音克隆(Voice Double)
‑ 仅需 30 秒干净语音样本,5 分钟内训练出个人音色模型;日记可用自己的声音自动朗读。
‑ 支持语速、情绪强度、音效(咖啡厅/雨声/白噪)调节,导出 MP3 或生成私密播客 RSS。
- 智能摘要与回顾
‑ GPT-4o 每日生成 3 行“关键词+情绪”摘要;每周自动生成「本周小记」文章。
‑ “时光骰子”功能:随机跳转到往年今日语音,AI 用当前音色回放并对比情绪变化。
- 隐私与安全
‑ 端到端 AES-256 加密,密钥仅用户设备保存;服务器仅存加密散列。
‑ 声纹模型与语音文件物理隔离,可选择“仅本机存储”或“端到端加密云同步”。
‑ 符合 GDPR、CCPA,可随时一键销毁云端数据与克隆模型。
应用场景
- 情绪管理:心理咨询来访者每日语音打卡,治疗师后台查看情绪曲线(需授权)。
- 亲子成长:父母记录孩子趣事,并用 AI 克隆童声制作“成长播客”赠予未来。
- 创作灵感:作家、编剧口述脑洞,系统自动打时间戳与情绪标签,方便后续检索。
- 语言学习:学习者用外语口述一天,转写后对比语法错误,再用克隆音色纠正发音。
- 远程团队:分布式团队用 1 分钟语音日报替代长邮件,Leader 用 2 倍速播客回顾。
是否收费
- 免费版:每日 3 条语音日记,单条 ≤3 分钟,提供基础转写与情绪标签,不含语音克隆。
- Pretzel+ 6.99 美元/月:无限条数,单条 ≤30 分钟,解锁个人语音克隆、周回顾文章、加密云同步。
- Pretzel Pro 15.99 美元/月:含 5 个音色克隆槽位、高清 48 kHz 导出、API 接入、团队情绪仪表盘。
- 终生买断 199 美元(限时):永久 Pro 权益,本地模型下载,未来新功能免费更新。
平台兼容性
- iOS 16+、Android 10+ 原生 App,支持离线录制,连网后自动加密上传。
- Web 端 PWA:Chrome、Edge、Safari 桌面版可录音与回放,暂不支持 Web 端克隆训练。
- 导出格式:TXT、PDF、SRT、MP3、OPML;可连接 Obsidian、Notion、Apple Notes 自动备份。
- API 与 Zapier/Make 集成:可将每日摘要同步到 Slack、Discord、Google Calendar。
Pretzel Diary 把“语音记录 + 情绪量化 + 个人声音克隆”做成一条无摩擦的闭环:用户只需开口,就能获得一份可听、可看、可回溯的“声音时间胶囊”。对想坚持日记却嫌打字麻烦、或希望用 AI 保留自己真实音色的人群来说,它既是私密树洞,也是一款极具情感温度的语音克隆产品。
本网站(AIGC官网)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

Kardome提供基于AI的语音识别和降噪解决方案,提升语音交互体验。