实时互动更智能化的谷歌 Gemini Live AI 助手全新功能发布
发布时间:2025-08-21 09:34:07 | 责任编辑:张毅 | 浏览量:5 次
近日,谷歌宣布将推出一系列新功能,以增强其 AI 助手 Gemini Live 的互动体验。这些新功能将使用户能够与助手进行更自然和直观的实时对话,增强日常生活中的便利性。
首先,Gemini Live 将实现屏幕高亮功能。这意味着用户可以通过手机摄像头扫描周围的物品,AI 助手会在屏幕上高亮显示相关对象,帮助用户更快找到所需的工具。例如,当你想为某个项目寻找合适的工具时,只需将手机对准一堆工具,Gemini Live 就会直接指引你找到正确的选择。这个功能将于8月28日与新发布的 Pixel10设备一起上线,并将在同一时间推送到其他安卓设备,之后也将逐步扩展到 iOS 平台。
其次,谷歌还将推出新的应用集成功能,使 Gemini Live 能够与更多的应用程序进行互动,包括短信、电话和时钟等。用户在与 Gemini 讨论方向时,如果发现自己要迟到了,可以随时打断对话,比如说:“这个路线不错,帮我发条消息给亚历克斯,我大概晚到10分钟。” 此时,Gemini 会自动为你草拟一条短信,提升沟通效率。
最后,谷歌还更新了 Gemini Live 的音频模型,称其将 “显著改善” 助手在对话中的语音表现,包括语调、节奏和音高等关键要素。未来,Gemini 将根据用户提问的内容调整语气,例如在讨论紧张话题时采用更冷静的声音。此外,用户还可以调节 Gemini 的语速,类似于现有的 ChatGPT 语音模式。同时,如果请求 Gemini 以特定角色或历史人物的视角生动地讲述故事,助手可能还会采用相应的口音,使叙述更加生动有趣。
这些新功能的推出,标志着谷歌在提升人工智能助手的实用性和人性化方面迈出了重要一步。
划重点:
🌟 Gemini Live 将上线屏幕高亮功能,方便用户快速找到所需物品。
📱 新的应用集成功能将提升与短信、电话等应用的互动效率。
🎤 更新的音频模型使助手的语音表现更自然,用户可调节语速和语调。
谷歌日前宣布,Gemini Live AI 助手正式推出一系列重磅新功能,全面升级实时互动体验,进一步向“更直观、更贴心、更强大”的 AI 伙伴迈进。以下为本次更新的三大核心亮点:
🌟 视觉指引:AI“指”给你看
-
屏幕高亮 + 摄像头联动:用户只需将手机摄像头对准身边的物体(例如一堆工具),Gemini Live 即可在屏幕上实时高亮标记出你需要的那一件。
-
首批设备与时间:该功能将于 8 月 28 日 随 Pixel 10 系列首发,并同步推送到其他 Android 机型,iOS 版将在随后几周内跟进。
📱 应用互联:边说边做,一步直达
-
深度集成 Messages、Phone、Clock 等原生应用:在对话过程中,用户可随时打断并下达指令,例如“这条路线不错,帮我发条短信给 Alex,说我会迟到 10 分钟”,Gemini Live 会立即代写并发送短信。
-
更多第三方应用即将接入:Google Keep、Tasks、Spotify、YouTube Music 等均在扩展列表中,未来可通过自然语音直接创建笔记、播放歌曲或查询地点。
🎙️ 声音进化:像真人一样会“说话”
-
全新音频模型:语调、节奏和音高全面优化,能够根据对话情境自动调整语气——讨论紧张话题时更冷静,讲故事时可模拟角色口音。
-
语速自定义:用户可像调节播放器倍速一样,自由加快或放慢 Gemini 的说话速度,获得最舒适的聆听体验。
谷歌表示,本次更新不仅提升了 Gemini Live 的“智商”,更让它变得“有眼力、有情商、有执行力”。随着后续逐步覆盖 Android 与 iOS 全平台,Gemini Live 有望成为用户口袋里最得力的 AI 伙伴。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。