AI快报:首例月球背面全自动智能体Kimi-Researcher亮相;MiniMax新增音频设计工具;Jaaz推出Lovart AI本地化解决方案
发布时间:2025-06-23 16:53:00 | 责任编辑:张毅 | 浏览量:8 次
新鲜AI产品点击了解:https://top.aibase.com/
1:月之暗面发布首款自主智能体 Kimi-Researcher
月之暗面推出Kimi-Researcher,多轮搜索与推理能力强,在HLE测试中超越谷歌和OpenAI同类产品。
【AiBase提要:】
🌐 Kimi-Researcher基于k-系列模型,通过端到端强化学习训练。
📈 在HLE测试中Pass@1得分率26.9%,Pass@4准确率40.17%。
🔗 未来将开源基础预训练模型,助力AI社区发展。
2:MiniMax推出Voice Design音色设计功能,任意组合语言 、口音、音色
MiniMax推出Voice Design功能,用户可通过自然语言描述生成个性化语音,支持多种语言、口音和音色组合。
【AiBase提要:】
🎤 用户可自由选择语言、口音和音色,实现全自定义组合。
🌐 与Speech-02模型结合,满足特定场景下的细分需求。
🔗 降低了语音合成领域的音色匹配难度。
国内版:minimaxi.com/audio
海外版:minimax.io/audio
3:火山引擎上线"AI 智能推荐域名"功能
火山引擎上线AI智能域名推荐功能,依托方舟大模型平台,帮助企业快速找到符合品牌需求的热门域名。
【AiBase提要:】
🌐 用户输入关键词,AI生成关联性强、富有创意的域名。
📈 结合词语联想和市场趋势分析,提供多样化选择。
🔗 联动豆包AI助手,进一步简化域名注册流程。
体验地址:https://www.volcengine.com/product/domain-service
4:Anthropic未放弃Claude Code,强化VSCode集成引发热议!
Anthropic推出Claude Code for VSCode插件,优化开发者编码体验,强化在AI编码领域的战略布局。
【AiBase提要:】
💻 插件支持代码编辑、测试和Git工作流管理。
🔗 支持远程MCP服务器,扩展工具链覆盖范围。
📈 活跃用户群增长160%,显示强劲发展势头。
5:Google Gemini2.5Flash-Lite炸裂登场!点击瞬间生成UI,未来交互从此不同!
内容总结:Google推出Gemini2.5Flash-Lite模型,具备实时生成交互界面的能力,预示未来交互操作系统雏形。
【AiBase提要:】
📱 实时生成UI界面,响应用户需求。
🌐 支持多模态输入,内置可控思考预算功能。
🔗 在多个领域展现潜力,适合高吞吐量场景。
6:苹果欲以300亿美元收购 AI 新星 Perplexity,意图扭转搜索市场局势!
内容总结:苹果考虑以300亿美元收购AI初创公司Perplexity,旨在提升Siri和Safari服务,增强搜索市场竞争力。
【AiBase提要:】
🍎 苹果历史上最大规模并购计划。
🌐 Perplexity专注于对话式网络搜索平台。
📈 收购将填补苹果在AI搜索领域的空白。
7:月之暗面开源 Kimi-2506:多模态智能体,视觉理解能力重大升级
月之暗面开源Kimi-2506多模态模型,视觉理解能力显著增强,支持更高分辨率图像处理。
【AiBase提要:】
🌐 Kimi-2506在多模态推理和视觉理解方面表现出色。
📈 支持单张图像总像素达320万。
🔗 模型在多个应用领域展现强大功能。
8:Firecrawl即将推出Fireplexity,打造开源Perplexity克隆版
Firecrawl将推出开源AI问答引擎Fireplexity,依托其强大的网页抓取功能,为开发者提供低成本替代方案。
【AiBase提要:】
🌐 Fireplexity核心功能与Perplexity类似,支持定制。
📈 依托Firecrawl的网页抓取和处理能力。
🔗 开源特性有望吸引更多开发者参与AI搜索生态建设。
9:智能机器人公司银河通用获宁德时代领投超10亿元融资
银河通用完成超10亿元融资,由宁德时代领投,其首款具身大模型机器人Galbot G1已推出并实现应用。
【AiBase提要:】
🤖 银河通用是具身智能领域的佼佼者。
🌐 首款具身机器人Galbot G1侧重上肢操作能力。
📈 通过仿真数据驱动模型研发,未来有望与宁德时代形成战略协同。
10:字节发布了DreamActor-H1视频生成系统,只需输入商品和角色即可生成带货视频
字节跳动发布DreamActor-H1视频生成系统,采用扩散变换器技术,解决视频生成中真实性和自然性问题。
【AiBase提要:】
🌐 输入商品和角色照片,自动生成带货视频。
📈 采用成对人机交互参考信息和掩蔽交叉注意力机制。
🔗 在保持人和产品身份完整性方面优于现有技术。
11:Google Gemma 团队发布 Magenta RealTime:开源实时音乐生成模型
Google Gemma 团队推出 Magenta RealTime,一个开源 AI 音乐生成模型,专注于实时创作,助力音乐创作者和开发者。
【AiBase 提要:】
🎶 Magenta RealTime 基于 Transformer 架构,参数规模为8亿,适合快速音乐生成。
💡 该模型支持文本提示,实时调整音乐风格与情感,提升创作灵活性。
🌐 开源项目允许开发者自由使用,降低了音乐创作的门槛。
产品链接:https://huggingface.co/google/magenta-realtime
12:开源 AI 设计工具 Jaaz 发布 Lovart AI 的本地化替代品
一款名为 Jaaz 的开源 AI 设计工具利用先进 AI 技术,支持本地运行,为设计师提供灵活高效的创作体验。
【AiBase 提要:】
🌟 Jaaz 是 Lovart AI 的开源替代品,支持本地部署。
🎨 提供聊天式交互,简化设计流程。
⚙️ 兼容多种图像生成模型,具高兼容性。
Jaaz 项目地址:https://github.com/11cafe/jaaz
以下是关于这三则AI日报的详细内容:
月之暗面首款自主智能体Kimi-Researcher
-
产品介绍:月之暗面于6月23日正式推出其首款Agent产品——Kimi-Researcher(深度研究),并已启动小范围灰度测试。该产品基于端到端自主强化学习技术打造,是一款高度自主的智能研究助手,能够独立规划任务流程并交付完整结果。
-
技术优势:它采用零结构设计,无需复杂提示词或预设流程,完全依靠自主决策能力在动态环境中运行。在执行任务时,平均会执行23个推理步骤,并浏览超过200个相关网页。
-
性能表现:在“人类最后一场考试”(Humanity's Last Exam)测试中,其Pass@1得分率达到26.9%,Pass@4准确率高达40.17%,刷新了业界记录。在xbench测试的xbench-DeepSearch项目上,取得了69%的Pass@1得分率(四次运行平均值),优于其他配备搜索工具的模型。
-
未来规划:月之暗面表示,未来将逐步开源Kimi-Researcher的基础预训练模型及强化学习优化版本,以推动Agent强化学习领域的探索与发展。
MiniMax推音色设计功能
-
功能介绍:MiniMax最近推出了一项名为Voice Design的音色设计功能,这标志着语音合成技术的一次重大突破。该功能允许用户通过自然语言描述自己理想中的音色,从而实现对语音的多维度精准控制,甚至可以生成一些世界上从未存在过的音色。
-
技术优势:这项新功能与Speech-02语音模型紧密结合,用户在进行文字转语音时,能够真正实现“所需即所得”。用户可以自由选择“任意语言×任意口音×任意音色”,进行全自定义的无限组合。
-
应用场景:通过简单的文本描述,用户可以得到不同风格的AI助手语音。例如,用户可以请求一个积极鼓励的AI助手,语调活泼,韵律变化丰富,来表达关心和支持;或者选择一个严厉的AI助手,快速的女声带有命令和责备的语气;还可以让助手以小心翼翼的语气表达歉意。
Jaaz发布Lovart AI本地化替代品
-
产品介绍:Jaaz是一款开源的AI设计Agent,作为Lovart AI的本地化免费替代品。它具备强大的AI设计能力,能智能生成设计提示,批量生成图像、海报、故事板等。
-
技术优势:Jaaz支持Ollama、Stable Diffusion等本地及API模型,用户可通过聊天编辑图像,实现对象移除、风格转换等功能。它还提供创意画布,并计划支持视频生成。
-
应用场景:Jaaz可在macOS和Windows上使用,支持Claude、OpenAI、Gemini等API,或通过Ollama实现100%免费本地使用。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。