[AI每日快讯·20241202]微软发明全新「LLM语言」Droidspeak,智能体交互效率翻倍!
发布时间:2024-12-02 09:16:07 · 责任编辑:字母汇 · 浏览量:65 次
一、 微软发明全新「LLM语言」Droidspeak,智能体交互效率翻倍!
1. 微软提出“Droidspeak”语言,通过直接复用模型中间计算结果,替代自然语言,使AI智能体间通信速度提升2.78倍,同时保持性能不损失;
2. 方法通过优化复用KV缓存和E缓存,减少预填充延迟,同时在GPU内存与计算开销间平衡;
3. DroidSpeak采用离线配置分析与在线动态缓存传递,显著降低延迟,提升生成效率且保持高精度。
二、 「Agent OpenDay」活动中,智谱展示AutoGLM等多项进展
1. AutoGLM通过任务调度和多模态技术,将大模型从对话功能升级为自主执行复杂多步骤任务的智能体,推动大模型向目标驱动型Agent发展;
2. GLM-PC探索PC端“无人驾驶”,通过模仿人类操作实现复杂任务跨平台执行,克服传统API限制并支持动态任务调度;
3. 大模型从“Chat”走向“Act”,以理解、预测和行动为核心,希望推动AI技术进入以LLM-OS为基础的通用智能体操作系统阶段,拓展人机交互场景。
三、 让AI眼里有活主动干!清华&面壁等开源主动交互Agent新范式
1. 清华与面壁团队提出主动Agent范式,使AI具备主动观察环境、推断用户需求并自主完成任务的能力,从被动工具转变为主动协作者;
2. 基于ProactiveBench数据集与奖励模型,主动Agent能准确识别用户需求,降低误报率,同时在多任务预测与反馈机制下显著提升性能;
3. 主动Agent广泛适用于个性化助理、文件管理、智能家居等场景,推动人机交互从指令执行进化为双向协作的新模式。
四、 腾讯混元文生视频模型曝光!与Sora同提示词PK,你来投票
1. 腾讯推出混元文生视频模型,支持多镜头生成、复杂场景呈现和游戏画面风格,可生成符合物理细节的逼真效果;
2. 腾讯模型与Sora对比测试中,在动物追逐、玻璃球禅园和动画怪物场景生成等复杂提示词下展现竞品水平,细节表现出色;
3. 国内视频生成领域竞争激烈,腾讯、字节、快手等大厂均已入局,技术成熟度和场景应用能力成为核心竞争力。
五、 马斯克申请对OpenAI的禁令,阻止OpenAI转变为营利性
1. 马斯克申请禁令,指控OpenAI从非营利性转为营利性,涉嫌反竞争行为并利用微软关系排斥竞争者,包括xAI;
2. 禁令内容包括阻止OpenAI向投资者提出限制竞争的资金条件,并指控微软与OpenAI共享敏感信息,损害市场公平;
3. 马斯克强调,OpenAI的营利化破坏其初创非营利使命,对公众利益和竞争环境造成潜在损害。
六、 腾讯文档3.9.0版本上线,全面升级AI文档助手能力大提升!
1. 腾讯文档3.9.0版本升级AI文档助手,增强了文档总结、深度阅读、智能配图等功能,提升用户阅读与创作效率;
2. 新增PPT生成、长文创作支持,用户可快速生成大纲并创建专业内容,简化工作流程;
3. 强化内容搜索功能,优化腾讯文库和互联网上的信息检索,提供更广泛的资源与创作支持。