[AI每日快讯·20241126]AI Agent又一重要玩家!谷歌重磅发力AI Agent ,商用大爆发!
发布时间:2024-11-26 09:44:01 · 责任编辑:字母汇 · 浏览量:74 次
一、 AI Agent又一重要玩家!谷歌重磅发力AI Agent ,商用大爆发!
1. 谷歌云推出AI Agent商用生态,提供从开发到部署的一站式服务;
2. 新发布的AI Agent市场为企业用户提供个性化选择,简化部署流程,并支持免费试用;
3. 谷歌通过激励计划和合作伙伴支持,推动AI Agent应用,已有多个知名企业在客户支持、销售优化等领域成功部署。
二、 Cursor 0.43 终于迎来一波更新!带Agent的Cursor太疯狂了
1. Cursor 0.43引入了Composer Agent,具有完整项目理解和编辑能力,能够自动解析和优化项目文件;
2. Bug Finder功能帮助开发者检测潜在问题,尤其在代码分支合并前进行检测,目前处于Beta阶段;
3. 其他改进包括语义搜索、文件推荐和image drop,提升了代码管理和搜索效率。
三、 Runway还是太全面了!新推出视频扩展功能Expand Video
1. Runway推出“Expand Video”功能,允许用户通过文本提示扩展视频画面,灵活调整比例;
2. 用户可创建动态效果,如“快速变焦”和“拉远镜头”,提升视频的电影感和动感;
3. 此功能增强了视频创作的灵活性和专业性,进一步拓展了视频生成技术的创意表现。
四、 可口可乐pick可灵、Leonardo、Runway,用AI拍了新广告片
1. 可口可乐在圣诞广告中使用国产AI模型“可灵”,生成自然景观和动物元素;
2. 制作过程中,AI工具(如可灵、Leonardo、Runway)加速了创作,广告制作成本大幅降低,速度提高五倍;
3. 广告发布后,遭遇观众批评,主要集中在AI生成的人物形象和情感表达上,导致“恐怖谷效应”和创意质量下降的担忧。
五、 Meta多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务
1. Meta发布的Multi-IF基准覆盖8种语言、4501个三轮对话任务,评估多轮对话和多语言指令遵循能力;
2. 实验显示,所有LLM在多轮对话中的表现逐轮衰减,非拉丁文字语言(如中文、俄语)准确率显著低于英语;
3. 数据集构建包括自动翻译与人工校对,强调多语言适配,并揭示了增大模型规模和自我修正能力对提升指令遵循的影响。
六、 1X公布了世界模型挑战赛的二阶段:Sampling,英伟达加持
1. 1X公司发布世界模型挑战赛,第二阶段关注通过前一帧预测下一帧,奖金10000美元;
2. 英伟达推出Cosmos视频分词器,提升视频数据的压缩率和重建质量,支持多种视觉模型;
3. Cosmos分词器采用3D因果卷积结构和小波变换,提高重建速度和学习效率,显著降低运行成本。