[AI每日快讯·20241212]OpenAI下一代模型泄露!「半GPT-5」旗舰模型猎户座要来了?
发布时间:2024-12-12 00:02:06 · 责任编辑:字母汇 · 浏览量:56 次
一、 OpenAI下一代模型泄露!「半GPT-5」旗舰模型猎户座要来了?
1. OpenAI的未发布模型「ChatGPT ε」意外泄露,可能是「猎户座」模型,引发广泛讨论;
2. 猎户座模型的性能提升不如从GPT-3到GPT-4,可能不会被命名为GPT-5;
3. OpenAI正在开发新方法应对高质量数据供应减少,预计明年初完成Orion的安全测试,可能改变「GPT」命名惯例.
https://mp.weixin.qq.com/s/9Rp-a07FDPAEmrciGG5AEw
二、 OpenAI Day 4 Canvas重大升级!跑代码改bug界面大革新
1. Canvas升级增强了写作和编辑功能,支持修改建议、语法检查、添加表情等;
2. 引入Python代码运行功能,支持调试代码并实时查看输出和错误修正;
3. Canvas集成至自定义GPTs,用户可以为特定任务定制AI,提升工作效率。
https://mp.weixin.qq.com/s/K2Hb0Wzp2OB1cbl9E9URng
三、 一觉睡醒,AI码农同事Devin已经正式上线了,月薪3500
1. AI编程助手Devin已正式发布,能够理解需求并编写、修改代码,包括修复bug和重构代码;
2. Devin支持Slack集成、IDE扩展和API接口,适用于工程团队,月费500美元起;
3. Devin已参与多个开源项目的贡献,展示其在实际应用中的强大能力。
https://mp.weixin.qq.com/s/6o2UFIBbNhFBHfSjRyK90w
四、 Niantic的AI 3D建模神器登陆Quest,3D生成UGC要来了
1. Niantic推出AI 3D建模平台Scaniverse,旨在通过全球用户生成3D场景,打造最大UGC社区;
2. 新增Meta Quest平台支持,用户可在虚拟现实中探索、查看和上传3D场景,促进全球3D地图的建设;
3. 采用高斯溅射技术提升扫描质量,支持更快的实时反馈与扫描分享,推动增强现实和虚拟现实体验的开发。
https://mp.weixin.qq.com/s/1jzLYGu5YaI9LXS2zlrLYQ
五、 DeepMind发布PaliGemma二代,最易微调「视觉语言全能王」
1. PaliGemma 2在图像描述、乐谱识别、医学报告生成等任务上取得SOTA成绩,并提供多种尺寸和分辨率版本;
2. 模型增强了视觉能力,易于微调,适用于OCR、分子结构、放射学等任务;
3. 通过提高分辨率和模型尺寸,PaliGemma 2在任务表现上显著提升,尤其在文本检测和放射报告生成中表现突出。
https://mp.weixin.qq.com/s/XbFGYqIYCj0L6jTUxMCF9Q
六、 清华系 AI 公司面壁智能新一轮融资,端侧智能进入持久战
1. 面壁智能完成数亿元融资,将加速端侧AI大模型商业化,提升性能与能效;
2. MiniCPM系列突破性进展,已成为开源社区明星项目,广泛应用于消费电子和垂直行业;
3. 同时关注在法律、教育等垂直领域的深度赋能,推动大模型在行业场景中的落地与应用。
https://mp.weixin.qq.com/s/qYDvtztPjOJFodWDuE_xgQ
七、 视觉中国与Vidu达成战略合作,共拓视觉产业大模型应用
1. 视觉中国与生数科技合作,打造视觉产业大模型平台,推动AI在视觉内容行业的应用;
2. 视觉中国提供丰富的版权合规视觉资源,生数科技提供多模态大模型技术,共同支持内容创作者;
3. 双方计划拓展国内B端市场和海外个人用户业务,提升AI视频生成解决方案和创作工具的市场竞争力。
https://mp.weixin.qq.com/s/p75oT_187QJ90r7WqJ97Iw
八、 港中文「视觉听觉」基准AV-Odyssey:26个任务直指死角问题
1. 多模态大模型如GPT-4o在音频感知上存在明显短板,无法正确分辨简单的音量差异;
2. 香港中文大学等发布的AV-Odyssey基准测试揭示,现有模型在26个视听任务中的表现接近随机猜测,GPT-4o的准确率仅为34.5%;
3. 研究推出DeafTest和AV-Odyssey测试工具,旨在提升多模态大模型的音频和视觉整合能力,特别是音频理解方面的不足。https://mp.weixin.qq.com/s/4beDnPqkUdXUlXSH9elDoA