[AI每日快讯·20241118]Claude 3.5 Sonnet在《我的世界》PK盖楼
发布时间:2024-11-18 11:20:37 · 责任编辑:字母汇 · 浏览量:117 次
一、 从4年缩短至4个月!马斯克122天就建成了名为“巨像”的超算
1. 马斯克的公司xAI仅用122天建成名为“巨像”的超级计算机,远快于行业平均的四年建设周期;
2. “巨像”超算规模巨大,配备了10万颗GPU,专用于AI模型训练,其建设速度引起行业竞争对手的关注和忧虑;
3. 马斯克采用非传统方法加速建设,包括在电力供应不足情况下开始建设,并使用移动天然气涡轮机作为临时电源。
二、 新旧Claude 3.5 Sonnet在《我的世界》PK盖楼,引来大量围观
1. 新旧版本的Claude 3.5 Sonnet在《我的世界》中进行建筑比赛,展示了显著的性能差异;
2. Sonnet 3.6版本在人类喜好评估中表现出更高的创意性,而OpenAI o1系列在模仿真实建筑方面表现更佳;
3. 通过文本指令控制AI在游戏中进行建筑,利用开源库将大模型生成的指令转换为游戏内操作,增强了AI的交互性和应用范围。
三、 Kimi发布新模型k0-math,数学能力超o1,产品重点提升留存率
1. Kimi发布新的数学模型k0-math,其数学解题能力或超过OpenAI的o1模型;
2. k0-math模型在处理简单问题时存在过度思考的问题,需要进一步优化;
3. Kimi的创始人杨植麟强调,产品未来的重点是提高用户留存率和模型的深度推理能力。
四、 首个自主机器学习AI工程师轻松获得 Kaggle,刚问世就秒了o1?
1. NEO是一个多智能体系统,能自动化整个机器学习工作流程,节省大量工时;
2. 在50场Kaggle竞赛中,NEO获得了26%的奖牌,表现优于OpenAI的o1模型;
3. NEO不仅提高了工作效率,还能与人类合作,处理复杂的数据挑战。
五、 ChatGPT更新:Mac版支持“读屏编程”,Windows版全员可用了
1. Mac版ChatGPT更新支持“读屏编程”,可直接读取并处理开发工具中的代码;
2. Windows客户端全量上线,免费用户也可使用,支持高级语音模式和搜索功能;
3. “读屏编程”功能目前通过苹果的“辅助功能”接口实现,未来可能扩展到更多应用。
六、 LeCun 世界模型进展,基于预训练视觉特征,能实现零样本规划
1. Yann LeCun 强调现有LLM无法真正理解世界,推崇基于数据的动态世界模型;
2. LeCun团队开发的DINO-WM世界模型能通过预训练视觉特征实现零样本规划;
3. DINO-WM在复杂环境中表现优异,能有效泛化到新的环境配置,展现出较高的场景理解能力.
七、 微软宣布开源多功能视觉模型Florence-2,分割、识别一切图片!
1. 微软开源了多功能视觉模型Florence-2,支持图像描述、目标检测、视觉定位和图像分割等功能;
2. Florence-2使用了大规模数据集FLD-5B进行训练,提高了模型的泛化能力和性能;
3. 模型基于Transformer架构,采用序列到序列学习方法,增强了处理各种视觉任务的灵活性和效率。