[AI每日快讯·20241114]OpenAI总裁Greg出走3月终于归来
发布时间:2024-11-14 10:28:08 · 责任编辑:字母汇 · 浏览量:29 次
一、 OpenAI总裁Greg出走3月终于归来!专注重大技术挑战
1. Greg Brockman结束休假,重返OpenAI并将专注技术挑战,每周投入100小时编写代码;
2. OpenAI经历高层离职潮,Mira Murati等人离开后,Brockman的回归有助于稳定公司;
3. Brockman的工作风格受到争议,虽然技术能力强,但其代码常缺乏文档,影响团队协作。
二、 吴佳俊团队新作:场景语言,智能补全文本到3D的场景理解
1. 斯坦福团队提出“场景语言”(Scene Language),通过自然语言生成和编辑三维场景;
2. 该方法结合程序语言、自然语言和神经网络表征,有效描述和调整物体位置、风格等细节;
3. 相较传统方法,Scene Language在用户偏好和物体数量控制上表现出显著优势,具有广泛应用潜力。
三、 对标谷歌NotebookLM!语音生成模型PlayDialog beta版本
1. PlayDialog是一个端到端AI语音生成模型,能根据对话历史调节语调、情感和语速,适用于对话播客、旁白等应用;
2. 另外,还有PlayNote是一款将多种媒体文件转化为对话体验的工具,支持快速生成播客、简报和旁白,并提供API接口;
3. PlayDialog经过数亿次对话训练,具备超越市场竞争对手的语音生成表现,能够理解对话上下文,实现更自然、富有表现力的语音合成。
四、 苹果新AI硬件曝光,Apple Intelligence家居版“贾维斯”登场
1. 苹果将于明年3月推出一款AI智能家居控制设备,配备6英寸屏幕,结合Siri和Apple Intelligence;
2. 设备支持家电控制、视频通话和安全功能,并与苹果的智能家居框架HomeKit兼容;
3. 计划推出更高端版本,配备机械臂和AI个性化功能,专注于家庭或工作空间的AI伴侣角色。
五、 秘塔AI引入“专题”功能,用搜索结果和信息源生成个人知识库
1. 秘塔AI新增“知识库”功能,可将AI搜索结果和信息源收藏至专题;
2. 专题支持自定义分类,用户可上传文件,形成私域知识库,方便后续查询和管理;
3. 提供协同编辑和API接口,知识库可共享,进一步扩展了AI搜索和内容管理的应用场景。
六、 宇树科技也来玩开源了:开源Unitree G1机器人操作数据集
1. 宇树科技开源了Unitree G1机器人操作数据集,包含数据采集、学习算法、数据集和模型,并将持续更新;
2. 数据集基于HuggingFace 的LeRobot框架进行训练和测试,涵盖五种操作,如拧瓶盖、叠积木等;
3. G1机器人搭载三指灵巧手和视觉传感器,已实现量产,售价9.9万元起,支持深度强化学习和仿真训练。