[AI每日快讯·20241113]苹果押注智能眼镜,百度发布小度 AI 眼镜
发布时间:2024-11-13 17:31:21 · 责任编辑:字母汇 · 浏览量:63 次
一、 Scaling Law继续?MIT发现还有把「测试时训练」的路可走
1. OpenAI的Scaling Law面临挑战,数据供应减少影响了模型质量提升;
2. MIT研究了测试时训练(TTT),发现其在few-shot学习和抽象推理中效果显著;
3. TTT结合增强的数据生成和模型适应器,显著提高了语言模型在ARC任务中的表现,突破了现有技术水平。
二、 港中文、上海AI Lab、腾讯两张3090跑SearchGPT并开源
1. Vision Search Assistant(VSA)结合视觉语言模型和Web搜索技术,可回答关于未见图像或新概念的问题;
2. VSA在图像描述、Web知识检索和推理方面表现出色,超过了现有技术如Perplexity.ai Pro和GPT-4-Web;
3. 开源版本可通过两张RTX3090复现,潜力广泛,包括在视频、3D模型和声音等领域的应用。
三、 开源代码模型更新,320亿参数Qwen2.5-Coder新模型发布
1. Qwen2.5-Coder-32B新开源编程模型发布,在多个基准测试中超越GPT-4o;
2. 该模型支持92种编程语言,并在代码生成、修复、推理等方面表现出色;
3. 开源版本提供多种尺寸,适合开发者微调或直接使用,具有高易用性,受到广泛关注。
四、 苹果也在押注的智能眼镜正在爆发,百度发布小度 AI 眼镜
1. 百度发布了首款搭载中文大模型的AI眼镜,具备多种实用功能,如边走边问、实时翻译等;
2. 小度AI眼镜强调长时间佩戴的舒适性与高硬件规格,目标成为智能眼镜市场的竞争者;
3. 另外还展示了智能体技术的应用,强调无代码工具、智能体协作等新兴AI技术。
五、 AI辅助披头士乐队《Now and Then》获得格莱美奖两项提名
1. 披头士乐队的《Now and Then》获得了2025年格莱美奖两项提名,分别为年度唱片和最佳摇滚表演;
2. AI技术帮助从约翰·列侬的原始录音中提取嗓音,成功重制了这首曲目;
3. 这是披头士乐队几十年来首次获得格莱美提名,也是乐队第四次进入年度唱片提名名单。
六、 扩散模型失宠?端侧、非自回归图像基础模型Meissonic登场
1. Meissonic是一款新型非自回归掩码图像生成模型,旨在高效生成高分辨率图像并超越传统扩散模型SDXL;
2. 该模型通过创新的Transformer架构、位置编码和特征压缩层,提升生成效率和图像质量,适配消费级硬件;
3. Meissonic在图像质量、生成速度和推理效率上超越了现有技术,特别适合端侧设备应用。