[AI每日快讯·20241113]苹果押注智能眼镜,百度发布小度 AI 眼镜

发布时间:2024-11-13 17:31:21 · 责任编辑:字母汇 · 浏览量:63 次

一、  Scaling Law继续?MIT发现还有把「测试时训练」的路可走

1. OpenAI的Scaling Law面临挑战,数据供应减少影响了模型质量提升;

2. MIT研究了测试时训练(TTT),发现其在few-shot学习和抽象推理中效果显著;

3. TTT结合增强的数据生成和模型适应器,显著提高了语言模型在ARC任务中的表现,突破了现有技术水平。

https://mp.weixin.qq.com/s/tfrG21mfteVAkjqYx5mDsQ

二、  港中文、上海AI Lab、腾讯两张3090跑SearchGPT并开源

1. Vision Search Assistant(VSA)结合视觉语言模型和Web搜索技术,可回答关于未见图像或新概念的问题;

2. VSA在图像描述、Web知识检索和推理方面表现出色,超过了现有技术如Perplexity.ai Pro和GPT-4-Web;

3. 开源版本可通过两张RTX3090复现,潜力广泛,包括在视频、3D模型和声音等领域的应用。

https://mp.weixin.qq.com/s/xa0oS-LPnZAQqEyUozf_eg

三、  开源代码模型更新,320亿参数Qwen2.5-Coder新模型发布

1. Qwen2.5-Coder-32B新开源编程模型发布,在多个基准测试中超越GPT-4o;

2. 该模型支持92种编程语言,并在代码生成、修复、推理等方面表现出色;

3. 开源版本提供多种尺寸,适合开发者微调或直接使用,具有高易用性,受到广泛关注。

https://mp.weixin.qq.com/s/K55WD7466VMTGiYJVsMZUA

四、  苹果也在押注的智能眼镜正在爆发,百度发布小度 AI 眼镜

1. 百度发布了首款搭载中文大模型的AI眼镜,具备多种实用功能,如边走边问、实时翻译等;

2. 小度AI眼镜强调长时间佩戴的舒适性与高硬件规格,目标成为智能眼镜市场的竞争者;

3. 另外还展示了智能体技术的应用,强调无代码工具、智能体协作等新兴AI技术。

https://mp.weixin.qq.com/s/Y6iiGLG6lFlk22WtQWSKyg

五、  AI辅助披头士乐队《Now and Then》获得格莱美奖两项提名

1. 披头士乐队的《Now and Then》获得了2025年格莱美奖两项提名,分别为年度唱片和最佳摇滚表演;

2. AI技术帮助从约翰·列侬的原始录音中提取嗓音,成功重制了这首曲目;

3. 这是披头士乐队几十年来首次获得格莱美提名,也是乐队第四次进入年度唱片提名名单。

https://mp.weixin.qq.com/s/kvsNJVgK6-lpwCdgJfFjag

六、  扩散模型失宠?端侧、非自回归图像基础模型Meissonic登场

1. Meissonic是一款新型非自回归掩码图像生成模型,旨在高效生成高分辨率图像并超越传统扩散模型SDXL;

2. 该模型通过创新的Transformer架构、位置编码和特征压缩层,提升生成效率和图像质量,适配消费级硬件;

3. Meissonic在图像质量、生成速度和推理效率上超越了现有技术,特别适合端侧设备应用。

https://mp.weixin.qq.com/s/pYZxK3OFV8CH4VQET4_rLg