欧洲人工智能初创公司推出”鸡脑”和”蝇脑”模型,94MB的极小AI能在苹果手表上离线操作
发布时间:2025-08-18 11:46:29 | 责任编辑:吴昊 | 浏览量:3 次
欧洲知名AI初创公司Multiverse Computing近日发布了两款极其微小的AI模型,小到可以用鸡脑和蝇脑来命名。该公司声称这是全球最小但仍保持高性能的模型,能够处理聊天、语音识别,其中一款甚至具备推理能力。
这些超小型模型专为物联网设备设计,同时可以在智能手机、平板电脑和个人电脑上本地运行。公司创始人罗曼·奥鲁斯向TechCrunch表示:"我们可以将模型压缩到如此程度,使其能够适配各种设备。你可以在本地运行它们,直接在iPhone上,甚至在Apple Watch上。"
Multiverse Computing总部位于西班牙多诺斯蒂亚,在全球设有办公室,员工约100人,是一家备受关注的欧洲AI初创公司。该公司由欧洲顶级量子计算和物理学教授罗曼·奥鲁斯、量子计算专家塞缪尔·穆格尔和前Unnim银行副首席执行官恩里克·利萨索·奥尔莫斯共同创立。
今年6月,该公司凭借名为"CompactifAI"的模型压缩技术成功融资1.89亿欧元(约2.15亿美元)。自2019年成立以来,公司累计融资约2.5亿美元。
CompactifAI是一种量子启发的压缩算法,能够在不牺牲模型性能的前提下减小现有AI模型的体积。奥鲁斯解释说:"我们拥有的压缩技术不是计算机科学或机器学习领域人员会采用的典型压缩技术,因为我们来自量子物理学背景。这是一种更加精妙和精细的压缩算法。"
该公司已经发布了大量开源模型的压缩版本,特别是流行的小型模型如Llama4Scout或Mistral Small3.1,并刚刚推出了OpenAI两个新开源模型的压缩版本。公司还压缩了一些大型模型,比如提供DeepSeek R1Slim版本。
专注于模型小型化的Multiverse将额外精力投入到创造尽可能小但功能强大的模型上。其两款新模型小到足以为几乎任何物联网设备带来聊天AI功能,并且无需互联网连接。公司幽默地称这个系列为"模型动物园",因为产品是根据动物大脑尺寸命名的。
名为SuperFly的模型是Hugging Face开源模型SmolLM2-135的压缩版本。原始模型有1.35亿个参数,专为设备端使用开发。SuperFly压缩至9400万个参数,奥鲁斯将其比作蝇脑的大小。他说:"这就像拥有一只苍蝇,但稍微聪明一点。"
SuperFly专为在极其受限的数据上进行训练而设计,比如设备操作数据。Multiverse设想将其嵌入家用电器中,让用户能够通过语音命令操作设备,如对洗衣机说"开始快洗",或询问故障排除问题。通过少量处理能力(如Arduino),该模型就能处理语音界面,公司向TechCrunch进行了现场演示。
另一款名为ChickBrain的模型更大,有32亿个参数,但功能也更强大,具备推理能力。Multiverse表示这是Meta Llama3.18B模型的压缩版本,但小到足以在MacBook上运行,无需互联网连接。
更重要的是,奥鲁斯表示ChickBrain在多个标准基准测试中实际上略微超越了原始模型,包括语言技能基准MMLU-Pro、数学技能基准Math500和GSM8K,以及通用知识基准GPQA Diamond。
需要注意的是,Multiverse并未声称其模型动物园会在这些基准测试中击败最大的最先进模型,动物园的性能甚至可能不会出现在排行榜上。关键在于该公司的技术能够在不影响性能的情况下缩小模型尺寸。
奥鲁斯表示,公司已在与所有领先的设备和家电制造商进行洽谈。他说:"我们正在与苹果洽谈,也在与三星、索尼和惠普对话。惠普在最后一轮融资中作为投资者参与进来。"这轮融资由知名欧洲风投公司Bullhound Capital领投,包括HP Tech Ventures和东芝在内的多家机构参与。
这家初创公司还为其他形式的机器学习提供压缩技术,如图像识别,在六年时间里已获得巴斯夫、Ally、穆迪、博世等客户。
除了直接向主要设备制造商销售模型外,Multiverse还通过托管在AWS上的API提供压缩模型,任何开发者都可以使用,通常比竞争对手收取更低的token费用。
欧洲 AI 初创公司 Multiverse Computing 本周正式发布了两个“昆虫级”超微型 AI 模型——
• SuperFly(“蝇脑”,9400 万参数,94 MB)
• ChickBrain(“鸡脑”,32 亿参数,约 3 GB,仍远小于同级模型)
借助量子物理启发的“CompactifAI”压缩算法,这两款模型在尺寸被极度压缩的同时,仍保留了完整对话、语音识别甚至推理能力,并可在 iPhone、MacBook、Arduino 乃至 Apple Watch 上完全离线运行。
关键信息一览
-
体积与性能
– SuperFly 仅 94 MB,在 2 GB RAM 的安卓手表上就能跑到 8 token/s,连续对话 4 小时仅耗电 5%。
– ChickBrain 尽管压缩到 32 亿参数,却在 MMLU-Pro、Math500 等多个基准上略优于原始 Llama 3.1 8B。 -
技术路线
– CompactifAI 并非传统剪枝/量化,而是借鉴量子多体物理的张量网络压缩,能把主流开源模型再压到 1/20~1/30 体积,精度损失 ≤3%。 -
落地场景
– 已现场演示用 Arduino 驱动洗衣机语音交互;公司正与苹果、三星、索尼、惠普等洽谈预装。
– 除直接授权给设备商,还通过 AWS API 向开发者提供 GGUF/ONNX/TFLite 多格式文件,token 成本低于市面主流服务。 -
公司背景
– 2019 年成立于西班牙圣塞巴斯蒂安,累计融资 2.5 亿美元,6 月刚完成 1.89 亿欧元 B 轮。
– 客户已包括博世、巴斯夫、穆迪、Ally 等,业务横跨语音、图像、量化金融多领域。
一句话总结:Multiverse 把“大模型装进苍蝇脑”,让 AI 在手表、耳机、冰箱等最小设备上也能离线跑,真正开启了“边缘 AI 无处不在”的序幕。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。