首页 > 快讯 > GitHub将从4月24日开始默认利用Copilot用户的资料来训练人工智能模型

GitHub将从4月24日开始默认利用Copilot用户的资料来训练人工智能模型

发布时间:2026-03-26 12:18:42 | 责任编辑:张毅 | 浏览量:5 次

GitHub近日宣布将从2026年4月24日起更新其代码库政策,计划利用用户交互数据训练其AI模型。 此次数据采集范围涵盖Copilot Free、Pro及Pro+用户,具体包含模型输入输出、代码片段、上下文信息、仓库结构及聊天交互记录。
GitHub首席产品官Mario Rodriguez表示,引入交互数据旨在提升模型的代码建议准确率与安全性,并称微软内部数据的预先测试已显著提高了建议接受率。值得注意的是,该政策采取“预设加入”机制,受影响用户需手动进入隐私设置关闭相关选项方可退出,这引发了开发者社区关于私有仓库定义及数据确权的广泛讨论。
目前,受合同条款约束的Copilot Business、Enterprise用户以及教育版用户暂不受此变更影响。GitHub在说明中强调,此举符合Anthropic、JetBrains及微软等大厂通行的行业惯例。然而,将私有仓库代码纳入训练集实质上挑战了传统“私有”概念的边界,即便GitHub声称其目的是优化开发工作流。
从行业视角看,随着高质量公域代码数据趋于枯竭,头部AI厂商正加速转向挖掘私有交互数据等“深层数据”以寻求模型性能红利。这一政策转变不仅标志着GitHub从开源托管平台向闭环AI训练生态的进一步倾斜,也预示着AI开发者工具领域正进入数据合规与模型演进博弈的新阶段。

GitHub将从4月24日开始默认利用Copilot用户的资料来训练人工智能模型

这是一篇关于GitHub宣布4月24日起默认使用Copilot用户数据训练AI模型的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐