1、【文生图】:上线文生图功能,支持用户自由输入文本,生成风格多样、画质精美、创意十足的绘画作品
2、【AI形象定制】:上线AI形象定制功能,支持用户输入任意人像图片,定制不同主题的风格化虚拟形象
可图(Kolors)是快手自研的文生图大模型产品。以下是关于它的一些详细信息:
- 功能特点:
- 文生图:用户输入文本描述,可图就能生成风格多样、创意十足的绘画作品。比如输入 “在一片静谧的森林中,有一座古老的城堡”,可图会根据此文本生成相应场景的图片。
- 图生图:用户上传一张图片,系统会依据该图片的风格、主题和细节等内容,生成与原图片相关且符合用户需求的新图片。这一功能在人像处理方面应用广泛,例如用户上传一张自拍照,可生成不同风格的艺术人像照。
- AI 形象定制:通过人像保持技术,可保留人像的自然特征,一键生成各种风格的人像作品,风格模式丰富多样,包括红钻贵族、我的小时候、黏土世界、炫彩琉璃、梦幻莫奈等。
- 技术优势1:
- 参数规模与数据来源:可图大模型的参数规模达十亿级,数据来自于开源社区、快手内部构建和自研 AI 技术合成,覆盖了常见的千万级中文实体概念,这使得模型对中文语义的理解和表达能力较强。
- 引入强化技术:引入了强化学习和奖励模型技术(RLHF),有效解决了文生图大模型在长文本和复杂语义文本输入下的效果问题,能够更好地理解和处理用户的复杂需求。
- 画质提升:在画质提升方面,可图模型通过优化扩散模型的加噪去噪理论,实现了对高质量、细节丰富的图像生成的训练和推理的精准适配。同时,引入经过优质专家标注的图文数据集,进一步提升了模型的性能表现。
- 应用场景:
- 个人创作:为普通用户提供了一种全新的创作方式,无论是创作艺术画作、设计个人头像,还是制作有趣的短视频内容,都可以借助可图快速实现。
- 电商领域:在电商应用场景中,AI 试衣功能具有很大的潜力。商家可以利用该功能快速生成商品的展示图片和视频,降低模特和拍摄成本,提高商品的上新速度;消费者也可以通过 AI 试衣功能更直观地看到商品的穿着效果,提高购买决策的效率。
- 广告与设计行业:为广告和设计行业提供了丰富的创意素材和设计思路,设计师可以利用可图生成的图片作为灵感来源,或者直接将其应用于广告设计中,提高工作效率和创意水平。
AI绘画