快手开源文生图模型-Kolors,性能超越MidJourney和SD3!

2024-07-0709:28:41AI绘画与短视频剪辑Comments1,462 views字数 1047阅读模式

可灵(Kling)文生视频模型已经火到了国外,第一次看到Reddit上一群老外讨论如何申请中国手机号来排队体验,回想我们当时申请ChatGPT账号时的情形,有道是天道好轮回,苍天饶过谁!文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

快手开源文生图模型-Kolors,性能超越MidJourney和SD3!文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

而就在昨天,快手又开源了基于隐空间扩散的文生图大模型Kolors(可图),综合性能超越MidJourney和SD3,代码权重一起发布,外网再次炸锅。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

快手开源文生图模型-Kolors,性能超越MidJourney和SD3!文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

模型主要特点文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

  • 训练数据:基于数十亿条图文数据进行训练,包括大量AI合成数据和中文文本数据。
  • 训练方法:采用两阶段方法进行训练,包括使用广泛知识的概念学习阶段和利用精心挑选的高美学数据的质量改进阶段。
  • 提示词语言:文本编码器采用了GLM而非T5,这使得它在理解和生成中英文文本方面表现出色,尤其是在复杂文本的理解和渲染上。
  • 提示词Tokens限制:支持256上下文Token数量,而SD3只允许75个Tokens
  • 文本渲染能力:支持中文文本渲染。
  • 模型架构:采用主流的U-Net架构而非更先进的DiT架构。这个有点遗憾,因为社区正在向DiT架构迁移,包括SD3、PixArt-Σ,以及腾讯的混元DIT都采用了新架构。

     

模型性能文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

Kolors 在人类评价中表现优异,特别是在视觉吸引力和文本遵循度方面,与市场上现有的模型相比,如 SD3、DALL-E 3 和 Playground-v2.5,以及商业模型 Midjourney-v6,Kolors 展现了更高的性能,在整体满意度和视觉质量上完胜。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

快手开源文生图模型-Kolors,性能超越MidJourney和SD3!文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

快手开源文生图模型-Kolors,性能超越MidJourney和SD3!文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

在提示词遵循度方面,Kolors得分4.17,略微落后于DALL-E3和SD3,略高于MidJourney-V6。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

快手开源文生图模型-Kolors,性能超越MidJourney和SD3!文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

MPS(Multi-Dimensional Human Preference Score)是一种多维度的评估方法,用于评价文本到图像合成模型的性能。Kolors模型在该评估标准中表现出色,获得了最高的整体满意度评分,与Midjourney-v6相当:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

快手开源文生图模型-Kolors,性能超越MidJourney和SD3!文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

模型使用方法文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

免费使用地址:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

https://kolors.kuaishou.com文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

下载地址:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

https://huggingface.co/Kwai-Kolors/Kolors文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

推理代码:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

https://github.com/Kwai-Kolors/Kolors文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

论文地址:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

https://github.com/Kwai-Kolors/Kolors/blob/master/imgs/Kolors_paper.pdf文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

ComfyUI工作流:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

https://github.com/kijai/ComfyUI-KwaiKolorsWrapper文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

模型样张文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

快手开源文生图模型-Kolors,性能超越MidJourney和SD3!文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

快手开源文生图模型-Kolors,性能超越MidJourney和SD3!文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

快手开源文生图模型-Kolors,性能超越MidJourney和SD3!文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

快手开源文生图模型-Kolors,性能超越MidJourney和SD3!文章源自菜鸟学院-https://www.cainiaoxueyuan.com/jianji/64522.html

  • 本站内容整理自互联网,仅提供信息存储空间服务,以方便学习之用。如对文章、图片、字体等版权有疑问,请在下方留言,管理员看到后,将第一时间进行处理。
  • 转载请务必保留本文链接:https://www.cainiaoxueyuan.com/jianji/64522.html

Comment

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定