Stability AI发布“FreeWilly”,从图像到文本生成性能相当ChatGPT 4.0
英国人工智能开发商Stability AI 在图像生成和文本生成领域又有了新动作!他们最新发布的“FreeWilly1”和“FreeWilly2”模型正在引起巨大关注,因为它们的性能相当于备受瞩目的“ChatGPT Advance”。
这两个模型分别利用 Meta 开源的大规模语言模型“LLaMA 65B”和“LLaMA 2 70B”,并经过精心微调使用全新的合成数据集。尤其是“FreeWilly2”在某些任务上取得了与“ChatGPT”所采用的“GPT-3.5”相媲美的表现,真是令人赞叹不已。
最令人振奋的是,Stability AI 全部发布的模型都是在非商业许可下,旨在推动开放式研究。他们内部的评估团队还在不遗余力地对这两个模型进行评估,期待社区的反馈和贡献。
“FreeWilly1” 和 “FreeWilly2”的设计灵感特别来自于微软论文“Orca: Progressive Learning from Complex Explanation Traces of GPT-4”。虽然数据生成过程类似于该论文,但数据来源却截然不同。Stability AI 运用 Enrico Shippole 创建的多种数据集,成功生成了包含 600,000 个数据点的全新数据集,约为“Orca”所用数据集的 10%。这不仅显著减少了训练时间,还为模型性能的提升奠定了基础。
这两种模型都经过 EleutherAI 的“lm-eval-harness”(一种著名的 LLM 基准)评估,并且添加了“AGIEval”。在复杂推理、微妙语言理解以及解决法律和数学等专业领域的问题上,它们展现出卓越的问答能力,实至名归。
我们来看看与ChatGPT3和ChatGPT4的对比结果:
这些令人鼓舞的结果已由 Stability AI 的研究人员进行了验证,并在 Hugging Face 上得到独立复现和发布。他们的持续努力为AI领域的进步贡献着无尽动力,我们期待看到更多令人惊叹的创新和突破。加油,Stability AI!让我们共同见证AI技术的辉煌时刻!