Stability AI发布“FreeWilly”，从图像到文本生成性能相当ChatGPT 4.0

2023-8-9

英国人工智能开发商Stability AI 在图像生成和文本生成领域又有了新动作！他们最新发布的“FreeWilly1”和“FreeWilly2”模型正在引起巨大关注，因为它们的性能相当于备受瞩目的“ChatGPT Advance”。

这两个模型分别利用 Meta 开源的大规模语言模型“LLaMA 65B”和“LLaMA 2 70B”，并经过精心微调使用全新的合成数据集。尤其是“FreeWilly2”在某些任务上取得了与“ChatGPT”所采用的“GPT-3.5”相媲美的表现，真是令人赞叹不已。

最令人振奋的是，Stability AI 全部发布的模型都是在非商业许可下，旨在推动开放式研究。他们内部的评估团队还在不遗余力地对这两个模型进行评估，期待社区的反馈和贡献。

“FreeWilly1” 和 “FreeWilly2”的设计灵感特别来自于微软论文“Orca: Progressive Learning from Complex Explanation Traces of GPT-4”。虽然数据生成过程类似于该论文，但数据来源却截然不同。Stability AI 运用 Enrico Shippole 创建的多种数据集，成功生成了包含 600,000 个数据点的全新数据集，约为“Orca”所用数据集的 10%。这不仅显著减少了训练时间，还为模型性能的提升奠定了基础。

这两种模型都经过 EleutherAI 的“lm-eval-harness”（一种著名的 LLM 基准）评估，并且添加了“AGIEval”。在复杂推理、微妙语言理解以及解决法律和数学等专业领域的问题上，它们展现出卓越的问答能力，实至名归。

我们来看看与ChatGPT3和ChatGPT4的对比结果：

这些令人鼓舞的结果已由 Stability AI 的研究人员进行了验证，并在 Hugging Face 上得到独立复现和发布。他们的持续努力为AI领域的进步贡献着无尽动力，我们期待看到更多令人惊叹的创新和突破。加油，Stability AI！让我们共同见证AI技术的辉煌时刻！

THE END