分类: 数据科学及AI人工智能
thumbnail

OpenAI Sora 关键技术:时空碎片 (Spacetime Patches) 揭秘

作者 | Vincent Koc 编译 | 岳扬 人工智能如何将静态图像转换为动态、逼真的视频?OpenAI 的 Sora 通过创新性地使用时空碎片技术(spacetime patches)给出了……
thumbnail

揭秘!ChatGPT工作原理、逐词生成艺术

2022年11月问世以来,ChatGPT不仅在AI领域引发了革命性的变革,更在公众视野中掀起了前所未有的热潮。它的出现,仿佛是一颗投入平静湖面的石子,激起了层层涟……
thumbnail

chatGPT 到 Sora,OpenAI 为什么能成功超越谷歌、Meta?

Sora 成功背后的技术分析。 文章来源于Founder Park ,作者 | Founder Park Sora 的出现,再次证明了 OpenAI 试图让计算机去模拟真实物理世界的野心,以及它……
thumbnail

2024年国内无限制使用ChatGPT4.0的方法

作者:学长AI学习 来源:知乎 一、GPT都有哪些模型呀? 首先截止到现在,GPT推出了GPT-3.5、GPT-3.5 turbo、GPT-4.0、GPT-4.0 Turbo、GPT-4.0 Vision(AI识图……
thumbnail

OpenAI Sora文生视频技术原理解读

OpenAI Sora文生视频(图像看作单帧视频)一放出就炸翻整个AI 圈,也是ChatGPT掀起GenAI热潮时隔一年后,OpenAI再次史诗级的更新。OpenAI 随后公布的技术综述[……
thumbnail

OpenAI刷屏的Sora模型,是如何做到如此强悍的?

OpenAI 发布了新的文生视频大模型,名为 “ Sora ”。 Sora 模型可以生成最长 60 秒的高清视频,生成的画面可以很好的展现场景中的光影关系、各个物体间的物理遮……
thumbnail

谷歌Gemini 大模型Pro 版本全面使用指南

Gemini 是谷歌推出来对抗OpenAI GPT 的大语言模型,出来也有一段时间了,有朋友私信问如何能用上,今天就给大家分享一下使用指南。实际上Gemini 有3 个不同的……
thumbnail

文心一言、讯飞星火、ChatGPT大模型的横向比较

文心、讯飞、ChatGPT大模型的横向比较分析发现,大模型最终的优异表现依赖于模型规模的突破。 通过比较不同规模的大模型,分析发现大模型的强大生成能力主要源自……
thumbnail

字节跳动推出MagicVideo-V2:引领AI视频生成新时代

仅凭一段文字就能生成一段高清、流畅的视频?现在,这个梦想已经成为现实!字节跳动公司最新推出的MagicVideo-V2,正是一款能够将你的文字描述转化为精美视频……
thumbnail

Coze——字节放出地表最强ChatBot,请低调免费使用GPT4!

这款AI产品来自字节跳动,它就是Coze,我愿称之为地表最强。 Coze 是字节跳动推出的一款用来开发新一代 AI Chat Bot 的应用编辑平台,无论你是否有编程基础,……
thumbnail

谷歌Gemini 1.5上线,史诗级多模态硬刚GPT-5!MoE首破100万极限上下文纪录

  新智元报道   编辑:好困 Aeneas 【新智元导读】刚刚,我们经历了LLM划时代的一夜。谷歌又在深夜发炸弹,Gemini Ultra发布还没几天,G……
thumbnail

ConsiStory:无需训练LoRA,快速实现主题一致地文本到图像生成技术

如何保持风格及人物主题不变,快速生成各种不同场景下的图像? 这是目前AI绘画领域都会面临的问题,即使是Midjourney也还在开发角色一致性的功能,上线时间未……
thumbnail

UC Berkeley基于Stable Diffusion提出3DHM新框架,利用3D姿势让照片动起来!

论文名:Synthesizing Moving People with 3D Control 论文链接:https://arxiv.org/pdf/2401.10889.pdf 开源代码:https://boyiliee.github.io/3DHM.github.i……
thumbnail

字节跳动MagicVideo2文本生成视频模型,一句话生成动态视频

文生图大模型已经火了很长一段时间了,而随着技术与模型算法的不断提升,文生视频模型也越来越多。今天就介绍一下字节跳动发布的MagicVideo-V2文生视频大模型……
thumbnail

字节视频生成模型MagicVideo-V2,超过Stable Video Diffusion与Pika 1.0!

引言 文本到视频(T2V)模型的扩散标志着重大进展 ,这一进展是由最近的基于扩散的模型推动的。对于从文本描述中生成高保真视频的需求不断增长,这……
thumbnail

GPT-4 Turbo 128k免费使用,引爆全球创意革命!

人工智能技术的迅速发展正在以前所未有的速度改变着我们的工作和生活方式。而最近,一个令人激动的消息再次震惊了科技界——GPT-4 Turbo 128k宣布免费使用,这……
thumbnail

新一代文生图模型Stable Cascade,碾压SDXL!

StabilityAI在春节期间又整活了,发布了新的一代文生图模型Stable Cascade,Stable Cascade是基于Wuerstchen架构包含三阶段的文生图扩散模型,相比Stable Diff……
thumbnail

文生图Stable Diffusion入门:扩散模型

Stable Diffusion其背后的技术是扩散模型。扩散模型这个概念源自热力学,在图像生成问题中得以应用。 可以简单理解为:任何一张图像都可以通过不断添加噪声变……
thumbnail

换脸到克隆:IP Adapter FaceID技术突破与应用

换脸技术,一直以来都是数字图像处理领域的热门话题。从最早的传统方法到现在的AI驱动技术,换脸技术已经经历了多次重大的技术革新。近年来,随着深度学习和计……
thumbnail

小红书InstantID一张面部图像生成多样风格:WebUI与ComfyUI使用指南

InstantID,网上很多介绍和教程把我看笑了。根本就不可能正常安装使用,全是蹭热点没半点儿干货。于是自己梳理总结,写一下个人使用WebUI与ComfyUI的步骤留着……
thumbnail

英伟达版ChatGPT——Chat With RTX,PC端部署很GPU

金磊 发自 凹非寺 量子位 | 公众号 QbitAI 英伟达推出了自家版本的ChatGPT,名字很有GPU的味道—— Chat With RTX。 英伟达的这款AI聊天机器人和目前主流的“选……
thumbnail

OpenAI官方:ChatGPT记忆功能开启测试,GPT-5更智能

OpenAI官方宣布这个功能开启测试,预计下周向部分免费以及Plus用户推出。 用户可以让ChatGPT记住之前自己的所有对话信息,让它像了解自己过去的老朋友一样和……
thumbnail

AI绘画Stable Diffusion关键技术解析

背景 很多人觉得AI绘画不稳定,对于以后替代插画师、摄影工作者、设计师、表示存疑,作为AI从业者从AI绘画关键技术分析,以前生产者肯定会被淘汰,现在没有到……
thumbnail

卷积神经网络(CNN):如何高效的识别图像?

在神经网络的基础上,看看卷积神经网络(CNN)是如何完成图像识别任务的。 一、图像识别的痛点问题 在CNN出现之前,图像识别有两个大难题: 图像需要处理的数……