分类: 数据科学及AI人工智能
thumbnail

搭建chatgpt:从环境配置到模型训练

搭建chatgpt可能对于初学者来说是一个有一定难度的任务,但是如果你按照以下步骤一步步进行,不仅可以成功进行环境配置,还可以训练你自己的chatgpt模型。 1.……
thumbnail

谷歌新AI模型一键试衣换装,细节不变姿势随意换

【新智元导读】谷歌的新AI模型,直接解决了AI换装的两大难题——既保留衣服细节,又能随意换姿势。以后再剁手,恐怕要更容易了! 一键换装,被谷歌给实现了! ……
thumbnail

GPT模型tokenization(词元化)工作原理揭示

在GPT模型中,tokenization(词元化)指的是将用户输入的文本分割成token(词元)的过程,以让GPT能更好地理解输入文本的词义、句法和语义,以及生成更连贯的……
thumbnail

Tensorflow学习笔记:模型建立与训练篇

一. Python 函数装饰器 装饰器:修改其他函数的功能的函数 def hello(a_func()): def first(): print("hello,") a_func() p……
thumbnail

TensorFlow核心组件系列之Graph的底层机制

Graph(计算图)是TensorFlow的核心组件。在TensorFlow中,Graph承担着重要的角色,用于表示深度学习模型的计算过程和数据流动。 Graph的底层机制涉及TensorFl……
thumbnail

苹果MR牛在哪儿?瞄准3D互联网空间计算做生产工具

一、聚焦空间计算,苹果MR想做生产工具 7年磨一剑,苹果MR Apple Vision Pro深夜问世就已刷爆朋友圈,售价3499美元,差不多两万五人民币,明年年初开卖。话不……
thumbnail

ChatGPT背后的人工神经网络跌宕80年,从命运多舛到颠覆世界

               图源:pixabay 撰文 | 孙睿晨 责编 | 李珊珊 今天,ChatGPT等大型语言预训练神经网络模型已经成为广为人知的名字,GPT背后的算法内核——人工神……
thumbnail

深度学习进阶篇-预训练模型[2]:Transformer-XL、Longformer、GPT原理、模型结构、应用场景、改进技巧

1.Transformer-XL: Attentive Language Models Beyonds a Fixed-Length Context 1.1. Transformer-XL简介 在正式讨论 Transformer-XL 之前,我们先来看看经典……
thumbnail

深度学习进阶篇-预训练模型[3]:XLNet、BERT、GPT,ELMO区别优缺点

1.XLNet:Generalized Autoregressive Pretraining for Language Understanding 1.1. 从AR和AE模型到XLNet模型 自回归模型(Autoregressive Model, AR),通过……
thumbnail

苹果Vision Pro和chatGPT-4,开启“智力盈余”新时代

2023 年已经接近过半,但是还没有什么人说这一年是“XX 元年”,毕竟我们在乐观时代的乐观情绪鼓动下,已经把“AI 元年”“VR 元年”“元宇宙元年”,以及区块链、Web3……
thumbnail

OpenAI发展史与chatGPT实现原理

科技不断发展的过程中,我们一直希望让物体具有类似人的品质。电影,小说中充斥着大量对未来科技的畅想,例如钢铁侠中的JARVIS(Just A Rather Very Intelligen……
thumbnail

State of GPT:OpenAI官方第一次分享大模型内部原理和RLHF训练细节

来源 | web3天空之城 OpenAI的创始成员,前特斯拉高级 AI 总监 Andrej Karpthy 刚在微软 Build 2023 开发者大会上做了专题演讲:State of GPT(GPT 的现状)。……
thumbnail

GPT编程开发:用于复杂代码生产所需要满足的必要条件

GPT用于复杂代码生产所需要满足的必要条件 现在很多人都在尝试用GPT直接生成代码,试图通过自然语言指导GPT完成传统的编码工作。但是,几乎没有人去真正认真的……
thumbnail

微软Build 2023开发者大会:OpenAI创始人Andrej Karpthy揭秘GPT训练细节

OpenAI的创始人之一,大神Andrej Karpthy刚在微软Build 2023开发者大会上做了专题演讲:State of GPT(GPT的现状)。 题目很普通,内容很劲爆。 大家都知道Ope……
thumbnail

微软提出Control-GPT:GPT-4实现可控文本到图像生成

转载自:机器之心 | 编辑:小舟、梓文 扩散模型虽好,但如何保证生成的图像准确高质量?GPT-4或许能帮上忙。 文本到图像生成领域近两年取得了很大的突破,从 G……
thumbnail

华为拥抱人工智能,将推出盘古GPT, 参数规模比肩GPT-4

华为是一家著名的科技公司,拥有强大的技术实力和独特的研发能力,在人工智能领域也有着不俗的表现。近日,据悉华为即将推出盘古GPT产品,这一消息引起了广泛……
thumbnail

GPT-2到GPT-4的演进探索,大语言模型创意能力到底几何?

本文探讨了GPT-2到GPT-4的创造性,并分析了这些模型在不同创造性测试中的表现。作者使用了三种测试来衡量模型的创造性:Remote Associates Test、Alternate Us……
thumbnail

Mu-scaling:大模型科研新范式,无需训练即可预知表现

智源研究院认知与数据团队提出了Mu-scaling:一种基于最大更新参数化(Maximal Update Parametrization, MUP)的损失预测方法。该方法通过MUP放缩规则,生成一组……
thumbnail

什么是Transformer?大语言模型技术原理

人们的工作和生活已经离不开数据访问,而几乎所有平台背后的数据存储和查询都离不开数库。SQL作为一种数据库的查询和处理语言历史悠久,最早由IBM于上世纪70……
thumbnail

QQ AI绘画大模型技术揭秘——QQGC

2022年来,AIGC概念迅速出圈并快速形成产业生态,成为继PGC、UGC之后新的数字内容创作形式。QQ影像中心提出了自研的AI画画技术方案——QQGC,本文作者富宸、王锐……
thumbnail

Pandas AI与ChatGPT超强结合导入LLM大型语言模型,爆赞!

Python Pandas是一个为Python编程提供数据操作和分析功能的开源工具包。这个库已经成为数据科学家和分析师的必备工具。它提供了一种有效的方法来管理结构化数……
thumbnail

nanoGPT:古诗集为例,训练一个自己的gpt模型

使用nanoGPT,手把手带你训练一个属于自己的GPT模型,基于gpt2,优点是cpu也可以跑,简单,快速(LLaMa的模型训练太耗费gpu,很多人也跑不了,所以暂时选择这……
thumbnail

入门 NLP 自然语言处理,如何使用 Python 绘制词云图?

如何使用 Python 制作词云图。 作为 NLP 中最简单的部分,非常适合大家作为入门 NLP 自然语言处理的案例。 本篇文章会给大家详细介绍绘制词云图的整体流程和具……
thumbnail

吴恩达生成式AI课程上线,手把手教你用ChatGPT API构建应用!

吴恩达又给AI社区送福音了。 今日,吴恩达在推特上宣布三门新的生成式AI课程上线。 这三门课包括: 1. 使用OpenAI的ChatGPT API构建系统:通过这门课,可以超……