人工智能与大数据Google AI大模型 Gemini接入指南 Gemimi 介绍 Google 在 2023 年发布的 Gemini 人工智能模型旨在实现真正的通用人工智能。作为一个多模态模型,Gemini 能够跨多种模态无缝对话并提供最佳响应。它是 Googl... 2024-02-27319 viewsCommentsGemini 大模型 阅读全文
人工智能与大数据谷歌Gemini 大模型Pro 版本全面使用指南 Gemini 是谷歌推出来对抗OpenAI GPT 的大语言模型,出来也有一段时间了,有朋友私信问如何能用上,今天就给大家分享一下使用指南。实际上Gemini 有3 个不同的版本,Ultra、Pro和... 2024-02-17450 viewsCommentsGemini 大模型 阅读全文
人工智能与大数据文心一言、讯飞星火、ChatGPT大模型的横向比较 文心、讯飞、ChatGPT大模型的横向比较分析发现,大模型最终的优异表现依赖于模型规模的突破。 通过比较不同规模的大模型,分析发现大模型的强大生成能力主要源自模型的参数量级的飞跃。尽管方法论上大同小异... 2024-02-17467 viewsCommentsChatGPT 大模型 阅读全文
人工智能与大数据AI大语言模型构建流程及预训练步骤 01.确定需求大小 在构建大语言模型的前期准备中,基础设施是最为重要的,GPU的型号以及数据直接关系到模型的训练质量和训练时间。例如:使用单个V100的GPU训练具有1750亿个参数的GPT-3将需要... 2024-02-06473 viewsComments大模型 阅读全文
人工智能与大数据星火认知大模型测评,如何从“AI幻觉”到智能涌现 大模型能否进入生产环境,取决于是否能够从”AI幻觉“过渡到智能涌现。而在这其中,只需要四个核心能力的升级——理解、生成、逻辑和记忆。 自从大模型时代到来以后,大模型的智能涌现能力已产生很多现象级的事件... 2024-02-06261 viewsComments大模型 阅读全文
人工智能与大数据百度文心大模型如何申请使用 1、注册登录百度云 2、进入百度千帆大模型平台 如果没有申请过百度千帆大模型,可能需要填表申请一下。 申请通过后,在这个页面直接点“立即使用”,就可以进入千帆的控制台了。 3、创建应用 在“应用接入”... 2024-02-06314 viewsComments大模型 阅读全文
人工智能与大数据基于Megatron-Core稀疏大模型训练工具:阿里云MoE最佳实践 作者:李鹏1,颜子杰2,王明1,颜海强1,刘振寰2,黄俊1 单位:阿里云人工智能平台PAI1,NVIDIA DevTech Team2 01 概述 随着大模型技术的不断发展,模型结构和参数量级快速演化... 2024-02-06364 viewsComments大模型 阅读全文
人工智能与大数据ChatGPT大模型系统实战:AI大模型从何而来?能做什么? 大模型技术从何而来? 在过去的二十多年里,随着AI系统的发展,模型一直在不断增大,所以“大模型”实际上是一个相对的概念。 刚刚提到的基础模型不是凭空出现的,故事还要从AI模型为什么热衷于追求“大”开始... 2024-02-06293 viewsCommentsChatGPT 大模型 阅读全文
人工智能与大数据ChatGPT、文心一言、通义千问、讯飞星火测评:AI大模型哪家强? 奇偶派(jioupai)原创 作者 |光尘、叶子 编辑 |钊 图源:图虫创意 2023年是大模型风潮大起的一年,目前市面上,文心一言、讯飞星火、通义千问等诸多国产大模型已经开放内测许久,这些大模型的技... 2024-02-02695 viewsCommentsChatGPT 大模型 阅读全文
人工智能与大数据LoRA(低秩自适应)微调语言大模型的实用技巧 目前,微调定制化LLM会耗费工程师的大量时间和精力,而选择合适的微调方法以及掌握相关技巧可以做到事半功倍。 此前,在《微调语言大模型选LoRA还是全参数?基于LLaMA 2深度分析》中,文中对比了全参... 2023-12-08795 viewsComments大模型 阅读全文
人工智能与大数据谷歌Gemini大模型放大招,AI界霸主80%性能赶超GPT4 人工智能遇上谷歌,就像一场科技界的大爆炸!最近,谷歌CEO桑达尔·皮查伊宣布了一个令人震惊的消息:Gemini大模型正式上线,这不仅仅是个普通的更新,这是AI领域的一次革命,一个全新的开始! Gemi... 2023-12-07521 viewsCommentsGemini 大模型 阅读全文
人工智能与大数据快速理解 ChatGPT 背后的大模型技术 在过去的十年中,人工智能领域取得了重大突破,其中自然语言处理(NLP)是其重要子领域之一。NLP使用的模型之一是大型语言模型(LLMs)。LLMs被设计用于处理大量文本数据,采用先进的神经网络架构,学... 2023-11-201,031 viewsCommentsChatGPT 大模型 阅读全文
人工智能与大数据微调语言大模型选LoRA还是全参数?基于LLaMA 2深度分析 本文对比了全参数微调和LoRA,并分析了这两种技术各自的优势和劣势。作者使用了三个真实用例来训练LLaMA 2模型,这提供了比较特定任务的性能、硬件要求和训练成本的基准。本文证明了使用LoRA需要在s... 2023-11-08671 viewsComments大模型 阅读全文
办公软件与工具应用8款国内AI大模型产品,可合法使用无需翻墙 百度文心一言宣布,将率先开放给大家使用。大家都可以在应用商店下载"文心一言App"或登录"文心一言官网"体验。 根据8月15日正式实施的《生成式人工智能服务管理暂行办法》,提供具有舆论属性或者社会动员... 2023-09-092,625 viewsComments大模型 阅读全文
后端程序开发从零入门开发推荐系统:chatGPT、大模型介绍 作者 | gongyouliu编辑 | gongyouliu 自2022年11月30日OpenAI发布chatGPT以来,大模型技术掀起了新一轮人工智能浪潮。chatGPT在各个领域(包括... 2023-08-021,621 viewsCommentsChatGPT 大模型 阅读全文
人工智能与大数据走近大模型:ChatGPT是如何构造和清洗数据的? 数据是基础是现在LLM从业人的共识,尤其是高质量的数据。根据ChatGPT不同阶段的训练过程,数据也分为预训练数据(GPT)和指定微调数据(SFT,RLHF),前者用自回归的方式在尽可能多的数据上以自... 2023-08-021,627 viewsCommentsChatGPT 大模型 阅读全文
人工智能与大数据语言大模型工作原理:内部究竟是如何工作的? 语言大模型内部究竟是如何工作的?本文用最少的数学知识和术语进行解释。本文作者Tim Lee曾任职科技媒体Ars Technica,他近期推出了一份Newsletter《Understanding AI... 2023-08-01882 viewsComments大模型 阅读全文
办公软件与工具应用大模型颠覆搜索:谷歌宣布开放生成式搜索平台AI 搜索引擎,可能真的要变天了! Google 终于要迎来它 25 年来最大的改变,谷歌宣布了开始内测开放【生成式搜索平台(Search Generative Experience,SGE)】,并逐步舍弃... 2023-06-09813 viewsComments大模型 阅读全文
人工智能与大数据State of GPT:OpenAI官方第一次分享大模型内部原理和RLHF训练细节 来源 | web3天空之城 OpenAI的创始成员,前特斯拉高级 AI 总监 Andrej Karpthy 刚在微软 Build 2023 开发者大会上做了专题演讲:State of GPT(GPT ... 2023-06-07945 viewsCommentsChatGPT 大模型 阅读全文
人工智能与大数据GPT-2到GPT-4的演进探索,大语言模型创意能力到底几何? 本文探讨了GPT-2到GPT-4的创造性,并分析了这些模型在不同创造性测试中的表现。作者使用了三种测试来衡量模型的创造性:Remote Associates Test、Alternate Uses T... 2023-06-05844 viewsComments大模型 阅读全文
人工智能与大数据Mu-scaling:大模型科研新范式,无需训练即可预知表现 智源研究院认知与数据团队提出了Mu-scaling:一种基于最大更新参数化(Maximal Update Parametrization, MUP)的损失预测方法。该方法通过MUP放缩规则,生成一组宽... 2023-06-05873 viewsComments大模型 阅读全文
数据结构与算法大模型算法演进:结构及SOTA算法 分布式训练系统包括多个组成部分,如AI集群架构、通信机制、并行技术等。基于这些内容,我们可以设计出不同的大模型算法。下面我们简单讲述下大模型的发展脉络,大模型的结构以及SOTA大模型算法。 大模型发展... 2023-06-051,952 viewsComments大模型 阅读全文
人工智能与大数据什么是Transformer?大语言模型技术原理 人们的工作和生活已经离不开数据访问,而几乎所有平台背后的数据存储和查询都离不开数库。SQL作为一种数据库的查询和处理语言历史悠久,最早由IBM于上世纪70年代初研究关系数据模型时提出,后续发展为一种广... 2023-06-051,587 viewsComments大模型 阅读全文
人工智能与大数据QQ AI绘画大模型技术揭秘——QQGC 2022年来,AIGC概念迅速出圈并快速形成产业生态,成为继PGC、UGC之后新的数字内容创作形式。QQ影像中心提出了自研的AI画画技术方案——QQGC,本文作者富宸、王锐将介绍在QQGC基础大模型训... 2023-06-05984 viewsCommentsAI绘画 大模型 阅读全文