标签： Transformer - 菜鸟学苑

标签： Transformer

thumbnail

数据科学及AI人工智能

Transformer 模型效率：通过改进注意力机制降低机器学习成本

注意力机制是 Transformer 的核心创新，它为人工智能模型提供了一种全新的方法，使模型能够根据具体任务的需求，灵活地聚焦输入序列的不同部分，从而更深入地理解复杂的语言和结构。

2024-11-22 菜小编

21 0 0

thumbnail

数据科学及AI人工智能

Transformer是什么架构？注意力机制有哪些？

Transformer是一种基于自注意力（Self-Attention）机制的深度学习模型，最初由Vaswani等人在2017年的论文《Attention Is All You Need》中提出。它完全基于注意力机制构建，摒弃了传统的循环和卷积结构，用于解决自然语言处理领域的任务，如机器翻译、文本生成等。

2024-11-11 菜小编

22 0 0

thumbnail

数据科学及AI人工智能

滑动窗口到YOLO、Transformer：深度学习目标检测的AI技术革新

一、早期方法：滑动窗口和特征提取在深度学习方法主导目标检测之前，滑动窗口和特征提取技术在这一领域中发挥了关键作用。通过理解这些技术的基本原理和实现……

2023-11-30 菜小编

13 0 0

thumbnail

数据科学及AI人工智能

Transformer作者：指令型智能体的构建之法

来源 | The Robot Brains Podcast OneFlow编译翻译｜徐佳渝、贾川、杨婷 2017年，Google发布的《Attention Is All You Need》论文提出了Transformer架构，……

2023-07-13 菜小编

10 0 0

thumbnail

数据科学及AI人工智能

什么是Transformer？大语言模型技术原理

人们的工作和生活已经离不开数据访问，而几乎所有平台背后的数据存储和查询都离不开数库。SQL作为一种数据库的查询和处理语言历史悠久，最早由IBM于上世纪70……

2023-06-05 菜小编

24 0 0

thumbnail

数据科学及AI人工智能

ChatGPT 为什么能做数学运算和逻辑推理？Transformers 如何“思考”？

导读: 大火的 ChatGPT 为什么能做数学运算和逻辑推理？来看看本文了解下底层原理吧！ Transformer 模型是 AI 系统的基础。已经有了数不清的关于 "Tran……

2023-04-19 菜小编

16 0 0

thumbnail

数据科学及AI人工智能

后GPT之书：从GPT-3开始，续写Transformer庞大家族系谱

作者：机器之心来源：知乎大语言模型军备战争占据了朋友圈的大部分篇幅，关于这些模型能做什么和有什么商业价值，已经有很多文章探讨。然而，作为一个在人……

2023-04-17 菜小编

2 0 0