分类: 数据科学及AI人工智能
thumbnail

大语言模型LLM和自然语言处理NLP的区别是什么?

自然语言处理(NLP)与大型语言模型(LLM)在处理人类语言方面各有独特方法:NLP侧重于具体的算法建模,而LLM则通过大规模预训练获得广泛能力,两者相辅相成。
thumbnail

DeepSeek技术报告解析:为什么R1 可用低成本训练出高效模型

DeepSeek-R1 的成功表明,通过创新的训练方法和精心设计的架构,可以在保持模型性能的同时显著降低训练成本。这为未来大语言模型的开发提供了新的思路,特别是在资源受限的情况下如何实现高性能模型的训练。
thumbnail

LangGraph如何一步一步构建动态订单管理系统?

LangGraph 是一个库,它为 LangChain 工作流带来了基于图的方式。传统的管道通常线性地从一个步骤移动到另一个步骤,但现实世界的任务常常需要分支、条件逻辑,甚至循环(重试失败的步骤、澄清用户输入等)。
thumbnail

数据科学扫盲:从训练到部署大模型LLMs

LLMs具有改变自然语言处理领域的潜力,但训练和改进这些模型需要特定的技能和知识。随着对自然语言处理的需求不断增长,大型语言模型在机器学习和数据科学中扮演着越来越重要的角色。通过了解优化这些模型所涉及的技术和方法,数据科学家可以充分发挥自然语言处理的潜力,构建更高效、更有效的机器学习系统。
thumbnail

计算机视觉进阶:OpenCV图像处理最佳实践解析

计算机视觉领域,OpenCV无疑是最广泛使用的工具之一。无论是初学者还是专业开发者,OpenCV都提供了丰富的功能和灵活的接口,帮助我们轻松实现各种图像处理任务。
thumbnail

DeepSeek 系列模型进化史,5000字解读

我们将深入剖析DeepSeek系列模型的发展历程,探索其背后的创新技术,以及这些技术如何推动开源大语言模型走向新的高度。
thumbnail

DeepSeek是否真绕开CUDA?为什么说CUDA是NVIDIA的核心壁垒

CUDA(Compute Unified Device Architecture,计算统一设备架构)是 NVIDIA 开发的一种 并行计算平台 和 编程模型,它为开发者提供了一种类似于 C、C++、Python 等编程语言的编程接口,使得他们可以使用这些熟悉的语言来编写能够在 GPU 上运行的代码,而无需深入了解 GPU 的底层硬件细节。
thumbnail

DeepSeek vs. ChatGPT vs. Gemini:三大LLM全面对比

DeepSeek、ChatGPT和Gemini代表了AI技术的三个方向:通用化、多模态化和高效化。它们的竞争不仅推动技术进步,更为用户提供了多样化的选择。无论是开发者、企业还是研究者,理解其差异都能帮助更好地利用AI赋能业务。
thumbnail

一文搞懂DeepSeek - AI强化学习和蒸馏技术

LLMs的推理能力仅通过强化学习来激励?DeepSeek-R1-Zero表明大型语言模型(Large Language Models)的推理能力可以仅通过强化学习来激励,而无需监督微调。
thumbnail

DeepSeek 如何利用多头潜在注意力(MLA)进行输出速度优化?

LLM 生成文本慢的核心原因是自注意力计算复杂度高,而 KV Cache 通过存储计算结果,减少了重复计算,大幅提升了效率。但 KV Cache 也会占用大量内存,而 DeepSeek 的 MLA 机制 通过潜在空间投影,压缩 Key-Value 存储,进一步优化了性能。
thumbnail

深度剖析DeepSeek-R1实现原理,强化学习功不可没

DeepSeek-R1的成功让大家的目光再次投向了强化学习,这个曾经让AlphaGO风靡全球的训练范式。除了少量的监督微调SFT之外,DeepSeek-R1几乎是完全通过强化学习训练出来的,而且展现出了强大的推理能力。
thumbnail

“朴素贝叶斯”模型:如何用简单概率解锁复杂数据?

朴素贝叶斯算法就像一个“凭经验判断”的小助手,通过统计过去的经验,来判断未来的事情。它简单高效,虽然有一些局限,但通过优化,依然能在很多场景中大放异彩!
thumbnail

DeepSeek-R1 蒸馏模型及如何用 Ollama 在本地运行DeepSeek-R1

DeepSeek - R1 蒸馏模型是强大的 DeepSeek - R1 人工智能系统的精简高效版本。DeepSeek - R1 作为一个高性能人工智能,擅长处理复杂任务,如解答复杂数学问题、精确编写代码以及回答棘手的问题,在技术领域引发了广泛关注,常被拿来与 OpenAI 等行业巨头的产品相提并论。
thumbnail

解锁AI语音交互最佳实践:用Agora RTC + TEN 搞定一切!

GPT-4o-Realtime 到 TEN 框架,再到 Agora RTC 和 Azure OpenAI 的组合,这一整套方案几乎覆盖了所有语音交互的技术难点。更重要的是,它降低了开发门槛,让更多人能轻松实现“实时语音AI”。
thumbnail

HuggingFace 推出最小体积多模态模型,浏览器运行成为现实!

随着技术的不断进步,我们可以预见,SmolVLM 系列将成为越来越多实际应用的核心技术,推动各行各业的智能化进程。而对于开发者来说,这些模型不仅是多模态任务的强大工具,也是高效、高性价比的解决方案。
thumbnail

基于 DeepSeek R1 和 Ollama 开发 RAG 系统(含代码)

借助 DeepSeek R1 和 Ollama 构建 RAG 系统,为开发者提供了一种高效、低成本且安全可靠的解决方案。通过详细的步骤指导和丰富的技术支持,开发者能够快速搭建起满足自身需求的智能问答系统,充分挖掘文档数据的价值。
thumbnail

构建良好的机器学习模型的10个步骤

机器学习算法通常涉及复杂的数学原理,如概率论、统计学和线性代数等。为了更好地理解和应用这些算法,需要掌握这些数学基础知识。同时,选择一门适合的编程语言和相关工具对于实践机器学习至关重要。
thumbnail

AI时代的神经网络入门:从原理到应用!

神经网络作为深度学习的核心技术,在许多领域取得了显著的成功。尽管它具有很多优点,但也面临着数据需求大、计算开销高等挑战。理解神经网络的原理、结构和应用,能帮助我们更好地使用这项强大的技术。
thumbnail

Stable Diffusion稳定扩散模型一文详解

Stable Diffusion是一种基于深度学习的文本到图像生成模型,由Stability AI、CompVis和LAION等团队合作开发。它是一种潜在扩散模型(Latent Diffusion Model),能够在给定文本描述的情况下生成高质量的图像。
thumbnail

智能体(Agent)、AIGC、AGI:大模型时代的“三剑客”

智能体(Agent)就像是 AI 的“行动派代表”,它是一种能够自主感知环境、做出决策并采取行动的计算实体。简单来说,Agent就像是AI的“行动派”,它不仅能思考,还能通过工具和行动去完成复杂的任务。
thumbnail

下一代 AI 模型DeepSeek-V3 的全面解读

DeepSeek-V3 作为 AI 领域的一项重大突破,凭借其创新的架构、先进的训练技术和广泛的应用前景,为解决复杂问题提供了强大的工具。尽管它还存在一些需要解决的问题,但随着技术的不断发展和完善,DeepSeek-V3 必将在未来的 AI 发展中发挥更加重要的作用,引领人工智能迈向新的高度。
thumbnail

智能技术架构解析:AI是如何从数据到应用一步步实现的?

这套智能技术架构由用户层、展示层、网关层、应用层、模型层、数据层、设施层七个部分组成,从上至下,逐层搭建,形成了一套严谨、稳定且高效的智能技术体系。
thumbnail

Scipy线性规划:机器学习中的优化利器

线性规划(Linear Programming, LP)是运筹学中数学规划的一个重要分支,用于在一组线性不等式的约束条件下,找到线性目标函数的最大值或最小值。
thumbnail

AI模型小型化与高效化之道:模型蒸馏(Model Distillation)

模型蒸馏作为人工智能领域的一项关键技术,通过知识迁移实现了大型模型向小型高效模型的转化,在成本效益、推理速度、资源优化和可扩展性等方面展现出显著优势。