分类: 数据科学及AI人工智能
thumbnail

大型推理模型存在哪些过度思考的问题

虽然 LRMs 在人工智能领域取得了巨大的进步,但我们仍需警惕过度思考这一潜在问题。通过持续的研究和探索,我们有望找到更有效的解决方案,推动 LRMs 的发展和应用进入一个新的阶段。
thumbnail

DeepSeek-R1强化学习算法:群组相对策略优化(GRPO)

DeepSeek-R1引入了组相对策略优化(GRPO),这是一种高效且有效的强化学习算法。GRPO摒弃了评判模型,而是通过组分数来估计基线,与近端策略优化(PPO)相比,显著减少了训练资源。
thumbnail

PyTorch实现图像分类卷积神经网络(CNN)模型

通过阅读完本文,大家将熟悉PyTorch、卷积神经网络、填充(padding)、步长(stride)、最大池化(max pooling)等概念,并能够自己构建CNN模型进行图像分类。
thumbnail

用好推理模型:OpenAI官方最佳实践指南

OpenAI 发现推理模型特别擅长对具有数百页密集、非结构化信息的复杂文档进行推理——例如法律合同、财务报表和保险索赔。 这些模型尤其擅长在文档之间建立联系,并根据数据中未言明的真相做出决策。
thumbnail

彻底讲透GPT架构及推理原理

清华大学出版社出版的《人工智能概论》中提出,人工智能是对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但它能像人那样思考,也可能超过人的智能。
thumbnail

朱少民:2024 年 AI 编程技术与工具发展的总结

随着大模型技术的迅速发展,在今年,我们明显能感到,AI 已从单一的辅助工具,逐渐演变为软件开发人员不可或缺的助手或伙伴。
thumbnail

这样分析,我读懂了生成对抗网络(GAN)

生成对抗网络(Generative Adversarial Networks,简称GAN)是一种深度学习模型。它通过两个神经网络——生成器(Generator)和判别器(Discriminator)——之间的对抗训练来生成新的、与训练数据类似的数据。
thumbnail

基于DeepSeek构建RAG 系统综合指南(含代码)

利用 DeepSeek 的先进语言模型构建多语言 RAG 系统,为智能文档交互领域开辟了新的道路。通过整合高效的向量存储和检索技术,该系统能够提供准确、上下文感知的回复,同时具备动态更新知识的能力。
thumbnail

DeepSeek-R1深度推理的核心技术:思维链(CoT)

DeepSeek的R1模型在处理逻辑推理、数学计算以及复杂问答等任务时,能够显式地展示其推理过程。R1深度推理的核心技术在于所采用的思维链(Chain of Thought,CoT)技术。
thumbnail

2025年,RAG技术到底进化成啥样了?

RAG技术融合深度分步推理、树状搜索、引用机制、多模态等前沿方法。将检索增强推理建模为马尔可夫决策过程,实现策略性检索。动态决策何时检索外部知识,何时依赖参数化推理。
thumbnail

机器学习过程:特征、模型、优化和评估

深度学习可以通过其自动学习数据中的复杂特征来替代传统的特征工程,减少人工干预的需要。具体来说,深度学习的模型(特别是深度神经网络)能够从原始数据中自动提取层次化的特征,而无需依赖手动设计的特征。
thumbnail

DeepSeek + LangGraph: 探讨并评测推理模型在Agent应用上的能力与表现

一些结论刚好也验证了DeepSeek-R1官方技术报告揭示的自身“能力缺陷”,包括不支持function calling、不擅长多轮对话、结构化输出较弱、提示词与复杂上下文敏感等,我们也期待下一个版本的R1在这些能力上取得突破!
thumbnail

Deepseek-R1与CAG(缓存增强生成)结合提升问答质量

DeepSeek模型与CAG技术的结合,为构建高效问答系统提供了全新的思路和方法。通过充分利用DeepSeek的强大语言理解和生成能力,以及CAG技术的缓存增强生成机制,系统能够实现快速、准确的问答服务。
thumbnail

构建机器学习模型的九个关键步骤

构建机器学习模型的第一步是需求分析。这一步的目标是明确模型需要解决的具体问题,以及满足哪些性能指标。需求分析需要与业务团队紧密合作,确保对问题的理解准确无误。
thumbnail

传统检索增强生成(RAG)到缓存增强生成(CAG)的转变探索

随着技术的不断发展,混合方法有望成为主流,通过整合 RAG 和 CAG 的优势,构建更加高效、智能的人工智能应用,满足日益增长的多样化需求。在这个过程中,持续的技术创新和场景适配将是推动人工智能技术不断进步的关键。
thumbnail

计算机视觉算法全解析:从传统方法到深度学习的演变

从传统的机器学习到现代的深度学习,从简单的图像分类到复杂的视频处理,计算机视觉的算法模型不断演进,推动着技术的飞速发展。
thumbnail

Deepseek成功启示:从 TRPO 到 GRPO训练LLM

强化学习已成为训练大型语言模型不可或缺的一部分。从TRPO到PPO,再到最新的GRPO,这些算法不断推动着LLMs的创新和发展。通过平衡稳定性、效率和人类对齐,RL算法使LLMs能够更好地理解和生成自然语言,从而在各个领域发挥更大的作用。
thumbnail

DeepSeek技术基石:MoE、数据并行与模型并行全解析

MoE架构代表了深度学习模型发展的一个重要方向,它通过稀疏化和专家机制,不仅提升了大模型的训练效率,还为多任务、多模态处理开辟了新的可能性。尽管在实际应用中存在一定的挑战,但随着技术的不断进步,MoE将成为未来大规模模型训练和推理的核心架构之一。
thumbnail

概率模型在人工智能领域中的深度应用

概率模型是统计学和机器学习中的一个核心概念,它基于概率论,通过对随机事件发生的可能性进行建模,来预测和解释现实世界中的现象。在人工智能领域,概率模型被广泛用于处理不确定性问题,提高算法的鲁棒性和准确性。
thumbnail

用Python从头构建GPT文本分类器

针对分类任务,对预训练模型进行微调是一个简单有效的 LLM 知识入门方式。其次,文本分类有许多商业应用场景,比如:垃圾邮件检测、情感分析、客户反馈分类、主题分类等等。
thumbnail

用OpenCV和Python构建自己的图像分类标注工具

学习了如何为图像分类任务创建一个简单的标注工具。我们可以对这个工具进行很多改进。我想进一步探索的一件事是添加不仅分类图像的功能,还可以分割图像并创建分割掩码。
thumbnail

DeepSeek为何如此强大?深度解析3大AI加速技术(知识蒸馏、量化与压缩)

AI模型的优化和加速在资源受限的环境中尤为重要,知识蒸馏、无监督学习、模型量化和压缩加速方法为解决这一难题提供了多种解决方案。通过合理运用这些技术,我们能够在确保模型性能的同时,极大地提高计算效率和资源利用率
thumbnail

AI教母李飞飞团队训练出媲美DeepSeek R1推理模型,云计算费用不到50美元附代码

2025 年 1 月,李飞飞团队提出了一种极简的测试时扩展(test-time scaling)方法,仅需对预训练模型进行少量监督微调(SFT)并结合动态推理控制技术,即可显著提升语言模型的数学推理能力。
thumbnail

大模型技术之AIGC架构

AIGC架构通过分层解耦与能力抽象,实现了数据、模型、服务的有机协同,为多行业智能化转型提供了坚实底座。其核心价值在于平衡通用性与定制化需求,但需在数据治理、性能优化及安全合规等方向持续改进。