AI 进阶指南第二节课，它带着 RAG 向你走来了-DaoCloud 道客

活动中心 / 技术面对面 / AI 进阶指南第二节课，它带着 RAG 向你走来了

AI 进阶指南第二节课，它带着 RAG 向你走来了

技术面对面

2024.07.26

微信图片_20240812134506.png

在第一节课中，我们对大模型的世界有了一个基础的认识，了解了这只“随机鹦鹉”的世界，不论是对于英文字母的数字编码理解，还是更适合中国宝宝的多维度色彩表达编码形式，都在向我们逐步揭示着人工智能的运作规律。

虽然基本规律已经了解，但是即使一项简单的 AI 应用，也远不是掌握基础规律就可以搭建出来的，为了更有效地应用这些规律，我们还需要进一步深入研究和掌握相关的技术。

01 第二节课的关键词：RAG

现在大家最常用的 AI 应用之一就是 Chat GPT，当你开始使用它的时候，肯定有惊艳于它答案的准确和丰富性的时候，也有觉得有些答案千奇百怪、不可理喻的时候，那怎么能让它回答一直准确呢？

当我们搜索答案的时候，会发现很多提升准确率的建议方法中都有 “RAG” 这个技术。那什么是 RAG ?

RAG，Retrieval-Augmented Generation，是一种结合了检索（Retrieval）和生成（Generation）的机器学习模型框架。RAG 技术的核心理念是通过从大型数据库或知识库中检索相关信息，并将这些信息作为上下文输入给生成模型，从而生成更加准确和信息丰富的回答。

这个技术对于大模型落地在真实场景中是个大功臣，RAG 技术通过结合信息检索和文本生成，使得大模型在真实场景中能够更准确地回答问题，将原本可能随机应答的模型转变为可靠、高效的 Chat GPT，那是具体由哪些步骤组成呢？

1. 拆分. 索引：文档被拆分为块，编码为向量，并存储在向量数据库中。
2. 检索：根据语义相似性检索与问题最相关的前 k 个块。
3. 生成：将原始问题和检索到的块一起输入以 LLM 生成最终答案。

我们的 AI 进阶指南课程会深入浅出地向大家分享：这个看似简单的 3 部曲是怎么实现的。

02 RAG 的进阶

明明 RAG 技术已在多个领域广泛应用了，为什么还是会有一些应用给出不准确的答案呢？值得注意的是，即使是同被称作 RAG 技术，它们之间也可能存在差异，这些差异可能是导致错误答案产生的因素之一。我们将目前市面上的 RAG 技术简单分成 3 大类：Native RAG；Advanced RAG；Modular RAG。这 3 类 RAG 技术随着不断地升级、优化之后，可以提高检索质量，提升回答的精准性。

Native RAG 是最基本的形式，它通常依赖于固定的检索策略和简单的生成模型。随着技术的发展，Advanced RAG 引入了更复杂的检索算法和更先进的生成模型。

进一步地，Modular RAG 则代表了技术的高级阶段，它通过模块化设计，允许不同组件之间的灵活组合和优化，以适应不同的应用需求和场景。这种设计不仅提高了系统的可扩展性和可维护性，也使得模型能够更好地适应特定任务。

每一次升级都是对模型架构、算法和数据处理方式的深度优化，那么如何从 Native 升级到 Advanced，再蜕变成 Modular 的 RAG？有没有更真实的案例，可以让我们感受到其中的差别？

别着急，我们在 7 月 30 日的第二节 AI 进阶指南课程上会进行分享。我们将从 RAG 的概念、发展路径及技术详解、落地案例，逐步抽丝剥茧地介绍这项技术的优势、应用和使用挑战。

帮助大家点亮一个新的技能点，赶紧点击下方预约视频号直播，免费干货不容错过。

微信图片_20240812134509.jpg

AI 进阶指南带你探索 AI Agent 的奥秘

技术面对面，创想狮城｜共话云原生 AI 的巅峰之路

AI 进阶指南第二节课，它带着 RAG 向你走来了

技术面对面

01

第二节课的关键词：RAG

02

RAG 的进阶

热门活动