
在第一节课中,我们对大模型的世界有了一个基础的认识,了解了这只“随机鹦鹉”的世界,不论是对于英文字母的数字编码理解,还是更适合中国宝宝的多维度色彩表达编码形式,都在向我们逐步揭示着人工智能的运作规律。
虽然基本规律已经了解,但是即使一项简单的 AI 应用,也远不是掌握基础规律就可以搭建出来的,为了更有效地应用这些规律,我们还需要进一步深入研究和掌握相关的技术。
现在大家最常用的 AI 应用之一就是 Chat GPT,当你开始使用它的时候,肯定有惊艳于它答案的准确和丰富性的时候,也有觉得有些答案千奇百怪、不可理喻的时候,那怎么能让它回答一直准确呢?
当我们搜索答案的时候,会发现很多提升准确率的建议方法中都有 “RAG” 这个技术。那什么是 RAG ?
RAG,Retrieval-Augmented Generation,是一种结合了检索(Retrieval)和生成(Generation)的机器学习模型框架。RAG 技术的核心理念是通过从大型数据库或知识库中检索相关信息,并将这些信息作为上下文输入给生成模型,从而生成更加准确和信息丰富的回答。
这个技术对于大模型落地在真实场景中是个大功臣,RAG 技术通过结合信息检索和文本生成,使得大模型在真实场景中能够更准确地回答问题,将原本可能随机应答的模型转变为可靠、高效的 Chat GPT,那是具体由哪些步骤组成呢?
1. 拆分. 索引:文档被拆分为块,编码为向量,并存储在向量数据库中。
2. 检索:根据语义相似性检索与问题最相关的前 k 个块。
3. 生成: 将原始问题和检索到的块一起输入以 LLM 生成最终答案。
我们的 AI 进阶指南课程会深入浅出地向大家分享:这个看似简单的 3 部曲是怎么实现的。
明明 RAG 技术已在多个领域广泛应用了,为什么还是会有一些应用给出不准确的答案呢?值得注意的是,即使是同被称作 RAG 技术,它们之间也可能存在差异,这些差异可能是导致错误答案产生的因素之一。我们将目前市面上的 RAG 技术简单分成 3 大类:Native RAG;Advanced RAG;Modular RAG。这 3 类 RAG 技术随着不断地升级、优化之后,可以提高检索质量,提升回答的精准性。
Native RAG 是最基本的形式,它通常依赖于固定的检索策略和简单的生成模型。随着技术的发展,Advanced RAG 引入了更复杂的检索算法和更先进的生成模型。
进一步地,Modular RAG 则代表了技术的高级阶段,它通过模块化设计,允许不同组件之间的灵活组合和优化,以适应不同的应用需求和场景。这种设计不仅提高了系统的可扩展性和可维护性,也使得模型能够更好地适应特定任务。
每一次升级都是对模型架构、算法和数据处理方式的深度优化,那么如何从 Native 升级到 Advanced,再蜕变成 Modular 的 RAG?有没有更真实的案例,可以让我们感受到其中的差别?
别着急,我们在 7 月 30 日的第二节 AI 进阶指南课程上会进行分享。我们将从 RAG 的概念、发展路径及技术详解、落地案例,逐步抽丝剥茧地介绍这项技术的优势、应用和使用挑战。
帮助大家点亮一个新的技能点,赶紧点击下方预约视频号直播,免费干货不容错过。

沪公网安备31011002001590| 上海市杨浦区江湾城路 99 号 6 号楼 7F