
「DaoCloud 道客」云原生大模型产业生态大会于上周 10 月 19 日在上海拉开帷幕,我们荣幸地邀请到了众多业界专家、企业领袖和学术精英共同探讨云原生与大模型产业的创新与发展。通过此次盛会,深入研讨大模型技术的最新应用、推动行业合作与交流,旨在构建更加繁荣、可持续的云原生大模型产业生态。
「DaoCloud 道客」首席运营官-张红兵,在开场致辞中表示,产业生态是一个 1+1 > 2 的组合,随着我们的覆盖面越来越广泛、全面,技术专业化的能力也得到了更好的提升,生态将拥有承接更高难度,更庞大项目的能力,保障业务的真实有效落地。目前,我们已经打通云原生产业链的整体上下游,今天我们就以云原生大模型为主题,从整个产业链底层的算力到上层的应用给大家搭建一个分享交流的平台,特别邀请到了 5 位分享嘉宾,为大家分享大模型与云原生背后的故事。

「DaoCloud 道客」联合创始人兼首席技术官-郭峰表示大模型在企业的落地,并不是一蹴而就的事情,它需要企业具备一些能力,其中有 4 大能力在这一过程中非常重要,第一个能力是算力基础设施的能力,就是我们熟知的 GPU ;第二,是资源编排的能力,有了 GPU 是不是能高效利用;第三,是数据能力,怎么样能更快地把企业现在的数据积累变成大模型需要的高质量的数据供给,就是数据转化的能力;最后一块能力就是模型应用。
为了更好的帮助企业解决刚才 4 个问题,「DaoCloud 道客」创新推出了知识库一体机,它是基于云原生技术的大模型知识库,通过一体机提供的分布式架构,将计算、存储和网络资源分布在多个节点上实现资源高效编排。「DaoCloud道客」知识库一体机内置了 DaoCloud Enterprise 5.0 云原生应用云平台和 DaoCloud AIGC Knowledge 知识库平台,支持适配国产的 GPU,能让客户体验到开箱即用的大模型的能力、知识库的能力。

借着「DaoCloud 道客」知识库一体机发布的机会,「DaoCloud 道客」创始人&首席执行官,云原生计算基金会全球大使-陈齐彦也分享了大模型与云原生这两个潮流技术碰撞背后的因果,「DaoCloud 道客」是一家在云原生开源技术阵地持续学习产出的企业,陈齐彦表示从技术侧的角度来说,没有什么事情会偷偷发生,虽然大家看到的仅仅是结果,但是作为一个在上游技术做大量工作的科技公司,实际一直在观察整个大模型的发展,首先它的发展呈现多元化的趋势,其次应用场景也越来越多样性和广泛化。
同时,我们作为一个聚焦在云原生领域的基础软件公司,发现通用人工智能世界有个很有意思的现象,AI 时代的云原生融入了更多的创新技术,甚至它的创新技术还对基础设施架构产生了翻天覆地的影响。AI 大模型对上支持很多不同的应用场景,对下需要算力支持,在 AI 的上、下半身中间最关键的衔接载体就是我们今天讲的云原生技术或者说是调度引擎。Kubernetes 就是一款目前很成熟的调度引擎,值得一提的是,「DaoCloud 道客」开源团队负责人 Paco Xu(徐俊杰)很荣幸地加入了最新评选出的 Kubernetes 指导委员会(Steering Committee),而他也是第一个入选的中国人,这可以说是一个里程碑式的成就。
在开源的世界里,当你在研究一个关键技术的时候,全世界需要这个技术的人都会来找你,这么说的起因是随着大模型的应用普及,大家发现很多大模型的问题是由算力管理和算力调度不足引起的。再深挖背后原因可以看到,大量的制约其实源于资源利用效率低下、调度不够灵活、以及对基础设施的管理力度不足造成的,并不是单单买足够多的 GPU 卡就可以解决的。这时候, Ray,一个高性能的分布式执行引擎的开源项目,就这样脱颖而出,备受关注了,因为它可以让 AI 大模型的开发效率和工程能力都大幅度提升。除此之外,诸多可以帮助大模型发展和推广的云原生技术也开始受到广泛应用和高度重视,这就使得「DaoCloud 道客」这样的云原生技术企业与大模型产业生态融合的很顺利。
除此之外,我们有了大模型之后,我们解决了什么问题,我们到底用大模型促进了社会什么进步,这个是我们要解决的问题,所以大模型市场里应该有大量的大模型的应用场景和解决方案,这个才是最大的价值,也是「DaoCloud 道客」未来发展方向的追求。

GPU 对于大模型的影响众所周知,在国外技术领先的当下,天数智芯的副总裁-梁斌总给我们带来了个好消息:国产通用 GPU 已经实现量产。作为率先实现通用 GPU 量产的国内企业,在这次生态大会上,梁斌总为我们分享了自主通用 GPU 如何助力落地大模型。他表示,现在提到大模型落地,第一点是算力的需求,大家都在表示算力紧缺,从技术角度讲,从第一代GPT 到现在的 GPT3,GPT4,无论是模型的层数,还是每一层的参数量都呈指数型的增长,同时模型变得越来越大,这就造成计算的需求也就越来越高。
面对上述真实而急切的需求,天数智芯也在产品上不断打磨,目前基于客户应用的不同特点,支持各种主流大模型的微调。天数智芯通用 GPU 的特点主要有:
第一,天数智芯通用 GPU 兼容主流生态,可以实现一键迁移、无缝切换。
第二,天数智芯通用 GPU 产品的收敛趋势跟国际主流产品是一致的。
第三,天数智芯通用 GPU 产品的稳定性非常好。
最后,梁斌介绍,天数智芯的通用 GPU 训练卡和推理卡都跟 DaoCloud Enterprise 5.0 云原生应用云平台,做了适配和产品兼容性认证;双方还将在未来联合推出国产知识库一体机,携手共建数据生态,服务更多的客户。

云猿生数据(ApeCloud) CTO & 联合创始人-蔡松露针对大模型在知识库领域的深度应用做了内容分享,并介绍了 KubeChat。蔡总认为,大模型在文档管理领域有比较好的应用前景,但是在落地过程中会有很多技术挑战。
首先是原始文档的处理,原始文档处理主要包括对不同格式的文档进行解析和提取,以及对文档内容进行分块和切分。在文档解析和提取方面,需要考虑文档的不同格式,以及有价值的信息的识别。在文档分块和切分方面,又需要考虑如何合理地将文档划分成块,和进一步地对每个块进行切分。
其次是 Embedding 模型的选取,Embedding 模型可以帮助我们更好地理解文档的语义信息。在 Embedding 模型选取方面,需要考虑的方面也非常多,比如模型的语言能力、训练的数据集和词汇表、以及模型的检索能力。
大模型选取也很重要,在大模型选取方面,需要考虑模型的语言能力、模型的大小和推理能力。大模型的部署和容量规划也是一个复杂的过程,需要考虑 GPU 型号与大模型的关系、是否采用分布式和并行能力。
当然还有现在逐步被众人所知向量数据库的选取。向量数据库是存储和检索向量数据的数据库,它可以帮助我们快速地检索到相似的文档。选择向量数据库,需要考虑数据库是否开源、容量、性能和高可用能力。
用户与大模型的交互方式也同样重要,它可以是面向场景的 Bot 集成、面向企业内部 SaaS 的数据集成,或者是从有到无,润物细无声。在交互设计方面,需要考虑用户的需求和使用场景,以及如何让用户更好地理解和使用大模型。
蔡总表示,云猿生的 KubeChat 解决方案能够帮助企业应对上述的技术挑战,从而促进大模型在文档管理领域更好的落地应用。

来自上海财大的张立文教授,近年来从事人工智能算法、大模型和金融量化投资的研究,也在会上与大家分享了最近的一些研究内容,在大模型使用中,我们经常有种说法叫作价值观对齐,所谓的价值观对齐其实就是大模型直接给出了你回答,然后你可以选择 like 或者 dislike 进行反馈。相比过去的 AI 智能生活家居产品体验感好得多,主要是加了这些反馈。目前 Chat GPT 4 已经有 100 万亿参数量,它已经可以达成很多金融场景上的 70 分答卷了,大家知道金融场景对于严谨性要求很高,所以 70 分已经是个很不错的分数了。
以券商行业举例,它有非常多的问题想去问,比如最近哪个股票会涨或进哪个行业怎么样,诸如此类这样问题,又或者是像很多财务报表里的信息,总结类的信息其实并不多,我们怎么样获取更及时的信息、给直接的回复,其实就需要非常及时和高质量的数据源进行大模型的持续训练和学习。
银行的应用像一线的分销客户的运营技术,这种法律的合规知识问答、智能的客户助手都是非常容易被 AI 大模型取代的业务模块,更深层例如银行的异常交易的判定、基金资金流向的监管等,当然张教授认为大模型在金融行业的最终应用还是投资策略方向,也相信未来的AI 金融助手可以成为一个理解客户想法的金牌投资金融销售。

大语言模型在内容生成上的影响力遥遥领先,我们从 PGC 到 UGC 到现在的 AIGC 时代,如何解析未来内容生成的趋势,51WORLD 交通事业部研发总监-侯涛博士,为我们分享了数字孪生行业中 AIGC 技术的创新应用与实践。
数字孪生是一种将实物世界与数字世界相连接的技术,通过创建物理实体的数字副本,并与其实时数据相连,以模拟、预测和优化物理实体的行为和性能。其发展需要依赖物联网、大数据、人工智能等技术的支持,以收集和分析实时数据,并将其与数字孪生模型相连接。
AI 大模型,在智慧城市的管理里面,通过挖掘海量的历史数据,总结历史的规律性,来给我们调整交通规划提出指导性的建议。比如新闻中提到一个立交桥的上闸道的措施稍微改了一下,比如说是从一车道变成两车道,或者说一个右转的车道变成直行带右转,这些措施的改善,实际上在拍板的过程中是非常谨慎的,因为不知道这个决定的影响方向是好是坏,但是如果说在一个有大数据支持的云原生环境下,用带有 AI 辅助决策的系统里面进行一番演练,拍板的时候,可能信心就更足了一些,在很多技术支持下,让决策更科学、更值得信赖。
侯博士认为 AI 具备变革性风口的形式特征,能带动基础设施层、模型层和应用层等整条产业链发展,每个方向上都有颠覆性机会。尽管 AI 发展迅猛,但目前许多任务仍然缺乏高质量数据支撑,特别是 3D 世界。一个解决办法是使用合成数据,合成数据是通过算法生成的,而不是通过实际测量得到的。这种数据可以用于 AI 学习,尤其是在获取真实数据困难或成本高昂的情况下。51WORLD 将相应的技术应用在自己的产品中,51 的 PaaS 平台可以跑在 DaoCloud 的云原生平台上,支持数字孪生场景的生成与编辑、数字孪生资产的获取与分享、数字孪生应用的开发与扩展等,帮助数字孪生世界更好地服务真实世界。

大模型,作为人工智能时代的核心驱动力之一,已经在诸多领域展现出了巨大的潜力和应用前景,云原生作为最受大模型青睐的底层能力也备受瞩目。在大模型的应用过程中,通常需要庞大的计算资源,云原生的弹性资源调度和自动扩展能够满足大模型训练和推理的需求。其次,云原生的标准化封装技术可以提高大模型的部署效率和可靠性,使其更好地适应不同的计算环境和场景。云原生为大模型的训练和推理提供了更加灵活、高效和可靠的基础设施支持,助力大模型的应用和发展。
这次「DaoCloud 道客」云原生大模型产业生态大会从产品、生态、学术、应用场景等多方面给到大家丰富的大模型与云原生未来的畅想空间,众人拾柴火焰高,也希望更多的人可以关注到这个产业生态,让大模型与云原生助力企业加速发展!
沪公网安备31011002001590| 上海市杨浦区江湾城路 99 号 6 号楼 7F