如何构建企业级的AI大模型？|电子爱好者

admin管理员组
文章数量:1631219

摘要：在实际应⽤中，大模型的解决⽅案在企业业务场景中的落地并⾮仅是单⼀的模型问题，⽽是基于业务需求构建的系统性问题。企业在落地大模型通常需要经过⼏个关键步骤：模型评估、模型数据准备、模型微调与训练、模型合作、模型优化、模型应⽤。⾸先是在众多模型中选择并评估最为适宜的模型，利⽤企业内部可信数据对选定的模型进⾏训练、调优和增强，以确保其在企业应⽤场景任务中表现良好，监控模型在实际应⽤中的表现，并根据反馈信息对模型进⾏调整和优化，在部署过程中，需要考虑到安全性、可扩展性和可维护性等⽅⾯的因素，以确保模型能够稳定可靠地运⾏。这些阶段相互关联，形成了⼀个循环迭代的过程，帮助企业不断优化和改进基础模型的性能和效果。本文就这些关键的步骤进行详细的介绍。

构建企业级AI大模型的整体框架
关键步骤的详细介绍

—

构建企业级AI大模型的整体框架

构建企业级AI大模型的整体框架主要包括，通用大模型的预训练，专用基础模型的训练，专用基础模型的反馈，专用基础模型的部署几个步骤。而目前大部分开源的AI大模型都是通用基础模型，这些模型已经经过了预训练了。那么我们大部分企业级的应用级的AI大模型都是基于开源预训练之后的大模型。

注：来源【IBM】可信赖的企业级生成式人工智能白皮书

基于这个基本的大模型之后，对开源大模型进行模型评估，去评估这个开源大模型是否能够满足后面企业级的应用场景。评估之后，如果不满足，那么需要怎么做了？就需要对基础模型进行专有数据的微调和训练，微调和训练需要准备数据，所以还需要保准数据质量，需要对专有的训练的数据进行数据治理，包括清洗、加工，标注，数据增强。完成数据准备之后，进行模型的微调和训练之后，将训练完成的模型另存成新的版本。这个新的版本即为我们的专有大模型，那么实际应用还需要将训练之后的专有模型和基础模型进行组合等多种方式的应用，所以有模型合作的步骤。另外专有模型也并不能保障任务完成的半分白正确，所以还需要建立反馈机制，在后续的模型应用过程中形成模型优化。最后就是模型的部署和应用。这个是大模型应用的整体框架。

—

关键步骤的详细介绍

模型评估

模型评估⼀直以来都是⼈⼯智能领域的重要议题。从机器学习，到深度学习，再到现在的⽣成式 AI，不同阶段的模型评估指标也呈现不同的特点。在机器学习和深度学习阶段，模型的主要任务是分类(分类模型)和预测(回归模型)，模型结果是否正确是明确的。分类模型的主要评估指标是准确率、召回率、精确率、F1 等等。

但是到了⽣成式 AI 阶段，基于通⽤⼤型基础模型，模型的主要任务变成了⽂本⽣成和图像⽣成等。⽣成的⽂本与图⽚是否“正确”具有强烈的主观性，计算维度也与之前不同。针对以上新出现的问题，在⽂本⽣成领域，提出了 BLEU 和 METEOR 等评估指标。图像⽣成领域则提出了 Perceptual Loss 和 Fréchet Inception Distance 等⽅法。

评估大模型的商用产品主要提供对AI大模型性能、适用性、稳定性、安全性和可解释性等方面的全面评估。以下是一些目前市场上已有的商用评估产品和工具：

1、SuperCLUE：这是一个综合性的大模型评测基准，主要聚焦于大模型的四个能力象限，包括语言理解与生成、专业技能与知识、Agent智能体和安全性，进而细化为12项基础能力。

2、Ragas：Ragas框架是一个专为AI大模型设计的智能评估工具，用于评估模型的性能、适用性、稳定性、安全性和可解释性等多个维度。

3、各种大模型评测基准：例如MMLU（大规模多任务语言理解基准）、Open LLM Leaderboard（Hugging Face推出的开源大模型排行榜单）、C-Eval（一个全面的中文基础模型评估套件）等，这些基准和排行榜提供了对大模型在不同任务和领域中的表现进行评估的工具。

4、大模型评测平台：由人工智能关键技术和应用评测工业和信息化部重点实验室牵头，联合多家单位共同发布的大模型评测平台。

5、网页AGI Eval：微软发布的大模型基础能力评测基准，主要评测大模型在人类认知和解决问题的一般能力。

这些工具和平台可以帮助开发者、研究人员和决策者全面了解AI大模型的优势和潜在风险，从而做出更明智的决策和优化方向。

模型数据准备

当企业场景需要超越原始⼤语⾔模型的能⼒时，通常需要对企业内部的数据进⾏收集和整理，对模型进⾏微调和训练以满⾜特定场景的需求。这个过程可能涉及多个阶段，包括数据的收集、标注和预处理、数据划分、数据增强。在这个过程中，企业需要充分了解⾃⾝的业务需求和数据特点，以便选择合适的数据收集⽅法和⼯具，从⽽更好地满⾜业务需求。数据收集就主要包括公开数据、企业内部数据、外部数据的收集，这里详细介绍一下数据预处理、数据标注、数据划分、数据增强等步骤。

1、数据预处理

数据清洗在机器学习中涉及到识别数据中的缺失值、异常值、重复值等问题，并进⾏相应的修正和处理，包括：处理缺失，异常值，重复值，不⼀致的数据格式，特征选择和转换（如数值化、标准化、归⼀化等），类别型数据（如 One-Hot Encoding 或者 Label Encoding 等），时间序列数据，数据不平衡等⽅⾯。在实际应⽤中可能需要根据数据集的具体情况和需求进⾏适当的调整和扩展。数据清洗的⽬标是确保数据的质量和可靠性，为后续的机器学习建模和分析提供可靠的基础。

2、数据标注

数据标注，⼜称为数据注释，是在开发机器学习（ML）模型时的预处理阶段的⼀部分。这个过程涉及到对原始数据（例如图像、⽂本⽂件、视频）的识别，然后为这些数据添加⼀个或多个标签，以指定其上下⽂，使得机器学习模型能够做出准确的预测。在数据标注的过程中，⼈⼯标记者或专业⼯具被⽤来为数据集中的每个样本分配适当的标签。这些标签可以是对图像中物体的识别、⽂本的分类、视频中事件的描述等。通过为数据集中的每个样本添加标签，为机器学习模型提供有监督学习所需的训练数据。

文本标注算法、图片标注算法和视频标注算法是自然语言处理（NLP）和计算机视觉（CV）领域中的一些关键技术，它们用于训练机器学习模型以理解和处理不同类型的数据。以下是一些常见的文本、图片和视频标注算法和工具：

文本标注算法：

1、命名实体识别（NER）：识别文本中的特定实体，如人名、地点、组织等。

2、词性标注：为文本中的每个词分配一个词性类别，如名词、动词等。

3、依存句法分析：分析文本中词语之间的依存关系。

4、语义角色标注：识别句子中的动作和实体之间的关系。

5、文本分类：将文本分配到特定的类别或主题。

图片标注算法：

1、边界框标注：在图片中用矩形框标出对象的位置。

2、多边形标注：用于不规则形状的对象，通过标记对象的边界点来形成多边形。

1、关键点标注：在对象上标注特定的关键点，常用于人体姿态估计。

2、语义分割：将图像分割成多个像素区域，每个区域属于一个特定的类别。

实例分割：在语义分割的基础上，进一步区分同类对象的不同实例。

视频标注算法：

1、单帧标注：将视频分解为单独的帧，并对每一帧进行图片标注。

2、多帧或流标注：在视频播放过程中跟踪对象，并对整个视频流进行连续的标注。

1、目标追踪：在视频帧之间跟踪特定对象的运动。

2、事件检测：识别视频中的特定事件或动作序列。

3、3D点云标注：常用于自动驾驶领域，对视频中的3D空间点进行标注。

在实际应用中，标注工具通常会结合这些算法来辅助用户进行数据的标注工作。例如，一些流行的标注工具包括LabelImg、Labelme、CVAT等，它们提供了图形用户界面和自动化工具来简化标注过程。而视频标注由于其复杂性，可能需要更高级的工具来处理时间序列数据和对象追踪。

3、数据划分

数据划分通常需要将数据集分为训练集、验证集和测试集三部分进⾏处理。常⻅的数据划分的⽅法主要包括：随机划分、分层划分、时间序列划分、K 折交叉验证等。在实际应⽤中，可以根据具体情况对上述⽅法进⾏调整。需要注意的是，数据划分应该尽可能保证各个⼦集的数据分布⼀致，以保证模型在各种情况下都能表现出良好的性能。

4、数据增强

数据增强(Data Augmentation)是⼀种⽤于改善模型性能和泛化能⼒的技术，它通过创建原始数据的修改版本来增加⽤于模型训练的数据量。这些修改可以包括旋转、缩放、翻转或其他形式的变换，⽬的是增加数据的多样性，以帮助模型学习更多的特征和规律，提⾼模型的泛化能⼒。此外，数据增强也可以帮助防⽌模型过拟合，提⾼模型的健壮性。常⽤的数据增强技术包括：图像数据增强（如旋转，缩放，剪裁，翻转，改变亮度，对⽐度，饱和度等，⽂本数据增强（同义词替换，随机插⼊，随机交换，随机删除等），⾳频数据增强（改变⾳调，⾳量，速度，添加背景噪声等），数据插值等。随着⽣成式⼈⼯智能的技术发展，模型的尺⼨越来越⼤，还可采⽤⾃监督数据⽣成，领域数据/专家数据等⽅式来实现增强。⽤⼾可结合模型的实际应⽤场景、具体需求和数据类型来选择合适的数据增强⽅法。

模型微调与训练

⼀般来说，⼤语⾔模型应用可以通过构造良好的提⽰词激发模型的能⼒，⼀种典型的提⽰⽅法是将任务描述或⽰范以⾃然语⾔⽂本的形式表达的上下⽂学习（in-context learning,CL）。此外，采⽤思维链提⽰（chain-of-thought prompting）可以通过将⼀系列中间推理步骤加⼊提⽰中来增强 ICL。有的场景通过提⽰⽆法解决问题或者需要过⻓的上下⽂提⽰，这种情况下就会涉及模型微调，常⻅的微调⽅式包括使⽤⽆标签数据进⾏继续预训练、使⽤标签数据对模型进⾏指令微调、通过强化学习对模型进⾏对⻬微调等。

继续预训练优势是可以容易获取到⽆标签数据，常⻅的使⽤场景包括对 LLM 进⾏进⾏多语⾔⽀持的扩展、垂直领域知识的增强，增加 LLM ⽂本⻓度的⽀持等。

指令微调是以有监督的⽅式微调 LLM（例如使⽤序列到序列的损失进⾏训练），指令微调后 LLM可以展现出泛化到未⻅过任务的卓越能⼒，为了进⾏指令微调，⾸先需要收集或构建指令格式的实例。构建指令数据集可以通过⼈⼯⽅式、利⽤基础模型⾃动⽣成、结合使⽤开源指令数据集。由于指令微调涉及多种任务的混合，因此在微调过程中平衡不同任务的⽐例⾮常重要，⼀种⼴泛使⽤的⽅法是实例⽐例混合策略，即将所有数据集合并，然后从混合数据集中按⽐例采样每种实例。

由于 LLM包含⼤量的模型参数，进⾏全参数微调将会有较⼤开销，于是提出来参数⾼效微调（parameter-efficient fine-tuning），旨在减少可训练参数的数量，同时尽可能保持良好的性能。常⻅的⽤于 Transformer 语⾔模型的参数⾼效微调⽅法有适配器微调（adapter tuning）、前缀微调（prefix tuning）、提⽰微调（prompttuning）和低秩适配（LoRA）等。

模型合作

在企业的实际应用中，面对多样化的业务场景，通常会将通用基础模型与特定领域的专业模型相结合。通用模型因其卓越的自然语言处理能力、丰富的知识储备以及出色的任务分析和总结能力而备受青睐。它们能够应对广泛的下游任务，为企业带来广阔的应用前景。

与此相对，专业领域模型虽然资源需求较低，但它们在特定领域的深度训练和优化使得其在相关任务上表现出色。然而，这些模型的适用范围相对较窄，通常只适用于特定的任务，与通用模型相比，其应用场景有限。

企业在实践中往往已经开发了一些专门针对其特定领域或业务需求的领域模型。通过将通用模型和领域模型的优势结合起来，可以构建出更为灵活高效的解决方案。这种结合能够充分利用现有的能力，最大化地发挥出模型的潜力。

⼀些常⻅的模型合作的⽅式包括：

• 模型组合： 将领域模型的预测结果整合到基础模型中，从⽽扩展基础模型的知识和提⾼精度。例如，基础模型可⽤于任务框架拟定和任务分解，⼜领域模型对分解任务进⾏处理，最终由基础模型对所有步骤的答案进⾏组织整理。

• 模型堆叠： 将领域模型和基础模型串联起来，形成⼀个更为复杂的模型。通过增加模型深度，可以提⾼模型的复杂度。例如，基础模型可对任务从不同维度进⾏定义，领域模型则从不同⻆度回答问题，最终由基础模型整理所有步骤的答案。

• 模型分⼯： 将⽤⼾任务分解，让⼤、领域模型各⾃专注于不同的任务。例如，基础模型处理开放式⾃然语⾔处理任务，⽽领域模型则专注于特定⾏业的语⾔任务。

模型部署

大模型在部署时会广泛使用模型压缩和推理引擎技术来优化性能和资源使用。以下是这些技术的应用方式：

1、模型剪枝（Pruning）：

移除神经网络中冗余的权重或神经元，减少模型大小和计算需求，同时尽量保持模型性能。
2、量化（Quantization）：
将模型中的浮点数权重转换为低精度表示（如8位整数），以减少模型大小和加速计算，同时降低内存带宽需求。
3、知识蒸馏（Knowledge Distillation）：
通过训练一个小型模型（学生模型）来模仿一个大型模型（教师模型）的行为，以此来获得一个性能接近但更轻量级的模型。
4、推理引擎（Inference Engine）：
使用专门的推理引擎，如TensorRT、ONNX Runtime、TensorFlowLite等，这些引擎针对特定硬件进行了优化，可以加速模型的推理过程。

通过这些技术的应用，大模型可以更高效地部署在各种硬件平台上，满足不同场景下对性能、速度和资源使用的需求。这些优化手段的选择和应用通常取决于目标应用的具体要求和运行环境的约束。

本文介绍了构建企业级专有大模型的关键技术和步骤，下期介绍企业级专有大模型应用的关键技术，希望对您有所帮助。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

本文标签：企业级模型 AI

版权声明：本文标题：如何构建企业级的AI大模型？内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1729092659a1186300.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

如何构建企业级的AI大模型？

文本标注算法：

图片标注算法：

视频标注算法：

如何学习大模型 AI ？

第一阶段（10天）：初阶应用

第二阶段（30天）：高阶应用

第三阶段（30天）：模型训练

第四阶段（20天）：商业闭环

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多相关文章

30名工程师，历时1300天打造，又一“国产”AI框架开源了

八大中文AI大模型超级评测：表现最佳不是文心一言？

IDC最新报告，7大维度11家大模型厂商比拼，唯一全优是谁？

国内AI大模型已近80个，哪个最有前途？

2024年AIGC行业研究：多模态大模型与商业应用

大模型实操 | LoRA、QLoRA微调大模型实战技巧分享，含常见QA解答！

华为AI芯片生态全栈深度分析 2024

专补大模型短板的RAG有哪些新进展？这篇综述讲明白了

《深入浅出LLM基础篇》（一）：大模型概念与发展

【ai大模型】关于Llama 3 AI大模型的几点总结

国内外AI大模型发展概况

【大模型】大模型相关动态

讯飞星火：整体超越ChatGPT，医疗超越GPT4！一手实测在此_讯飞星火 医疗 大模型

解锁AI新纪元：如何用好大语言模型？

AI大模型，彻底爆了！

AI Agent发展面临哪些挑战？端侧大模型将如何提升其可用性？

一季度卖出1190万部AI手机，中国成了AI手机的最大潜在市场

清华系2B模型杀出支持离线本地化部署，可以在个人电脑或者手机上部署的多模态大模型，超越 Mistral-7B、LLaMA-13B

26岁的“天才少年”，带队面壁打通高效大模型之路

大模型与程序员，究竟是谁吃了谁？

发表评论

推荐文章

Linux：VMWare启动虚拟机导致电脑蓝屏并重启问题解决

鸿蒙系统HarmonyOS与Android系统技术架构浅析

怎么将pdf转为ppt文件？pdf转ppt的8个方法

mysql8.0 centos如何安装_centos如何安装mysql8.0

【ai大模型】关于Llama 3 AI大模型的几点总结

热门文章

微生物组-宏基因组分析专题研讨会(2022.5)

Linux学习-02-Linux的安装

PyCharm专业版 2021.3 &amp; Anaconda安装教程

一个Job在OneFlow中的执行过程—下篇

大语言模型应用指南：ChatGPT接口与扩展功能详解

PS简单操作快捷键，上手快

How to write a literature review（如何写好文献综述）

强化学习极简入门：通俗理解MDP、DP MC TC和Q学习、策略梯度、PPO

注册会计可以用计算机,注册会计师考试能带科学计算器吗？

Shiro RememberMe 1.2.4 反序列化命令执行漏洞复现

最新文章

Linux--网络设置（查看及测试网络、使用网络配置命令及修改网络配置文件）

计算机主机房的消防配置,机房的消防设计规范.docx

配置虚拟主机

（十六）Alian 的 Spring Cloud Eureka 集群配置（主机名方式）

交换机配置基本ACL限制某台主机访问服务器

一台主机接两个显示器并独立使用_一台电脑如何满足多人同时使用？试试这招！...

深度学习主机配置推荐

WAMPSERVER配置虚拟主机，单IP多端口

IPV4详解以及在华为中给主机配置IP地址

vlan配置实验——实现不同主机之间的网络连接，实现网络可达

配置IPSG防止主机私自更改IP地址上网（动态绑定）

AI训练电脑配置备份-自用

计算机网络知识总结：ip地址、分类及什么样的ip主机地址可以分配给主机使用

戴尔微型计算机主机怎么拆,简单拆解内部探秘_戴尔台式电脑_台式电脑评测-中关村在线...

台式计算机主要有哪些硬件组成,构成台式电脑主机的基本硬件有什么

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

讯飞星火：整体超越ChatGPT，医疗超越GPT4！一手实测在此_讯飞星火医疗大模型

PyCharm专业版 2021.3 & Anaconda安装教程

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载