论文地址《Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services》
摘要
- 本调查论文重点介绍了AIGC应用程序(例如ChatGPT和Dall-E)在移动边缘网络的部署。
- 首先介绍生成模型的背景和基础知识,以及移动AIGC网络中AIGC服务的生命周期,其中包括数据收集、培训、微调、推理和产品管理。
- 然后,我们讨论支持 AIGC 服务并使用户能够在移动边缘网络访问 AIGC 所需的协作云-边缘-移动(cloud-edge-mobile)基础设施和技术。
- 此外,我们还探索 AIGC 驱动的创意应用程序和移动 AIGC 网络的用例。
- 此外,我们还讨论了部署移动 AIGC 网络的实施、安全和隐私挑战。
- 最后,我们重点介绍了移动 AIGC 网络全面实现的一些未来研究方向和未解决的问题。
Ⅰ、INTRODUCTION
A.Background
- AI高速发展,数据创建的边际成本降至接近于零,AIGC(例如 ChatGPT)有望为人工智能开发和数字经济提供大量合成数据。
- DALL-E2
- 采用扩散模型来减少训练过程中产生的噪声,从而生成更精致和新颖的图像。
- 在使用 AIGC 模型生成文本到图像的背景下,语言模型充当指南,增强输入提示和生成图像之间的语义连贯性。
- 同时,AIGC 模型处理现有的图像属性和组件,从现有数据集生成无限的合成图像。
- AIGC 的作用
- 可应用于各种形式的文本生成,从客户服务查询和消息等实际应用,到活动跟踪和营销文案撰写等创意任务[9]。
- 在图像生成领域,AIGC模型可以根据现有图像的属性和成分对其进行处理,从而实现端到端的图像合成,例如直接从现有图像生成完整图像[7]。
- 此外,AIGC 模型在跨模态生成方面具有巨大的潜力,因为它们可以在空间上处理现有的视频属性并同时自动处理多个视频剪辑[11]。
- 与 PGC 和 UGC 相比,AIGC 在内容创作方面的优势已经为公众所熟知。
- 响应快、质量高、内容个性化
- 随着时间的推移,在模型增强、数据可用性提高和计算能力增强的推动下,AIGC 的性能显着提高 [12]。
- 一方面,模型不断升级,例如扩散模型的提出,为多模态AIGC生成提供更强大的工具。这些进步归功于AIGC模型的基础研究以及生成式DNN中学习范式和网络结构的不断完善。
- 另一方面,随着网络的互联程度越来越高,用于生成式人工智能训练和推理的数据和计算能力变得更加容易获得。
B.Motivation
- 尽管 AIGC 因其彻底改变现有生产流程的潜力而受到认可,但目前在移动设备上访问 AIGC 服务的用户缺乏对交互式和资源密集型数据生成服务的支持。
- 尽管用户可以通过核心网络访问AIGC服务,在云服务器上执行AIGC模型,但是由于其远程性质,云服务表现出高延迟。因此,在移动边缘网络(即移动 AIGC 网络)上部署交互密集型 AIGC 服务,应被视为更实用的选择 [26]-[28]。具体来说,发展移动 AIGC 网络的动机包括:
- 低延迟:用户可以访问移动 AIGC 网络中的低延迟服务,而不是将对 AIGC 服务的请求定向到核心网络内的云服务器[29]。例如,用户可以通过将预训练模型下载到边缘服务器和移动设备进行微调和推理,从而支持实时、交互式AIGC。
- 本地化和移动性:在移动 AIGC 网络中,网络边缘具有计算服务器的基站可以通过本地化服务请求来微调预先训练的模型 [30]、[31]。此外,用户的位置可以作为 AIGC 微调和推理的输入,满足特定的地理需求。此外,用户移动性可以集成到AIGC服务提供过程中,从而实现动态、可靠的AIGC服务提供。
- 定制化和个性化:本地边缘服务器可以适应本地用户需求,允许用户根据自己的喜好请求个性化服务,同时根据本地服务环境提供定制化服务。
- 隐私和安全:AIGC用户只需向边缘服务器提交服务请求,因此,在AIGC服务的提供(包括微调和推理)过程中可以保护AIGC用户的隐私和安全。
- 但同时,将AIGC服务部署到移动边缘服务器和设备时,也具有以下挑战:
- 首先,边缘服务器上的资源分配必须平衡边缘服务器AIGC服务的准确性、延迟和能耗之间的权衡。
- 其次,计算密集型 AIGC 任务可以从移动设备卸载到边缘服务器,从而改善推理延迟和服务可靠性。
- 此外,为了最小化模型访问延迟,生成内容的人工智能模型可以缓存在边缘网络中,类似于内容分发网络(CDN)。
- 最后,应探索移动性管理和激励机制,鼓励用户在空间和时间上的参与。
C.Related Works and Contributions
- 在本次调查中,我们概述了与 AIGC 和移动边缘智能相关的研究活动,如下图所示。
- 如图为2013年至2023年1月AIGC和移动边缘网络的发展路线图。从AIGC技术发展来看,AIGC已经从生成文本和音频发展到生成3D内容。从移动边缘计算的角度来看,计算已逐渐从云数据中心转向D2D移动计算。
- 与现有的调查和指南不同,我们的调查重点关注移动 AIGC 网络的部署,以实现实时且保护隐私的 AIGC 服务配置。
- 贡献
- 我们最初提供了一个指南,用于建立 AIGC 服务的定义、生命周期、模型和指标。然后,我们提出了移动 AIGC 网络,即通过协作的移动-边缘-云通信、计算和存储基础设施在移动边缘网络提供 AIGC 服务。
- 我们展示了移动 AIGC 网络中的多个用例,包括用于文本、图像、视频和 3D 内容生成的创意 AIGC 应用程序。我们根据这些用例总结了构建移动 AIGC 网络的优势。
- 我们确定了实现移动 AIGC 网络过程中的关键实施挑战。移动 AIGC 网络的实施挑战不仅源于动态信道条件,还源于 AIGC 服务中存在无意义内容、不安全内容规则和隐私泄露。
- 最后,我们分别从网络和计算、机器学习(ML)和实际实施考虑的角度讨论未来的研究方向和未解决的问题。
- 整体文章架构如下图
Ⅱ、BACKGROUND AND FUNDAMENTALS OF AIGC
A.Definitions of PGC, UGC, and AIGC
- Professionally-generated Content (PGC)
- 专业生成内容(PGC)指的是由专业人士或某个特定领域的专家创作的内容,通常旨在提供高质量、可信和引人入胜的材料。这种类型的内容通常具有较高的制作价值、深入的研究和符合行业标准的特点。
- 然而,由于PGC是有目的的,PGC的多样性和创造力可能会受到限制。
- User-generated Content (UGC)
- UGC 是指由用户而不是专家或组织生成的数字材料[37]。用户包括网站访问者和社交媒体用户。 UGC 可以以任何格式呈现,包括文本、照片、视频和音频。
- 因此,得益于广泛的用户基础,UGC 更具创造性和多样性。然而,与专家生成的 PGC 相比,UGC 的自动化程度和多模式程度较低。
- AIGC
- AIGC是根据用户的输入,使用生成式AI模型生成的。由于人工智能模型可以从人类艺术思维中学习输入数据的特征和模式,因此它们可以开发广泛的内容。最近基于扩散模型[38]的文本到图像应用和基于transformer[10]的ChatGPT的成功使得AIGC获得了广泛的关注。
- 我们根据AIGC的特点将其定义如下:
- Automatic:用户只需提供任务描述等输入,即可高效获取生成的内容。
- Creativity:AIGC 指的是创新的想法或项目。
- Multimodal:生成 AIGC 的 AI 模型可以处理多模态输入和输出,包括文本、图像、语音和3D模型等。
- Diverse:AIGC在服务个性化和定制方面具有多样性,用户可以调整模型的输入以产生个性化输出。
- Extendedly valuable:AIGC 应该对社会、经济和人类具有广泛的价值 [42]。例如,人工智能模型可以经过训练来编写医疗报告和解释医学图像,使医护人员能够做出准确的诊断。
- AIGC 与 PGC 和 UGC 相比具有多种优势,包括更高的效率、原创性、多样性和灵活性。
B.Serving ChatGPT at Mobile Edge Networks
-
ChatGPT
- 由 OpenAI 开发,擅长生成类似人类的文本并参与对话。主要优点之一是能够回答问题、提供解释并以与人类反应几乎没有区别的方式协助完成各种任务。
- ChatGPT的开发涉及四个主要阶段,包括预训练、微调、推理和产品管理。
-
预训练
- ChatGPT 的基础模型 GPT-3 在大型文本语料库上进行训练,其中包括书籍、文章和其他信息源,模型根据上下文预测句子中的下一个单词,这个过程使模型能够获取语言模式和结构以及单词和短语之间的关系的知识。
- 为了训练基础模型,所使用的技术称为最大似然估计,其中模型旨在最大化正确预测下一个单词的概率。
- 训练 GPT-3 需要大量的计算资源和时间,通常涉及图形处理单元 (GPU) 或张量处理单元 (TPU) 等专用硬件。所需的确切资源和时间取决于模型大小、数据集大小和优化技术等因素。
-
微调
- ChatGPT 的微调阶段涉及使模型适应特定任务或领域,例如客户服务或技术支持,以提高其准确性和与该任务的相关性。
- 为了将 ChatGPT 转化为对话式人工智能,使用包含人类和AI模型之间对话的数据集来采用监督学习过程。
- 为了优化 ChatGPT 的参数,通过按质量对多个模型响应进行排名来构建强化学习的奖励模型。替代完成由人工智能训练员进行排名,并且该模型使用这些排名通过近端策略优化的多次迭代来提高其性能[45]。
-
推理
- 在推理阶段,ChatGPT 利用在预训练和微调过程中获得的知识,根据给定的输入或提示生成文本,生成与输入相关的连贯且上下文适当的响应。
- 上下文学习涉及分析输入的整个上下文[46],包括对话历史记录和用户配置文件,以生成个性化且适合用户需求的响应。
- ChatGPT 采用思维链来生成连贯且合乎逻辑的响应,确保生成的文本不仅符合上下文,而且遵循逻辑流程。推理过程中消耗的资源通常远低于训练所需的资源,使得基于 ChatGPT 的实时应用程序和服务在计算上变得可行。
-
产品管理
- 最终的产品管理阶段包括将模型部署到生产环境中并确保其平稳高效的运行。
- 在移动边缘网络的背景下,人工智能驱动的工具(例如new Bing [47] 和 Office 365 Copilot [48])能够在节省资源的同时提供个性化和上下文适当的响应。并且可以通过专门的技术集成到移动边缘网络中,在保持数据完整性的同时平衡性能和准确性。
- new Bing 提供了一种新型搜索体验,具有人工智能支持的功能,例如对复杂问题的详细答复、总结答案以及对后续问题的个性化答复。
- 由 OpenAI 的 GPT-4 提供支持的 Office 365 Copilot 则提供帮助在 Microsoft 365 应用和服务中生成文档、电子邮件、演示文稿和其他任务。
C.Life-cycle of AIGC at Mobile Edge Networks
- 下面,我们讨论具有移动边缘网络支持的 AIGC 生命周期。
1)Data Collection
- 数据收集是 AIGC 不可或缺的组成部分,在 AI 系统创造材料的质量和多样性方面发挥着重要作用 [49]。
- 用于训练人工智能模型的数据会影响人工智能模型学习的模式和关系,从而影响输出。 AIGC 有多种数据收集技术:
- Crowdsourcing(众包?)
- Crowdsourcing通常是指通过使用在线平台从大量个人获取信息的过程。
- Crowdsourcing数据可用于训练用于文本和图像生成等应用的机器学习模型。
- Data Market
- 获取数据的另一种方法是从数据提供商处购买数据。
- 例如,Datatang3是一家提供高质量数据集和定制数据服务来帮助企业提高人工智能模型性能的公司。
- Internet-of-Things (IoT) data collection
- 在物联网中,边缘设备可以帮助收集数据,例如全球定位系统(GPS)记录和无线传感数据。
- 例如,在手机中安装传感器,可以跟踪设备或用户的移动和位置[52]。传感器可用于收集有关设备移动的位置、速度和方向的数据。
- Passive measurement
- 借助边缘网络可以实现被动数据收集[53]。
- 在智慧城市中,传感器可以放置在战略位置,例如灯柱、建筑物或其他结构上,以收集有关城市环境各个方面的数据。传感器获得的数据可用于训练人工智能模型,随后可用于生成有关空气质量、交通流量和行人密度的见解。
- Crowdsourcing(众包?)
2)Pre-training
- 在训练过程中,生成模型自动学习数据中的模式和特征并预测目标结果。
- 目前,已有几种生成式AI技术,将在第Ⅲ-B中介绍,包括生成对抗网络 (GAN)、VAE、基于流的模型和扩散模型。这些不同的训练技术有不同的优点和缺点。
- 技术的选择取决于 AIGC 任务的具体要求、可用数据、所需输出和可用计算资源。训练完成后,云数据中心可以接受网络用户上传的请求,执行后续的微调和推理任务。或者,云数据中心可以将经过训练的 AIGC 模型传送到网络边缘服务器,该服务器可以在本地处理用户请求。
3)Fine-tuning
- AIGC 中的微调是通过包含适量的额外数据来调整预训练的 AIGC 模型以适应新任务或领域的过程。
- 在移动网络中,微调任务可以由边缘网络使用移动用户上传的小规模数据集来执行。
4)Inference
- 使用经过训练的 AIGC 模型,可以进行推理,这涉及根据输入生成所需的内容。
- AIGC 模型传统上是通过集中式服务器进行管理的,例如 Hugging Face 平台 [54]。在这种设置下,大量用户向中央服务器发出请求,排队等待,并获得所请求的服务。
- 研究人员的目标是在边缘网络上安装 AIGC 服务防止请求拥塞并优化服务延迟。边缘设备具有足够的计算能力进行 AIGC 推理,并且比中央服务器更接近消费者。因此,用户可以以减少的传输延迟与设备进行交互。此外,由于AIGC服务分散到多个边缘设备,因此可以显着降低延迟。
5)产品管理
- AIGC 对每个内容都拥有独特的所有权、版权和价值。因此,AIGC 产品的保存和管理应纳入AIGC 生命周期。
- 具体来说,我们将请求生产 AIGC 的一方称为生产者,例如移动用户或公司,他们雇用 AIGC 生成器(例如网络服务器)来执行 AIGC 任务。
- AIGC 产品管理的主要流程包括:
- 分发:在网络边缘服务器中生成内容后,制作者获得 AIGC 产品的所有权。因此,他们有权通过边缘网络将这些产品分发到社交媒体或 AIGC 平台。
- 交易:由于 AIGC 产品被视为一种新颖的不可替代的数字财产,因此可以进行交易。交易过程可以建模为两方之间的资金所有权交换。
(有点类似NFT?)
Ⅲ、TECHNOLOGIES AND COLLABORATIVE INFRASTRUCTURE OF MOBILE AIGC NETWORKS
- 在本节中,我们将深入研究移动 AIGC 网络的技术和协作基础设施。全面了解旨在支持 AIGC 的边缘计算系统的基本原理和目标。
- 在我们探索这些系统的设计之前,建立衡量系统是否能够最大化用户满意度和效用的性能指标至关重要。
A.Evaluation Metrics of Generative AI Models and Services
1)Inception Score (IS)
- IS 可用于衡量移动网络中 AIGC 模型生成的图像的准确性 [55]。
- IS 的前提是高保真度生成的图像应具有高类别概率,这表明分类模型可靠,并且预测类别概率与参考类别分布之间的 Kullback-Leibler (KL) 散度较低。
- 为了计算 IS,将指数函数应用于预期类概率和参考类分布之间的 KL 散度。然后将所得值对所有创建的照片进行平均以获得 IS。 IS 越高表示整体图像质量越好。
2)Frechet Inception Distance (FID)
- FID 已成为评估生成模型(尤其是 GAN)在图像质量和多样性方面的有效性的成熟指标[56]。
- FID 利用预先训练的 Inception 网络来计算实际图像嵌入和合成图像嵌入之间的距离。 AIGC 模型提供商可以使用此指标来评估其移动网络中生成模型的质量。
- 局限
- 在评估条件文本到图像合成时,FID 仅测量输出图像的视觉质量,忽略它们对输入文本的调节是否充分[57]。因此,虽然 FID 是评估图像质量和多样性的优秀评估指标,但在应用于条件文本到图像合成时受到限制。
- 在评估条件文本到图像合成时,FID 仅测量输出图像的视觉质量,忽略它们对输入文本的调节是否充分[57]。因此,虽然 FID 是评估图像质量和多样性的优秀评估指标,但在应用于条件文本到图像合成时受到限制。
3)R-Precision
- R-Precision 是评估 AI 生成的图像如何与文本输入对齐的标准指标 [58]。
- 在移动网络中,AIGC 模型生成器可以使用 AI 生成的图像作为查询,从 100 个候选文本中检索匹配文本。R-Precision 衡量前 R 检索项中检索到的相关项的比例,其中 R 通常设置为 1。
- 深度注意多模态相似性模型 (DAMSM)
- DAMSM通常用于计算文本-图像检索相似度得分[59]。
- DAMSM 将图像的每个子区域及其在句子中对应的单词映射到联合嵌入空间,从而可以测量细粒度图像文本相似性以进行检索。
- 局限
- 但需要注意的是,文本转图像AIGC模型可以直接优化用于计算R-Precision的DAMSM模块。这导致该指标是特定于模型的且不太客观,限制了移动网络中 AIGC 模型的评估。
- 但需要注意的是,文本转图像AIGC模型可以直接优化用于计算R-Precision的DAMSM模块。这导致该指标是特定于模型的且不太客观,限制了移动网络中 AIGC 模型的评估。
4)CLIP-R-Precision
- CLIP-R-Precision 是一种评估指标,用于解决 R-Precision 指标的模型特定特征 [60]。
- 使用最新的多模态 CLIP 模型 [5] 来获得 R-Precision 分数。在这里,CLIP 在大量基于网络的图像标题配对语料库上进行训练,并且能够通过对比目标将两种嵌入(视觉和语言)结合在一起。
- 因此,CLIP-R-Precision 可以对移动网络中的文本到图像 AIGC 模型性能提供更客观的评估。
5)Quality of Experience
- 体验质量 (QoE) 指标在评估移动网络应用中 AIGC 的性能方面发挥着关键作用。
- QoE 衡量用户对生成内容的满意度,考虑视觉质量、相关性和实用性等因素。收集和分析用户调查、交互和行为数据是用于确定 QoE 的标准方法。
- 此外,QoE 的定义可能会根据移动网络系统设计者的目标和所考虑的用户组而有所不同。
- 借助QoE,可以提高AIGC性能,并可以创建新模型来满足用户期望。在分析移动网络应用中 AIGC 的性能时,必须考虑 QoE,以确保生成的内容满足用户期望并提供良好的用户体验。
B.Generative AI
- 生成式人工智能模型的目标是通过迭代训练来拟合输入数据的真实数据分布。用户可以使用此近似模型生成新数据,因为该模型可以拟合分布。
- 如下图所示,本节主要介绍五种基本生成模型,包括GAN、基于能量的模型、VAE、基于流的模型和扩散模型。
1)Generative Adversarial Networks
- GAN是AIGC的基本框架,包括生成模型和判别模型。
- 生成网络的目标是根据原始数据集中的数据,生成尽可能真实且与原始数据相似的数据,以欺骗判别模型。相反,判别模型的任务是区分真实实例和虚假实例。
- 然而,GAN 对输出的控制有限,并且可能产生毫无意义的图像。此外,它们生成低分辨率图像,仅扩充现有数据集,而不是在原始数据集上创建新内容,并且无法跨模式生成新内容。
2)Energy-based Generative Models
- 基于能量的生成模型[62]是概率生成模型,它使用能量值表示输入数据,并通过最小化这些值来对数据进行建模。基于能量的模型通过定义能量函数然后通过优化和训练最小化输入数据的能量值来发挥作用。
- 在样本空间中为每个样本都有一个能量值,能量值低的样本被认为是更“真实”的样本,而能量值高的样本则被认为是更“虚假”的样本。
- 该方法具有易于理解的优点,模型在提供 AIGC 服务时表现出出色的灵活性和泛化能力。
3)Variational Autoencoder
- VAE [63]由两个主要组件组成:编码器和解码器网络。
- 编码器将输入数据转换为潜在度量的均值和方差,并使用这些参数对潜在空间进行采样并生成潜在度量。
- 解码器将潜在变量作为输入并生成新数据。
- 数据重建和数据生成任务可以通过一起训练编码器和解码器来完成。与使用监督学习方法训练的 GAN 不同,VAE 使用无监督学习方法。因此,VAE 通过从学习的分布中采样来生成数据,而 GAN 通过使用生成器网络近似数据分布来生成数据。
4)Flow-based Generative Models
- 流式生成模型(Flow-based Generative Models)是一类通过可逆变换将简单分布(如高斯分布)映射到复杂数据分布的生成模型。这种模型的核心思想是使用一系列可逆的变换,使得复杂数据的生成过程可以通过简单的分布进行高效采样。
- 基于流的生成模型[64]通过采用概率流公式来促进数据生成过程。此外,这些模型在生成过程中使用反向传播算法计算梯度,从而提高训练和学习效率。
- 因此,移动边缘网络中基于流的模型具有多种优势。其中一项优势是计算效率。基于流的模型可以直接计算生成过程中的概率密度函数,避免资源密集型计算。这促进了移动边缘网络内更高效的计算。
5)Generative Diffusion Models
-
扩散模型是使用最大似然估计 (MLE) 训练的基于似然的模型,而不是使用生成器和鉴别器之间的极小极大博弈训练的 GAN。因此,可以避免因为模式崩溃从而引起的训练不稳定。具体来说,扩散模型受到非平衡热力学理论的启发。他们学习逆扩散过程,通过定义扩散步骤的马尔可夫链,逐渐向数据添加随机噪声,从噪声构建所需的数据样本。
-
这个过程可以分为两个关键阶段:前向扩散过程和反向扩散过程。
- 前向扩散过程:
- 在这个阶段,真实数据(例如图像)通过反复添加噪声逐渐变得模糊,最终趋近于简单的高斯分布。每一步的添加噪声都是随机的,目的是将数据分布转变为一个已知的简单分布。
- 这个过程可以用一个马尔可夫链来表示,每一步的状态依赖于前一步的状态。
- 反向扩散过程:
- 在反向扩散阶段,模型试图从这个简单的高斯分布逐步恢复出原始数据。这个过程通过学习如何去噪声来实现,通常使用神经网络来预测每一步的去噪声过程。
- 通过反复应用这个去噪声的过程,模型可以生成逼真的新样本。
- 前向扩散过程:
-
此外,扩散可以在数学上将模型的计算空间从像素空间转换到称为潜在空间的低维空间。这减少了所需的计算成本和时间,并提高了模型的训练效率。与 VAE 或基于流的模型不同,扩散模型是使用固定程序学习的,并且隐藏变量具有与原始数据相同的高维度。
C.Collaborative Infrastructure for Mobile AIGC Networks
- 移动AIGC网络定义:移动 AIGC 网络融合了人工智能生成的内容和移动边缘网络,可在网络边缘快速创建、交付和处理内容,从而增强用户体验并减少延迟。(ChatGPT-4所给)。
- 为了提供低延迟和个性化的 AIGC服务,如下图所示的云-边-移动协同AIGC框架是必不可少的,需要异构资源持有者之间的广泛合作。
1)Cloud Computing
- 在移动AIGC网络中,云计算代表一个集中式基础设施,提供远程服务器、存储和数据库资源,以支持AIGC服务生命周期过程。
- 云计算允许用户通过部署这些服务的核心网络来访问AIGC服务,而不是构建和维护物理基础设施。具体来说,云计算存在三种主要的交付模型:基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)。
- 在移动 AIGC 网络中,IaaS 提供商提供对虚拟化 AIGC 计算资源(例如服务器、存储和数据库)的访问 [19]。
- PaaS 还提供了一个用于开发和部署 AIGC 应用程序和服务的平台。
- SaaS 通过互联网提供应用程序和服务,使用户能够直接通过 Web 浏览器或移动应用程序访问 AIGC 模型。
- 总之,云计算在 AIGC 服务的开发、部署和管理中发挥着关键作用。
2)Edge Computing
- 通过在核心网络边缘提供计算和存储基础设施[25],用户可以通过无线接入网络(RAN)访问AIGC服务。与云计算的大规模基础设施不同,边缘服务器有限的资源往往无法支持AIGC模型训练。然而,边缘服务器可以提供计算量和存储密集度较低的实时微调和推理服务。
- 用户无需通过核心网络将数据上传到云服务器来请求AIGC服务,因此,通过边缘服务器提供的 AIGC 服务的好处是减少服务延迟、改进数据保护、提高可靠性和减少带宽消耗。
- 与通过集中式云计算专门提供 AIGC 服务相比,边缘位置感知的 AIGC 服务可以显着增强用户体验[66]。此外,用于本地 AIGC 服务交付的边缘服务器可以进行定制和个性化,以满足用户需求。
3)Device-to-device Mobile Computing
- D2D 移动计算涉及用户使用移动设备直接执行 AIGC 服务[14]。
- 一方面,移动设备可以直接执行AIGC模型并执行本地AIGC推理任务。虽然在设备上运行 AIGC 模型需要大量计算资源并消耗移动设备能源,但它可以减少AIGC服务延迟并保护用户隐私。
- 另一方面,移动设备可以将 AIGC 服务卸载到通过无线连接运行的边缘或云服务器,从而为交付 AIGC 服务提供灵活的方案。然而,将 AIGC 服务卸载到边缘或云服务器上执行需要稳定的网络连接并增加服务延迟。
- 最后,必须考虑模型压缩和量化,以尽量减少在移动设备上执行所需的资源,因为 AIGC 模型通常规模很大。
D.Lessons Learned
- AIGC 模型的云边协同 (Cloud-Edge) 训练和微调:云边协同预训练和微调被认为是有前途的方法。一方面,云计算中的服务器可以利用强大的计算和数据资源来训练AIGC模型。另一方面,基于边缘网络中的大量用户数据,AIGC模型可以进行微调,使其更加定制化和个性化。
- AIGC 服务的边缘移动 (Edge-Mobile) 协同推理:移动AIGC网络中,由于用户的位置和移动性不断变化,转发到边缘服务器的AIGC业务是动态的。因此需要大量的边缘和移动协作来完成AIGC推理服务的提供,资源分配和任务卸载决策是部署移动AIGC网络的挑战之一。
Ⅳ、HOW TO DEPLOY AIGC AT MOBILE EDGE NETWORKS: APPLICATIONS AND ADVANTAGES OF AIGC
A.Applications of Mobile AIGC Networks
1)AI-generated Text
- 自然语言生成 (NLG) 技术
- 轻量级 NLG 模型的开发可以在智能手机和物联网设备等资源受限的设备上运行,同时保持高性能水平,使得人工智能生成的文本成为移动 AIGC 网络中的基本服务[34]。
- ALBERT (A Lite BERT) [101]
- 由谷歌团队提出的一种改进版的BERT模型,旨在通过分解嵌入参数化、跨层参数共享和句子顺序预测任务来优化 BERT 的性能,同时减少模型的参数量,从而提高训练效率和推理速度。
- ALBERT 的设计目标是解决 BERT 在大规模应用时的内存和计算效率问题,同时保持模型的性能。
- ALBERT 在各种自然语言处理任务上达到了与 BERT 相当的性能水平,例如问答和情感分析 [10]。其更轻的模型设计使其更适合部署在资源有限的边缘设备上。
- MobileBERT [102]
-
- MobileBERT 专为以最少的资源部署在移动和边缘设备上而设计。
- MobileBERT 是更紧凑的 BERT 变体,在与 BERT 相同数量的数据上进行预训练的,但具有计算效率更高、参数更少的设计。同时,采用量化来降低模型的重量精度,进一步降低其处理要求。
- MobileBERT 是一种高效模型,兼容智能手机和物联网设备,可用于多种移动应用程序,例如个人助理、聊天机器人和文本转语音系统[34]。此外,它还可用于小型跨模式应用,例如图像字幕、视频字幕和语音识别。
-
2)AI-generated Audio
- 人工智能生成的音频由于其具有增强用户体验、提高效率、安全性、个性化、成本效益和可访问性的潜力而在移动网络中受到重视。例如,增强通话质量,压缩传输音频所需数据,语音转文本,声纹身份验证。
- Audio Albert [41]
- BERT 模型的简化版本,适用于音频表示的自监督学习。
- 与其他流行的人工智能生成的音频模型相比,在语音识别、说话人识别和音乐流派分类等各种自然语言处理任务中表现出具有竞争力的性能水平。
- 在延迟方面,Audio Albert 显示出比之前模型更快的推理时间,平均推理时间平均缩短了 20%,这可以显着改善移动边缘网络的响应时间。此外,Audio Albert 的准确性可与 BERT 相媲美,并在多个基准测试中取得了最先进的结果。
- 在移动边缘网络中使用 Audio Albert 可以带来多种好处,例如更快的响应时间、减少延迟和降低功耗,使其成为移动边缘网络中人工智能生成音频的有前景的解决方案。
3)AI-generated Images
- 人工智能生成的图像在移动网络中提供了许多应用,例如图像增强、图像压缩、图像识别和文本到图像生成
- Make-a-Scene [107]
- 一种新颖的文本到图像生成模型,它利用人类先验根据文本描述生成逼真的图像。
- 该模型由文本编码器、图像生成器和先前的人类模块组成,该模块经过人类注释数据的训练以融入常识知识。
- 在移动网络中,可以在大型图像和文本描述数据集上训练该模型,以响应用户请求快速生成图像,例如创建路线图的视觉表示。
- Semi-Parametric Neural Image Synthesis (SPADE) [108]
- 使用神经网络架构从现有图像及其相关属性生成新图像。
- 这种方法在输入属性条件下生成高度逼真的图像,可用于移动网络中的图像到图像转换、修复和风格传输。SPADE 方法与 Make-a-Scene 中的文本到图像生成方法有相似之处,这两种技术都专注于根据输入数据生成高质量、逼真的图像。
- 然而,人工智能生成图像技术的发展也引起了人们对深度造假技术的担忧,该技术使用基于人工智能的技术来生成描绘不存在的事件或个人的真实照片、电影或音频 [13]。深度造假可能会干扰系统性能并影响移动用户任务,从而导致道德和法律问题,需要更多的研究和立法。
4)AI-generated Videos
- 人工智能生成视频,可以在移动网络中用于各种应用,如视频压缩、增强、摘要和合成。
- Imagen Video [11]
- 一个基于级联视频扩散模型的文本条件视频生成系统。Imagen Video 使用基本视频生成模型以及空间和时间视频超分辨率模型的交错序列从文本输入生成高清视频。
- 作者描述了将系统扩展为高清文本到视频模型的过程,包括设计选择,例如选择特定分辨率下的全卷积时间和空间超分辨率模型以及选择扩散模型的 v 参数化。
- 他们还将无分类器指导的渐进式蒸馏应用于视频模型,以实现快速、高质量的采样 [11]、[97]。 Imagen Video不仅可以制作高质量的视频,还拥有高水平的可控性和世界知识,能够生成各种艺术风格和3D对象理解的多样化视频和文本动画。
5)AI-generated 3D
- AI 生成的 3D 内容对于各种无线移动网络应用(包括 AR 和 VR) 变得越来越有前景[110]。
- 它还通过优化基站布局来提高网络效率并减少延迟[111]、[112]。研究人员提出了多种使用深度学习 (DL) 模型生成高质量和多样化 3D 内容的技术,其中一些技术在应用和功能方面相互补充。
- Latent-NeRF [113]
- 它使用 NeRF 架构从 2D 图像生成 3D 形状和纹理。该模型用途广泛,可用于各种应用,例如 3D 对象重建、3D 场景理解以及无线 VR 服务的 3D 形状编辑。
- Latent Point Diffusion (LDP) [114]
- 可以生成具有细粒度细节的 3D 形状,同时控制整体结构。 LPD 已被证明能够比其他最先进的模型创建更多样的形状,使其适用于 3D 形状合成、3D 形状补全和 3D 形状插值。
- LPD 模型通过提供更多样化的形状和更精细的细节来补充 LatentNeRF 方法。
- Diffusion-SDF [115]
- 该模型根据自然语言描述生成 3D 形状。
- 该模型结合体素化符号距离函数和基于扩散的生成模型,在控制整体结构的同时生成具有细粒度细节的高质量 3D 形状。
- 该技术可根据自然语言描述准确生成 3D 形状,使其可用于 3D 形状合成、补全和插值等应用。在生成高质量 3D 内容方面,它与 Latent-NeRF 和 LPD 模型有相似之处 [116]。
B.Advantages of Mobile AIGC
- 高效
- 自动化,生成式人工智能模型可以自动化创建文本、图像和其他类型媒体的过程,减少对人力的需求并显着提高生产力。
- 生成式人工智能模型可以在移动网络边缘实现,从而允许它们在智能手机和物联网传感器等设备上本地生成数据。减少通过移动网络传输的数据量,缓解网络拥塞,并提高系统的响应能力和效率[39]。改善用户体验并减少依赖实时数据生成和处理的移动应用程序的延迟。
- 可重构性
- 通过在移动网络中部署人工智能模型,AIGC 可以生成大量内容,包括文本、图像和音频,这些内容可以无缝调整以适应不断变化的网络需求和用户偏好。例如,ChatGPT 模型体现了 AIGC 在提供多语言支持方面的可重构性。
- 然而,在 AIGC 模型中实现多语言支持可能会带来一些挑战和限制。
- 需要大量训练数据以及难以保持不同语言之间的一致性。
- 此外,保持不同语言的一致性可能具有挑战性,因为每种语言都有自己独特的语法和句法。
- 最后,AIGC 模型可能会遇到特定于某些语言的文化细微差别、隐喻和惯用表达,这可能会导致对用户查询的误解或曲解。
- 为了克服在 AIGC 模型中实现多语言支持的挑战,未来的研究可以集中于开发更高效、更有效的训练方法,这些方法需要更少的数据。另一个潜在的解决方案是将文化和语言专家纳入培训过程。还可以探索迁移学习的使用,即用一种语言训练的模型适应另一种训练数据较少的语言。
- AIGC 还可以通过利用图像和音频生成模型来促进移动网络的可重构性。
- 动态网络架构的开发。这些人工智能增强型设计可以轻松地重新配置,以满足不断变化的网络需求(流量模式的波动或创新服务的引入)。例如,生成式人工智能模型,可用于根据网络环境创建最优的系统激励机制,从而提高参与用户的效用并增强整体网络性能 [121]。
- 动态网络架构的开发。这些人工智能增强型设计可以轻松地重新配置,以满足不断变化的网络需求(流量模式的波动或创新服务的引入)。例如,生成式人工智能模型,可用于根据网络环境创建最优的系统激励机制,从而提高参与用户的效用并增强整体网络性能 [121]。
- 准确性
- 在移动网络中使用生成式人工智能模型可以在准确性方面带来显着的好处,从而实现更精确的预测和明智的决策,提供更准确、更高效的服务,最终打造卓越的用户体验。
- 在移动网络中使用生成式人工智能模型可以在准确性方面带来显着的好处,从而实现更精确的预测和明智的决策,提供更准确、更高效的服务,最终打造卓越的用户体验。
- 可扩展性和可持续性
- AIGC 可以生成各种内容,包括文本、图像和音频,以多种方式增强移动网络的整体可扩展性和可持续性。
- AIGC 通过减少对人力和资源的依赖来促进移动网络的可扩展性。例如,AIGC 可以对客户询问生成自动响应,从而减少对人工客户支持人员的需求。这种方法减少了与运营人工联络中心相关的能源消耗,并减少了与人力相关的碳足迹[21]。
- AIGC 可以通过减少对物理内容存储的需求来促进移动网络的可持续性。通过按需生成新内容,AIGC 最大限度地减少了存储和管理大量物理材料的必要性。
- 安全和隐私
- AIGC 可以通过在人工智能生成的内容中嵌入敏感信息来提供潜在的安全和隐私优势。这种方法可以用作隐写术的一种形式,这是一种将数据隐藏在其他类型数据中的技术 (steganography),使未经授权的各方很难检测到隐藏的信息。
- 人工智能生成的内容可以用作安全措施,例如用于语音生物识别的人工智能生成的音频或用于身份验证目的的人工智能生成的面部图像,为移动网络服务增加了额外的安全层[21]。
- 但必须意识到与 AIGC 相关的潜在安全和隐私风险,例如对 AI 模型的对抗性攻击或出于恶意目的滥用 AI 生成的内容,例如 Deepfakes [13],必须采取强有力的安全措施和加密技术,并持续进行研究以应对潜在威胁 。
Ⅴ、CASE STUDIES OF AIGC IN MOBILE NETWORK
(第Ⅴ节具体case,略过)
A. AIGC Service Provider Selection
B. Generative AI-empowered Traffic and Driving Simulation
C. AI-Generated Incentive Mechanism
D.Blockchain-Powered Lifecycle Management for AIGenerated Content Products
VI. IMPLEMENTATION CHALLENGES IN MOBILE AIGC NETWORKS
- 实现云边移动协作计算架构来提供 AIGC 服务,有以下几个关键的实施挑战需要解决,以提高资源利用率和用户体验。
A.Edge Resource Allocation
- 对于资源受限的边缘服务器和移动设备来说,基于边缘智能的 AIGC 服务提供是计算和通信密集型的。
- 在 AIGC 服务提供交互过程中,模型准确性和资源消耗是最常见的指标。如表 Ⅲ 所列,接下来介绍几个常见的关键性能指标:
- 模型准确性:分配边缘资源的关键问题是在充分利用网络资源的同时优化AI服务的准确性。除了客观的图像识别和分类任务外,人工智能模型还基于内容的个性化和适应程度,因此,优化 AIGC 内容网络可能比传统优化更复杂,因为个性化和定制使得评估模型准确性更加难以预测。
- 带宽利用率:边缘服务器在提供AIGC服务的同时,必须最大化其信道利用率,以保证高密度边缘网络中的可靠服务。因此,边缘服务器必须控制信道访问,以减少用户请求之间的干扰。
- 边缘资源消耗:由于边缘设备的异构性,边缘服务在处理用户请求时会消耗资源来生成适当的 AIGC [142]。 AIGC 服务的部署需要不断迭代以满足用户的实际需求,因为AIGC模型的生成结果通常不稳定。这种在边缘服务器上持续提供 AIGC 服务会导致大量资源消耗。
-
在资源受限的边缘计算网络中,在模型准确性和资源消耗之间取得平衡可能具有挑战性。
- 一种潜在的策略是根据用户的需求调整模型精度和资源消耗之间的权衡。例如,在某些情况下,如果较低的模型精度水平可以带来更快的响应时间或更低的资源消耗,则可以接受。
- 另一种方法是使用迁移学习,它涉及在新数据上训练现有模型以提高准确性,同时需要更少的计算资源。模型压缩技术还可用于减小 AI 模型的大小,而不会显着影响准确性。
-
为了在移动边缘网络提供智能应用程序,应将大量精力集中在模型精度、网络、通信和边缘计算资源之间的关系上。同时,由于移动边缘网络的动态网络环境和用户需求,提供 AIGC 服务具有挑战性。
-
相关研究
- [136] 中的作者提出了一种基于阈值的方法,用于减少协作学习期间边缘网络的流量。
- 通过考虑计算资源,[135] 中的作者研究了通信、计算、存储和隐私约束下的分布式机器学习问题。基于分布式梯度下降收敛率获得的理论结果,他们提出了一种分布式边缘学习的自适应控制算法,以平衡局部更新和全局参数聚合之间的权衡。
-
-
AIGC 模型通常需要对非静态移动边缘网络中新生成的数据和动态请求进行频繁的微调和重新训练[143]。
- ADMM [137]
- 作者将AI 服务放置和资源分配问题表述为 MINLP。在 MINLP 问题中,资源分配和信道分配是离散决策变量,而设备和边缘频率是连续变量。然而,解决这个问题并非易事,特别是在大规模网络环境中。
- 为了最大限度地减少边缘 AI 系统的总时间和能耗,作者提出了一种乘法器交替方向法(ADMM) 来降低解决该问题的复杂性。
- 实验结果表明,该方法实现了接近最优的系统性能,同时计算复杂度随着用户数量的增加而线性增长。
- 此外,当边缘智能系统共同考虑AI模型训练和推理[138]时,ADMM 方法可以优化边缘资源。
- EdgeAdapter [139]
- 作者探索了如何在边缘为多个人工智能应用程序和人工智能模型提供服务。
- 他们提出了 EdgeAdapter,如下图所示,来平衡推理准确性、延迟和资源消耗之间的三重权衡。
- 为了提供长期利润最大化的推理服务,他们首先将问题分析为 NP-Hard 问题,然后使用基于正则化的在线算法来解决它。
- ADMM [137]
- 在移动AIGC网络中,提供AIGC服务的有效架构是将大型AIGC模型划分为多个较小的模型以供本地执行[28]。
-
挑战:尽管划分大型 ML 模型并将较小的模型分发到移动设备进行协作执行是可行的,但模型分发和结果聚合可能会在模型训练和推理过程中产生额外的延迟。其次,由于其众多的约束条件和巨大的解决空间,制定的优化问题非常复杂。
- 为了解决上述问题,作者 [144] 提出了一种替代迭代优化,以在多项式时间内获得解决方案。
-
挑战:AIGC 服务允许用户将他们的偏好输入到 AIGC 模型中。如何在协作模型训练和推理过程中保护多个用户之间的用户隐私。
- [141]中的作者研究了由 FL 实现的去中心化边缘智能的通信效率问题。与使用全局控制器的集中式学习不同,分散式学习方法可以提高可靠性,同时牺牲一些通信性能。去中心化学习场景可以采用两阶段的方式来提高参与率。在这种方法中,基于进化博弈的分配可用于簇头选择,并且基于深度学习的拍卖有效地奖励模型所有者。
-
B.Task and Computation Offloading
- 对于处理能力低且电池寿命有限的移动设备来说,提供高质量和低延迟的 AIGC 服务具有挑战性。幸运的是,AIGC 模型可以通过 RAN 卸载 AIGC 模型的任务和计算到用户附近的边缘服务器。
- 如表 IV 所列,几个 KPIs 与移动 AIGC 网络中的计算卸载特别相关:
- 服务延迟:服务延迟是指与数据输入和检索以及用户为生成 AIGC 执行的模型推理计算相关的延迟。通过将 AIGC 任务从移动设备(例如微调和推理)卸载到边缘服务器来执行,可以减少移动 AIGC 网络中的总延迟。与 AIGC 模型的本地执行不同,将 AI 任务卸载到边缘服务器执行会在传输个性化指令和下载 AIGC 内容时引入额外的延迟。
- 可靠性:可靠性评估用户准确获取个性化数据的成功率。一方面,当连接到边缘服务器时,由于动态信道条件和无线网络不稳定,用户可能会遇到将请求的数据上传到边缘服务器或从服务器下载结果的困难。另一方面,AIGC模型生成的内容在个性化、定制化特征方面可能无法完全满足AIGC用户的需求。不成功的内容接收和无效内容会影响 AIGC 网络的可靠性。
-
在对 AIGC 模型实施云边协同训练和微调时,重要的是要考虑实现云和边缘服务器之间有效协作的特定算法或技术。例如,联邦学习和分布式训练方法可以通过允许边缘服务器在本地训练模型,然后将更新的权重发送到云服务器进行聚合,来促进协作过程。
-
云和边缘服务器之间的职责划分也会极大地影响AIGC模型的整体效率和性能。因此,讨论和实施适当的方案来确定哪些任务卸载到边缘服务器以及哪些任务在云服务器上执行至关重要。
-
异构AIGC模型可以根据其资源需求和服务需求部署在移动设备和边缘服务器上[154]。然而,ML 任务的多个属性,如准确性、推理延迟和可靠性,使得 AIGC 的卸载问题变得高度复杂。
- 因此,[145]的作者提出了一种机器学习任务卸载方案,以最大限度地减少任务执行延迟,同时保证推理准确性。考虑到错误推理会导致任务处理的额外延迟,他们最初将推理过程建模为M/M/1队列,这也适用于AIGC服务流程。
-
Mixed-Integer Nonlinear Programming(MINLP)可最大限度地减少配置延迟,可在 AIGC 服务的推理过程中采用。
- 为了将[145]中的确定性环境扩展到更通用的环境,[146]中的作者首先提出了一种自适应翻译机制来自动动态地卸载智能物联网应用程序。然后,他们使用随机森林回归模型做出预测性卸载决策。
- 他们的实验表明,所提出的框架将复杂应用程序的响应时间减少了一半。此类机器学习方法还可用于分析 AIGC 网络流量,以提高服务交付效率和可靠性。
-
此外,用户配置文件(包括位置和设备类型) 可能会影响用于任务卸载的边缘服务器的选择。
-
并且,带宽和丢包率等网络条件也会影响服务的可靠性和延迟。因此,有必要实施有效的资源分配和任务卸载方案,以确保在动态和多样化的环境中提供高质量和低延迟的AIGC服务。
-
云边协同智能可以将本地任务卸载到边缘和云服务器。
- AIGC 可以受益于云边缘智能,因为边缘服务器可以提供低延迟的 AIGC 服务,云服务器可以提供高质量的 AIGC 服务。
- [28] 中的作者开发了一种名为 Neurosurgeon 的方案,根据模型架构、硬件平台、网络条件和服务器负载信息选择最佳划分点,以自动划分云和边缘服务器之间 DNN 张量的计算。
- 此外,[156] 中的作者发现分层方法可以将设备之间传输的消息数量减少多达 97%,而模型的准确性仅降低 3%。
-
在工业边缘智能中,边缘智能嵌入工业物联网[148]中,将计算任务卸载到边缘服务器是在整个制造生命周期中实现自组织、自主决策和快速响应的有效解决方案,这同样是移动设备所需要的AIGC 网络。因此,有效解决任务分配问题对于有效的 AIGC 模型推理至关重要。
- 然而,设备之间多个任务的共存使得系统对各种任务的响应速度变慢。例如,基于文本和基于图像的 AIGC 可以共存于同一边缘设备上。
- 作为一种解决方案,在[148]中,作者提出了一种编码组进化算法来解决大规模任务分配问题,其中任务跨越各种产品的整个生命周期,包括实时监控、复杂控制、产品结构计算、多学科合作优化、生产过程计算。同样,AIGC 生命周期包括数据收集、标记、模型训练和优化以及推理。
- 此外,引入了一种简单的分组策略来并行划分解空间并加速进化优化过程。与针对特定边缘服务器的虚拟机级适配[157]相比,作者提出了针对通用服务器的应用程序级适配。
- [149]中更轻的适配框架进一步改善了传输时间和用户数据隐私性能,包括向通用边缘服务器卸载和数据/代码恢复。
-
大多数智能计算卸载解决方案收敛缓慢,消耗大量资源,并引发用户隐私问题[158]、[159]。利用基于学习的方法做出 AIGC 服务卸载决策时,情况类似。
- 因此,作者通过联合多智能体强化学习增强了多用户 QoE [160],以实现 [150] 中的协作边缘智能。他们将协作卸载问题表述为马尔可夫决策过程(MDP)。状态由当前任务、本地负载和边缘负载组成。学习代理选择任务处理位置以最大化多用户 QoE,同时考虑服务延迟、能耗、任务丢失率和隐私保护。
C. Edge Caching
- 边缘缓存是利用边缘基站和移动设备的存储容量来交付低延迟内容和计算服务。
- 如下图所示,在移动AIGC网络中,用户可以通过在边缘服务器和移动设备中缓存AIGC模型来请求AIGC服务,而无需访问云数据中心。
- 如下表所示,以下是 AIGC 网络中边缘缓存的几个关键性能指标 KPIs:
- 模型访问时延:模型访问时延是AIGC服务质量的重要指标。当 AIGC 模型缓存在移动设备中时延迟是最低的。当边缘服务器提供AIGC模型时,还必须考虑无线通信网络中的延迟来计算模型访问延迟。最后,云提供AIGC服务时必须考虑核心网络延迟。
- 回程流量负载:当AIGC模型缓存在移动边缘网络时,回程流量的负载显着降低,因为AIGC服务的请求和结果不需要经过核心网络。
- 模型命中率:与内容命中率类似,模型命中率是边缘缓存中 AIGC 模型的重要指标。可用于以后模型退出和模型更换时的加载。
-
AIGC模型缓存主要面临三个挑战:
- 内存约束边缘服务器:与资源丰富的云相比,边缘网络中的服务器资源(例如GPU内存)是有限的[168]。因此,将所有 AIGC 模型缓存在一台边缘服务器上是不可行的。
- 模型缺失成本:当移动设备用户请求AIGC时,如果模型没有缓存在当前边缘服务器中,则相应的模型会丢失[162],边缘服务器需要向云服务器发送模型请求并下载模型,这会导致带宽和延迟方面的额外开销。
- 功能等效模型:AIGC 模型的数量很大,并且根据详细任务的数量而增加[169]。同时,人工智能模型在不同的应用中具有相似的功能,即功能等效。例如,对于图像识别任务,提出了大量具有不同架构的模型来识别图像中的特征,这些模型具有不同的模型架构和计算要求。
-
为了解决这些挑战,[161]中的作者将边缘建模问题表述为确定哪些深度学习模型应该预加载到内存中,哪些应该在内存满时被丢弃,同时满足推理响应时间的要求。幸运的是,可以使用边缘内容缓存的现有缓存替换策略来解决此边缘模型缓存问题。
- 但是,深度学习模型的精度和计算复杂性使得该优化问题比传统的边缘缓存问题更加复杂。同样,对于资源受限的边缘服务器,AIGC 模型可以动态部署和替换。然而,尚未研究用于加载和卸载 AIGC 模型以最大化命中率的有效缓存算法。
-
多种模型在网络边缘的AIGC服务中发挥着协同作用,同时多种模型的支持也对边缘服务器有限的GPU内存提出了挑战。
- 因此,[162]的作者根据模型特征和工作负载提出了一种具有驱逐策略的模型级缓存系统。
- 模型驱逐策略基于缓存未命中惩罚和请求数量的模型效用计算。这种模型感知缓存方法引入了在具有异构请求的移动边缘网络上提供 AIGC 服务的新方向。
- 实验结果表明,与non-penaltyaware驱逐策略相比,模型加载延迟可以减少1/3。对于哪些不受欢迎的 AIGC 模型应该被卸载的问题,也可以采用这种驱逐策略。
-
在移动AIGC网络中,不仅需要缓存AIGC模型,还可以缓存AIGC请求和结果,以减少AIGC网络中服务请求的延迟。
- 为此,作者设计了一种有原则的缓存设计,通过利用视频的时间局部性进行连续视觉任务来加速 CNN 模型的执行,以支持移动视觉应用[171]。
- [163] 中的作者提出了一种名为 DeepCache 的原则性缓存方案,用于检索可重用结果,并通过利用移动视频流的时间局部性在细粒度 CNN 中重用它们。在 DeepCache 中,移动设备不需要将任何数据卸载到云端,并且可以支持最流行的模型。此外,DeepCache 无需开发人员重新训练模型或调整参数,即可缓存未修改的 CNN 模型的推理结果。
- 总体而言,DeepCache 可以通过缓存内容来减少模型推理延迟,同时牺牲一小部分模型精度,从而降低能耗。
-
在边缘智能的无服务器计算中,移动设备可以调用边缘服务器上的AIGC服务的功能,与基于容器和虚拟机(VM)的AIGC服务相比,这更具资源效率。
- 然而,此类功能面临着在边缘服务器上初始化其代码和数据依赖性的冷启动问题。尽管每个函数的执行时间通常很短,但初始化(即在执行之前获取和安装必备库和依赖项)非常耗时[172]。
- 幸运的是,[164] 中的作者通过证明保活功能与缓存等效,表明基于缓存的保活策略可以用来解决冷启动问题。最后,为了平衡服务器内存利用率和冷启动开销之间的权衡,提出了一种贪婪的双基缓存算法。
D.Mobility Management
- 车联网和无人机(UAV)网络的移动边缘智能依赖于有效的移动管理解决方案[183]-[186]来提供移动AIGC服务。此外,基于无人机的 AIGC 服务分发具有易于部署、灵活性和广泛覆盖范围等优势,可增强边缘智能[187]、[188]。
- 如表 VI 所示,以下是 AIGC 网络中移动性管理的几个 KPIs:
- 任务完成率:在移动边缘网络提供AIGC服务必须考虑用户的动态特性。因此,业务必须在用户离开基站之前完成。为了衡量 AIGC 网络中移动性管理的有效性,可以使用任务完成率。
- 覆盖增强:车辆和无人机可以作为可重构基站来增强移动AIGC网络的覆盖范围[190],随时随地为用户提供AIGC模型和内容。
-
在车辆网络中,AIGC 赋能的导航系统等智能应用正在重塑现有的交通系统。
- 在[176]中,作者提出了一种联合车辆边缘推理框架来优化能耗,同时减少 DNN 的执行延迟。具体来说,车辆和边缘服务器确定 DNN 的最佳划分点,并为 DNN 执行动态分配资源。
- 他们提出了一种基于化学反应优化的算法,以在解决资源分配问题时加速收敛。该框架为实施移动 AIGC 网络提供了见解,车辆可以在移动过程中与基站协作,提供基于 DNN 的实时 AIGC 服务。
-
然而,资源有限的车辆无法满足任务的QoS要求。
- [177] 中的作者提出了一种分布式调度框架,该框架开发了优先级驱动的传输调度策略,以解决车辆网络的动态网络拓扑并促进车辆边缘智能。
- 为了满足智能任务的各种QoS需求,可以对大容量任务进行分区顺序上传。
- 此外,车辆运动对任务完成时间和边缘服务器负载平衡的影响可以通过智能任务处理请求独立处理。通过模拟和部署实验,在单车和多车环境中证明了所提出框架的有效性。
-
高动态、时变车联网(IoV)中 AIGC 服务的异构通信和计算需求值得进一步研究[195]、[196]。
- 为了动态地做出传输和卸载决策,[179]中的作者在其联合通信和计算资源分配策略中制定了针对时变环境的马尔可夫决策过程。最后,他们开发了一种受量子启发的强化学习算法,其中量子机制可以增强学习收敛性和性能。
- [180] 中的作者提出了一种堆叠式自动编码器来捕获空间和时间相关性,以将道路交通管理和数据网络交通管理结合起来。为了减少车辆能耗和学习延迟,所提出的学习模型可以最小化所需的信号流量和预测误差。因此,通过该管理框架可以提高基于自动编码器技术的AIGC服务的准确性。
-
借助无人机增强的边缘智能,无人机可以充当移动 AIGC 网络中的空中无线基站、边缘计算服务器和边缘缓存提供商。
- 为了展示无人机增强边缘智能的性能,同时保护移动边缘网络的用户隐私,[181] 中的作者使用支持无人机的 FL 作为用例。此外,作者建议使用自适应调度无人机在计算和缓存服务之间灵活切换是未来研究的一个主题。因此,灵活的AIGC业务发放和基于无人机的AIGC交付对于满足实时业务需求和可靠发电至关重要。
- 在这方面,[182]的作者提出了一种视觉辅助定位解决方案,用于GPS 信号弱或不稳定的基于无人机的 AIGC 交付服务。具体来说,利用知识蒸馏来加快推理速度并减少资源消耗,同时保证令人满意的模型精度。
E.Incentive Mechanism
- 随着设计合适的激励机制,更多的边缘节点参与并为 AIGC 服务做出贡献[132]、[201]、[202]。这增加了系统的计算能力。此外,节点有动力通过提供高质量的服务来获得奖励。从而提高了AIGC服务的整体质量。最后,通过区块链记录资源交易,鼓励节点在没有安全问题的情况下进行安全操作。
(略)
F.Security and Privacy
-
当移动用户友善时,AIGC可以大大提高他们的创造力和效率。然而,恶意用户也可以利用 AIGC 进行破坏性目的,对移动边缘网络中的用户构成威胁。
- 为了确保AIGC服务的安全,提供商必须选择值得信赖的AIGC解决方案,以安全的方式训练AI模型,同时为AIGC服务用户提供安全的提示和答案。
1)Privacy-preserving AIGC Service Provisioning
- 在移动 AIGC 网络中,AIGC 模型训练数据的生成和存储发生在边缘服务器和移动设备上 [210]。与资源丰富的云数据中心不同,边缘层和移动层针对各种攻击的防御能力有限。
- 幸运的是,已经提出了几种保护隐私的分布式学习框架,例如 FL [15],FL 是一种分布式机器学习方法,允许用户在模型训练期间传输本地模型而不是数据[211][213]。具体来说,如图 20 所示,在 AIGC 网络中使用 FL 有两种主要方法:
- 安全聚合:在学习 FL 的同时,移动设备将本地更新发送到边缘服务器以进行全局聚合。在全局聚合期间,经过身份验证的加密允许使用秘密共享机制。
- 差异隐私:差异隐私可以防止 FL 服务器识别本地更新的所有者。差异隐私类似于安全聚合,因为它可以防止 FL 服务器识别本地更新的所有者。
- 幸运的是,已经提出了几种保护隐私的分布式学习框架,例如 FL [15],FL 是一种分布式机器学习方法,允许用户在模型训练期间传输本地模型而不是数据[211][213]。具体来说,如图 20 所示,在 AIGC 网络中使用 FL 有两种主要方法:
- 因此,在[214]中,作者提出了一种差分私有联合生成模型来综合私有数据的代表性示例。在保证隐私的情况下,所提出的模型可以在无需人工干预的情况下解决许多常见的数据问题。
- 此外,在[215]中,作者提出了一种基于 FL 的生成学习方案来提高 GAN 模型的效率和鲁棒性。所提出的方案在存在变化的并行性和高度倾斜的数据分布的情况下特别有效。为了找到用户数据和未标记数据集中固有的聚类结构,作者在[216]中提出了无监督迭代联合聚类算法,该算法使用生成模型来处理 FL 参与者之间可能存在的统计异质性。
- 由于[215]、[216]中的集中式FL框架可能会引起安全问题并带来单点故障的风险,因此作者在[217]中提出了一种基于环形拓扑和深度生成模型的分散式FL框架。一方面,同步环形拓扑的方法可以提高系统的通信效率和可靠性。另一方面,生成模型可以解决数据相关的问题,如不完整、质量低、数量不足、敏感等。最后,开发了基于星际文件系统(IPFS)的数据共享系统,以降低数据传输成本和交通拥堵。
2)Secure AIGC Service Provisioning
- 与中央云 AIGC 提供商相比,移动和边缘 AIGC 提供商可以通过与许多用户节点协作来定制 AIGC 服务,同时将数据分发到不同的设备 [222]。因此,多方内容流需要安全的访问控制机制来保证隐私和安全。
- 然而,由于移动AIGC网络受到各种攻击,AIGC传输的安全性无法得到保证[223]。幸运的是,基于分布式账本技术的区块链可以用来探索安全可靠的AIGC服务提供框架,并记录资源和服务交易,以鼓励节点之间的数据共享,形成可信且活跃的移动AIGC生态系统[224]。
- 如图 21 所示,区块链为移动 AIGC 网络带来了几个好处 [22]:
- 计算和通信管理:区块链使异构计算和通信资源能够在移动 AIGC 网络中安全、自适应、高效地管理。
- 数据管理:通过使用智能合约在区块链中记录 AIGC 资源和服务交易。
- 优化:AIGC 服务优化期间,区块链始终提供可用、完整且安全的历史数据,用于输入优化算法。
-
[226]的作者提出了一种基于深度生成模型和区块链的边缘智能框架。
- 为了克服数据集有限的准确性问题,框架中利用 GAN 来合成训练样本。
- 然后,该框架的输出由基于工作量证明共识算法的智能合约进行确认和激励。
- 此外,AIGC 的多模式输出可以被铸造为 NFT,然后记录在区块链上。
-
[227]中的作者开发了一种条件生成模型,根据以前集合的历史交易结果来合成新的数字资产集合。
- 首先,基于无监督学习提取NFT集合的上下文信息。基于历史背景,新铸造的集合是根据未来的代币交易生成的。所提出的生成模型可以根据上下文(即先前交易的提取特征)合成新的 NFT 集合。
G.Lessons Learned
- AIGC服务的多目标质量:在移动AIGC网络中,AIGC服务的质量由多个因素决定,包括模型精度、服务延迟、能耗和收入。因此,AIGC服务提供商需要满足用户对AIGC服务的多维质量要求。值得注意的是,边缘网络中动态变化的网络条件需要用户做出在线决策,以实现负载平衡和计算资源的高效利用。
- 用于高效交付 AIGC 服务的边缘缓存:边缘缓存在移动 AIGC 网络中高效交付 AIGC 服务方面发挥着关键作用。解决内存受限边缘服务器、模型缺失成本和功能等效模型的挑战对于优化缓存策略至关重要。开发模型感知缓存方法、研究偏好驱动的缓存策略以及实施有原则的缓存设计以减少延迟和能耗是增强移动 AIGC 网络性能的有希望的方向。
- 偏好感知的 AIGC 服务配置:根据用户偏好提供 AIGC 服务可以提高用户满意度,并减少移动边缘网络中的服务延迟和资源消耗。为了实现基于偏好的 AIGC 服务交付,AIGC 服务提供商必须首先收集历史用户数据并进行彻底分析,并根据用户反馈进行个性化推荐并调整策略。
- AIGC服务的全生命周期激励机制:在移动AIGC网络中,AIGC 服务的整个生命周期都需要对参与者进行适当的激励。单一 AIGC 服务提供商无法单独提供 AIGC 服务。在AIGC服务的数据收集、预训练、微调和推理的整个过程中,拥有异构资源的利益相关者需要合理的激励,并且必须根据其贡献分享收益。
- 移动 AIGC 网络基于区块链的系统管理:移动 AIGC 网络基于区块链的系统管理:此外,移动 AIGC 网络将异构用户设备连接到边缘服务器和云数据中心。这种对内容生成的不受控制的需求给系统带来了不确定性和安全风险。因此,需要安全的管理和审计方法来管理边缘环境中的设备,例如动态访问、离开和识别物联网设备。
VII. FUTURE RESEARCH DIRECTIONS AND OPEN ISSUES
- 如表八所示,在本节中,我们从网络和计算、机器学习和实际实现的角度讨论未来的研究方向和未解决的问题。
A.Sustainability in Mobile AIGC Networks
-
Decentralized Mobile AIGC Network
- 随着区块链技术的进步[228],基于分布式数据存储、计算和网络的融合以及数据所有权证明[224],可以实现去中心化的移动AIGC网络。这种由数字身份和智能合约支持的去中心化网络结构可以保护 AIGC 用户的隐私和数据安全。
- 此外,基于区块链技术,移动AIGC网络可以实现AIGC服务全生命周期的去中心化管理。因此,未来的研究应该研究用于去中心化移动 AIGC 网络部署的具体共识机制、链下存储框架和代币结构。
-
Sustainability in Mobile AIGC Networks
- 生成式AI模型的预训练、微调和推理通常会消耗大量的计算和网络资源。
- 因此,未来的研究可以集中在移动AIGC网络的绿色运营上,以最小的能源消耗和碳排放提供AIGC服务。为此,应开发有效的算法和框架来在动态服务配置、边缘节点操作模式和通信链路下操作移动AIGC网络。此外,还可以提出智能资源管理和调度技术来平衡服务质量和资源消耗之间的权衡。、
- 高质量的数据资源对于移动AIGC网络的可持续性也至关重要[123]。
B.Machine Learning Issues
-
AIGC Model Compression
- 随着 AIGC 模型变得越来越复杂,模型压缩技术对于减少提供 AIGC 服务时的服务延迟和资源消耗变得越来越重要 [230]。幸运的是,已经开发了几种用于 AIGC 模型压缩的技术,例如剪枝、量化和知识蒸馏。
未来关于 AIGC 模型压缩的研究可能会继续专注于开发和完善这些技术,以提高在边缘节点和移动设备中部署 AIGC 模型的效率和有效性。
- 随着 AIGC 模型变得越来越复杂,模型压缩技术对于减少提供 AIGC 服务时的服务延迟和资源消耗变得越来越重要 [230]。幸运的是,已经开发了几种用于 AIGC 模型压缩的技术,例如剪枝、量化和知识蒸馏。
-
Privacy-preserving AIGC Services
- 可以使用差分隐私、安全多方计算和同态加密等技术来保护敏感数据并防止未经授权的访问。差异隐私涉及向数据添加噪声以保护个人隐私,而安全多方计算允许多方计算函数而无需向彼此透露其输入。同态加密可以在不解密的情况下对加密数据进行计算。
C.Practical Implementation Issues
-
Integrating AIGC and Digital Twins
- 数字孪生能够维护表征以监控、分析和预测物理实体的状态[232]。一方面,AIGC和数字孪生技术的集成有可能显着提高移动AIGC网络的性能。通过创建物理移动 AIGC 网络的虚拟表示,可以通过历史数据分析和在线预测来优化服务延迟和质量。此外,AIGC 还可以通过减少设计人员创建仿真实体所需的时间来增强数字孪生应用。然而,AIGC与DT的集成过程中需要考虑几个问题,例如高效、安全的同步。
-
Immersive Streaming
- AIGC 可以创建沉浸式流媒体内容,例如 AR 和 VR,可以将观众传送到虚拟世界 [233],可用于教育、娱乐和社交媒体等各种应用。沉浸式流媒体可以通过为观众提供与生成的内容实时交互的平台来增强 AIGC 交付流程。未来的研究应侧重于解决 AIGC 算法生成有偏差内容的可能性以及沉浸式流媒体的高带宽要求,这可能会导致延迟问题,从而导致观众体验下降。
VIII. CONCLUSIONS
- 在本文中,我们重点关注移动 AIGC 网络的部署,其中 AIGC 模型、服务和应用程序位于移动边缘网络。我们讨论了生成模型的背景和基础知识以及移动 AIGC 网络中 AIGC 服务的生命周期。我们还探讨了 AIGC 驱动的创意应用程序和移动 AIGC 网络的用例,以及部署移动 AIGC 网络的实施、安全和隐私挑战。最后,我们重点介绍了移动 AIGC 网络全面实现的一些未来研究方向和未解决的问题。