华纳国际娱乐官网平台

2023-02-27 15:26:43 来源:高通技术公司工程技术副总裁侯纪磊/产品管理高级副总裁Ziad Asghar

微信图片_20230227152829.png

上图为Stable Diffusion利用 文本提示 穿盔甲超级可爱的毛绒绒猫战士 逼真 4K 细节、 V - Ray渲染 虚幻引擎 生成的图像

基础模型正 席卷 AI 行业。基础模型 指基于 海量数据 进行 大规模训练的大型神经网络, 进而 能以高性能 表现 适应广泛的 后续 任务。 流行 的基础模型Stable Diffusion 一个非常出色的从 文本到图像 生成式 AI 模型 能够基于任何文本输入 在数十秒内创作 逼真图像。Stable Diffusion 参数超过10亿,迄今为止主要限于在云端运行。 接下来我将 介绍 高通 AI Research 如何利用 高通 AI 软件栈 Qualcomm AI Stack 执行全栈 AI 优化,首次在 Android 智能手机上部署 Stable Diffusion

微信图片_20230227152913.png

通过全栈 AI 优化,完全在终端侧高效运行 Stable Diffusion

高通 AI 软件栈支持 全栈 AI 优化

AI 首创 博客文章 中,我 们提到 过高通 AI Research 不仅 开展 全新 AI 研究 工作,也率先 在商用终端上 展示 概念验证 为在 现实 世界中 技术 规模化应用 平道路 我们的 全栈 AI 研究 跨应用、神经网络模型、算法、软件和硬件 进行 优化 ,并在 公司内 进行 部门 合作。 针对 Stable Diffusion,我们从 Hugging Face FP32 1-5 版本 开源模型 入手,通过量化、编译和硬件加速 进行 优化, 使其能 在搭载 第二代骁龙8移动平台 的手机上运行。

为了把模型从FP32 压缩 INT8,我们使用 高通 AI 模型增效工具包 ( AIMET ) 的训练 量化 这是基于高通A I Research 创造的技术所开发的工具,目前已经 集成入 新发布的 Qualcomm AI Studio 中。通过让模型在 我们的 专用 AI 硬件上高效运行 并降低内存带宽消耗,量化不仅能够提高性能,还可以降低功耗。 自适应舍入 ( AdaRound ) 先进的 高通 AIMET量化技术能够在更低精度水平保持模型准确性,无需 进行 重新训练。这些技术能够 应用于构成 Stable Diffusion 的所有组件 模型,即基于Transformer的文本编码器、 VAE 解码器和 UNet 这对于 模型 适合于在终端上运行 至关重要。

微信图片_20230227152950.png

高通 AI 软件栈将最优秀的 AI 软件产品集合到一个软件包中,帮助 OEM 厂商和开发者在我们的产品上创建、优化和部署他们的 AI 应用,充分利用高通 AI 引擎的性能。

对于编译,我们利用高通 AI 引擎 Direct 框架将神经网络映射 能够在目标硬件上高效运行的程序 。高通 AI 引擎 Direct 框架基于高通 Hexagon 处理器 硬件架构和内存层级 进行序列运算 ,从而提升性能并最小化内存溢出。 部分上述增强特性是 AI 优化研究人员与编译器工程团队共同合作 的成果 以此来提升 AI 推理 时的 内存管理。高通 AI 引擎中所做的整体优化能够显著降低 runtime 的时延和功耗, 而这一亟需的趋势也同样存在于 Stable Diffusion

凭借 紧密的 软硬 件协同设计, 集成 Hexagon 处理器 高通 AI 引擎 能够 释放行业领先的边缘 AI 性能。支持 微切片推理 的最新第二代骁龙8移动平台 有能力高效运行像 Stable Diffusion 这样的 大模型 ,并且 下一代骁龙 预计还 将带来更多提升。此外,由于 构成 Stable Diffusion 的所有组件 模型 都采 用了多头注意力机制,为加速推理而 面向 transformer 模型(如MobileBERT)所做的 技术 增强 发挥了关键作用。

这一 全栈优化 最终让 Stable Diffusion 能够 在智能手机上运行, 15秒内执行 20 推理,生成一张512x512像素的图像 这是 智能手机上最快的推理 速度 ,能媲美云端时延 ,且 用户文本输入完全不受限制。

微信图片_20230227153008.png

Qualcomm AI Studio 将我们目前的所有工具整合到一个全新的 GUI 中,同时还有可视化工具,以简化开发者的使用体验。

微信图片_20230227153049.png

上图为Stable Diffusion利用 文本提示 野外河谷和山脉间的日式花园,高细节,数字插图, ArtStation ,概念艺术,磨砂,锐聚焦,插图, 戏剧性 的,落日,炉石,artgerm greg rutkowski lphonse mucha 的艺术作品 生成的图像

边缘 AI 的时代已经到来

随着 AI 端大 模型开始转向在边缘终端上运行, 高通打造 智能网联边缘 愿景 正在我们眼前加速实现, 几年前 还被 认为不可能的事情正在成为 可能 。这很有吸引力,因为 通过 边缘 AI 进行 终端侧处理具有诸多优势,包括可靠性、时延、隐私、网络带宽使用效率和 整体 成本。

尽管 Stable Diffusion模型看起来 过于 庞大, 它编码了大量语言和视觉 相关 知识, 几乎可以 生成任何 能想象 到的 图片 。此外,作为一款基础模型,Stable Diffusion能做的远不止根据文字提示生成图像。基于 Stable Diffusion 的应用 正在不断增加 ,例如图像编辑、图像修复、风格 转换 和超分辨率 等,将带来切实的影响 。能够完全在终端上运行模型而无需连接互联网,将带来无限的可能性。

扩展边缘 AI

在智能手机上运行Stable Diffusion只是开始。 让这一目标得以实现 的所有全栈研究和优化都 融入高通 AI 软件 栈。凭借高通 统一技术路线图,我们能够 利用单一 AI 软件栈并进行扩展,以适用于 不同 终端和不同 模型。

这意味着 为了让 Stable Diffusion 在手机上高效运行 所做的 优化也可用于高通技术公司赋能的其他平台,比如笔记本电脑、XR头显和几乎任何其它终端。在云端运行 所有 AI 处理 工作 成本 高昂 因此 高效 边缘 AI 处理 非常 重要。 由于 输入文本和生成图像 始终无需 离开终端 边缘 AI 处理 在运行Stable Diffusion(和其它生成式 AI 模型)时确保用户隐私 这对 于使用 消费级和企业级应用 都有巨大的好处 。全新 AI 软件 栈优化还 将有助于减少未来 在边缘 运行的下一代基础模型产品 上市时间。 这就是 我们 如何能够实现 跨终端 基础模型 进行 扩展 让边缘 AI 真正无处不在。

在高通,我们 基础研究 领域 实现突破 并跨终端和行业 进行 扩展, 赋能智能网联边缘。高通 AI Research 与公司 所有团队 通力合作,将最新 AI 发展 成果 和技术集成 到我们的 产品 之中,让实验室研究所实现的 AI 进步能够更快交付,丰富 人们 生活。


  1. EETOP 官方微信

  2. 创芯大讲堂 在线教育

  3. 创芯老字号 半导体快讯

华纳国际娱乐官网平台

缅甸华纳开户老虎机

  • 最新资讯
  • 最热资讯
@2003-2023 EETOP

京ICP备10050787号 京公网安备:11010502037710