2024 年 7 月 4 日,备受瞩目的世界人工智能大会暨人工智能全球治理高级别会议(WAIC)将于上海开幕。自 2018 年首次举办以来,WAIC 已走过六个年头,如今,WAIC 已经成为全球人工智能领域最具权威和影响力的行业盛会。
在本届 WAIC 即将开幕之际,终端侧 AI 推动者、领导者高通宣布了即将登展 WAIC 的消息,并迅速引发了业界的广泛期待。
技术展示环节更是亮点频现,包括首个在 Android 智能手机上运行的大语言和视觉助理大模型(LLaVA)、骁龙 X Elite 终端上的剪映 AI 视频编辑功能、第三代骁龙 8 赋能 Android 智能手机带来创新终端侧生成式 AI 体验等等。
这一系列技术展示,将是高通公司在推动终端侧 AI 技术边界拓展与行业生态合作方面的集中展现,也是对未来智能科技发展趋势的一次生动预演,相当值得期待了。
高通作为 AI 行业变革的赋能者,已经从底层芯片、到软硬件生态建设,以及应用的落地,都做足了准备,赋能引领行业创新。
再比如在底层芯片方面,早在 2015 年,高通就在骁龙 820 平台上集成了首个 AI 引擎;在今天的第三代骁龙 8 上,高通将高性能 AI 注入整个平台系统,采用面向生成式 AI 应用重新设计的 Hexagon NPU,够在终端侧运行高达 100 亿参数的模型,无论是首个 token 的生成速度还是每秒生成 token 的速率,都处在业界领先水平。例如在生成式 AI 语言理解模型 MobileBERT 上,第三代骁龙 8 的表现比竞品 A 高 17%,在鲁大师 AIMark V4.3、安兔兔这些 AI 基准测试的总分方面,第三代骁龙 8 也是远超竞品。
借助第三代骁龙 8 的 AI 能力,此次展会,高通也将展示首个在 Android 智能手机上运行的大语言和视觉助理大模型(LLaVA)。
除了移动端,在 AI PC 领域,高通还带来了骁龙 X Elite 和骁龙 X Plus PC 平台,凝聚了高通在通用处理和 AI 异构计算多年积累的技术成果,其集成的 NPU 更是具有 45TOPS 的恐怖算力,这是 PC 平台中最强大的 NPU。
不仅如此,高通还积极投身 AI PC 生态的建设,让开发者能够获取基于异构计算的 AI 加速,高通打造了 AI 软件栈(Qualcomm AI Stack)。它能够支持目前所有的主流 AI 框架,包括 TensorFlow、PyTorch、ONNX、Keras;它还支持所有主流的 AI runtime,包括 DirectML、TFLite、ONNX Runtime、ExecuTorch,以及支持不同的编译器、数学库等 AI 工具。
就在 6 月份,高通还针对其 45 TOPS 的 Hexagon NPU 开发、优化并验证了 AI 模型。注册开发者可以前往高通的 AI Hub 获取这些预训练模型,快速构建人工智能应用。据介绍,高通 AI Hub 提供了各种针对骁龙 X 系列处理器的边缘设备优化的 AI 模型,涵盖图像分类、对象检测、语义分割和生成式 AI 等领域。此外,AI Hub 还提供了便捷的工具和文档,帮助开发者轻松地在视觉、音频和语音等应用中部署 AI 模型。
其所做的这一切,正如高通公司 AI 产品技术中国区负责人万卫星所言:
高通具备顶尖的异构计算能力,使 AI 能力能够贯穿整个 SoC,将 CPU、GPU、NPU 和高通传感器中枢的能力都充分释放给应用开发者。
可以说,骁龙 X Elite / X Plus PC 平台的推出,如同为 AI PC 的变革性体验打下了扎实的地基,而借助骁龙 X Elite 平台强大 AI 能力和高通在生态建设上的开放策略,接下来会有更多 AI 生成式应用的涌现。
写在最后
在刚刚结束的 MWC 上海展会上,高通 AI 产品技术中国区负责人万卫星发表了“终端侧生成式 AI 的未来”的主题演讲,他提到,凭借面向生成式 AI 全新设计的 NPU 和异构计算系统,高通正为终端侧 AI 规模化扩展提供了有力支持。此外,高通还致力于构建完善的 AI 生态系统,不断推动 AI 技术的创新与发展。
7 月 4 日-6 日,WAIC,我们现场见!
(本文转载自IT之家)