云轴科技ZStack携手英特尔，优化基于ARC多用途GPU A770的智塔AIOS性能，实现本地化LLM高效部署

2025-09-22 19:37

随着人工智能技术爆发，推动算力成本以及软件定义硬件的技术快速迭代，用户正面临着严峻且日益突出的算力供给与需求矛盾；新的模型层出不穷，用户在各类模型的应用过程中被越来越多的瓶颈制约，许多的客户会受困与算力生态单一，成本高昂，资源不平衡的顾虑，主流的GPU也存在适配兼容性以及本地化部署的问题。

在此背景下，如何在保障性能的前提下降低成本、提升兼容性，成为行业焦点。云轴科技ZStack 与英特尔携手，完成ZStack AIOS 智塔产品对英特尔ARC 多用途GPU A770的适配，并通过DeepSeek 系列大语言模型（LLM）的本地化虚拟化部署测试进行性能调优，为企业级AI 应用带来更多灵活、低门槛的算力选择。

ZStack AIOS 智塔产品支持异构算力管理，规模化调度多种类型 GPU。本次合作中，测试平台搭载多张英特尔ARC 多用途GPU A770，通过ZStack Helix 8.4 作为宿主 OS，并在虚拟机中运行 Ubuntu 22.04 进行模型推理任务部署。

测试采用虚拟机GPU 直通方式，结合英特尔官方 iPEX-LLM 工具链与 vLLM 推理框架，在容器环境中成功加载并运行 DeepSeek-7B 模型，支持 FP8 低精度加载与多 GPU 并行推理，有效提升推理吞吐与显存利用率。

性能与兼容性验证结果：

模型启动稳定且能充分利用GPU 资源
支持多卡张量并行（Tensor Parallel）配置，可灵活调整算力分配
API 响应延迟与吞吐率在同级硬件中表现优异

打破算力壁垒英特尔ARC 多用途GPU A770成新选择

主流AI 模型对 GPU 资源的需求越来越高，但现有算力生态在成本、兼容性及本地化部署等方面面临诸多挑战。英特尔ARC 多用途GPU A770凭借独特硬件架构、开放的软件生态、优异的性价比和广泛的系统兼容性，为开发者和企业提供了全新的方案选择。同时，强大的社区支持能力，使更多个人用户与团队能够快速部署和体验AIGC 应用。

产品

解决方案

支持

联系