随着人工智能技术爆发,推动算力成本以及软件定义硬件的技术快速迭代,用户正面临着严峻且日益突出的算力供给与需求矛盾;新的模型层出不穷,用户在各类模型的应用过程中被越来越多的瓶颈制约,许多的客户会受困与算力生态单一,成本高昂,资源不平衡的顾虑,主流的GPU也存在适配兼容性以及本地化部署的问题。
在此背景下,如何在保障性能的前提下降低成本、提升兼容性,成为行业焦点。云轴科技ZStack 与英特尔携手,完成ZStack AIOS 智塔产品对英特尔ARC 多用途GPU A770的适配,并通过DeepSeek 系列大语言模型(LLM)的本地化虚拟化部署测试进行性能调优,为企业级AI 应用带来更多灵活、低门槛的算力选择。
ZStack AIOS 智塔产品支持异构算力管理,规模化调度多种类型 GPU。本次合作中,测试平台搭载多张英特尔ARC 多用途GPU A770,通过ZStack Helix 8.4 作为宿主 OS,并在虚拟机中运行 Ubuntu 22.04 进行模型推理任务部署。
![]()
测试采用虚拟机GPU 直通方式,结合英特尔官方 iPEX-LLM 工具链与 vLLM 推理框架,在容器环境中成功加载并运行 DeepSeek-7B 模型,支持 FP8 低精度加载 与多 GPU 并行推理,有效提升推理吞吐与显存利用率。
![]()
性能与兼容性验证结果:
模型启动稳定且能充分利用GPU 资源
支持多卡张量并行(Tensor Parallel)配置,可灵活调整算力分配
API 响应延迟与吞吐率在同级硬件中表现优异
打破算力壁垒英特尔ARC 多用途GPU A770成新选择
主流AI 模型对 GPU 资源的需求越来越高,但现有算力生态在成本、兼容性及本地化部署等方面面临诸多挑战。英特尔ARC 多用途GPU A770凭借独特硬件架构、开放的软件生态、优异的性价比和广泛的系统兼容性,为开发者和企业提供了全新的方案选择。同时,强大的社区支持能力,使更多个人用户与团队能够快速部署和体验AIGC 应用。

沪公网安备 31011202014879号