4月1-2日,2025中国生成式AI大会在北京举办,该会议已成为国内AI领域最具影响力的产业峰会之一。云轴科技ZStack CTO王为受邀在“大模型”峰会上发表主题为《AI 原生实践:企业实际场景的 AI 赋能与 Infra 实践探索》演讲,并参加《DeepSeek给AI Infra带来的启示与机会》圆桌讨论。
AI Infra平台具有多维支撑特性 解决企业私有化AI全栈难题
DeepSeek在激活全行业对人工智能重视的同时,也倒逼很多产品必须进行技术重构,包括传统一体机。只有深度整合人工智能基础设施(AI Infra)平台的方案,才能满足企业智能化转型的核心需求。
王为指出:“具有AI Infra平台能力的DeepSeek一体机为用户提供了入门的解决方案,通过预装模型和应用降低了部署门槛,能够快速满足基础需求。但随着需求增长,用户可能需要更复杂的算力调度和混合云部署方案,以及模型部署上线复杂、多种模型难以评估、模型版本迭代困扰、敏感数据泄露隐患、算力资源利用率低等问题”。
在今年3月,ZStack基于ZStack AIOS平台智塔发布智塔AI一体机DeepSeek版,希望解决这些用户痛点。ZStack AIOS平台智塔通过创新的资源调度机制,实现了 GPU 算力的充分利用。vGPU切分技术支持在单张显卡上同时运行多个轻量级模型,可显著提升硬件资源利用率,同时平台适配 NVIDIA、华为昇腾、海光 等主流GPU设备。
在多个实践案例中,ZStack AIOS平台智塔帮助企业将GPU利用率提升40%以上,显著降低了硬件投入成本。
同时ZStack AIOS平台深度集成HuggingFace、ModelScope等主流开源模型平台,支持一键拉取最新模型到企业私有模型仓库,并在5分钟内完成部署验证,满足模型迭代需求。(更多阅读:基于ZStack AIOS平台智塔部署DeepSeek的六大核心优势)
“应该说AI Infra平台ZStack智塔像极了‘六边形战士’,可以通过一个平台解决私有化AI全栈问题”,王为总结道。
目前行业共识是AI Infra平台赋予了IT基础设施自适应进化能力——通过模型OTA(Over-the-Air Technology)更新、算力动态调度等功能,可无缝适配大模型、多模态AI等技术迭代,避免传统IT基础设施沦为“一次性产品”。
在圆桌对话现场备受关注的话题还有DSA特定领域芯片或ASIC专用芯片是否会消亡,这折射出行业对GPGPU与ASIC两大阵营发展方向的关切。
参会专家普遍认为一定会有对Transformer架构计算特点更有针对性设计的专用芯片出现,ASIC能够有效降低推理计算成本,只有不断降低推理成本,才更能让大模型的应用实现普惠。
对此ZStack CTO王为表示,一些优化技术在GPGPU上效率不是特别高,所以AI推理往ASIC上发展的可能性非常大。国产算力在推理上替代能力很强,在训练上还需要一定时间追赶,但应该不会太久。
据了解,ZStack AIOS平台智塔提供了推理服务部署能力,可支持包括 DeepSeek 671B 满血版在内的全规格模型,并通过深度优化的分布式训练和推理架构,有效突破大模型部署的算力瓶颈,充分发挥模型性能。
据媒体报告,在今年3月,ZStack基于ZStack AIOS 平台智塔发布智塔AI一体机DeepSeek版。这样的DeepSeek x AI Infra技术方案如今已被云计算技术圈认可,并成为行业用户进行私有AI应用创新的默认选项,正被金融、教育、科研、传媒等行业用户部署在生产业务中。
“AI Infra平台+领域增强”私有化模式是部署大模型的优选方案
在论坛现场,多位专家表示DeepSeek一体机有助于企业在保护数据安全的情况下快速用上DeepSeek,私有化是企业部署大模型的优选方案,第三方研究报告也验证了这个趋势。
深交所 2025 年 4 月启动的证券行业大模型基础设施调研显示,78% 的受访券商将私有化列为部署首选。
赛迪顾问在《2025中国AI Infra平台市场发展研究报告》中指出,企业级AI应用私有化部署需求强劲,预计2025年中国AI Infra平台市场规模将达到36.1亿元,同比2024年增长超过86%,2025年将是中国AI Infra平台应用元年。
王为表示,私有化部署让用户拥有了“自主权”,“用户不用去研究软硬件,比如技术环境、模型版本升级、CPU、内存等,能以最快速度体验。但是最重要的还是AI Infra平台具备整体构建能力,包括对运营与应用层、模型层、智算底座3大层面的管理”。
据了解,ZStack智塔 AIOS平台以“AI”为核心,通过算力层、模型层、运营层三大层面助力 AI 创新落地,支持从云平台无缝升级,以及适配全部的云基础设施模块服务、产品文档和售后服务。
“具备AI Infra平台能力的DeepSeek一体机减少了用户的学习成本、软硬件选型和适配试错成本,降低了使用DeepSeek大模型的难度,同时满足数据隐私和本地化LLM的便捷需求”,王为总结道。
今年的2月2日,ZStack AIOS平台智塔首发支持 DeepSeek V3/R1/ Janus Pro三种模型后,3 月 3 日ZStack基于ZStack AIOS 平台智塔发布智塔AI一体机DeepSeek版,可基于海光、昇腾、英伟达、英特尔等多种国内外CPU/GPU 私有化部署,满足企业进行DeepSeek本地私有化部署需求。