受DeepSeek开源策略影响,国内外各主流大模型迅速跟进。3月6日,通义千问QwQ-32B宣布开源,采用Apache 2.0协议允许免费商用(包括企业级部署),并以其“比肩DeepSeek性能”和“消费级显卡即可本地运行”的标签迅速火爆市场。
继2月2日,AI Infra平台ZStack智塔首发支持DeepSeek企业级私有化部署之后,3月6日当天宣布同时支持QwQ-32B,并可适配英伟达、昇腾、海光等多种主流GPU。这意味着,企业用户本地部署私有化AI,对于新模型不必手搓上线,不必无从选择;只需一键获取,一键部署,一键升级,即可在5分钟内同时拥有两个最新的顶尖大模型,还可快速完成模型之间切换——选QwQ-32B还是DeepSeek?ZStack智塔让你All in。
在短短一个多月内,“高性能与低成本”已成为企业进行本地私有化 AI 大模型部署时的关键选型要素。随着更多开源模型的迭代发布,选QwQ-32B还是DeepSeek?类似问题还会不断出现,多模型组合策略将成为企业AI应用常态,模型敏捷迭代问题也随即浮出水面:
模型版本更新频繁,传统升级流程耗时长,难以将最新技术应用到企业内部
多个业务系统依赖同一模型服务,版本升级易引发连锁反应
缺乏统一的版本管理机制,难以进行回滚和并行测试
这些问题导致企业在技术创新和业务连续性之间难以平衡。
因此,企业在规划 AI 项目时,不论是采用在市场上备受关注的一体机还是软硬分离,都需要选择具备AI Infra平台能力的产品,通过其模型管理能力推动各类模型在企业级场景中的快速落地,助力实现价值验证,同时大幅降低企业AI应用的开发部署门槛,推动企业级AI应用场景的快速落地。
AI Infra平台ZStack智塔通过创新的模型更新机制,为企业提供持续的模型迭代能力:深度集成 HuggingFace、ModelScope 等主流开源模型平台,支持一键拉取最新模型到企业私有模型仓库,并在5分钟内完成部署验证;通过 OneAPI 结合 OpenAI Compatible API 实现模型服务热切换,确保业务在升级过程中零中断,显著降低了模型迭代风险。
此外,ZStack智塔提供了便捷的企业 AI 应用开发平台,实现从模型到业务的无缝衔接。平台预置丰富的企业级应用模板,覆盖智能客服、知识问答、数据分析等常见业务场景,可视化的开发工具让业务人员也能够直接参与 AI 应用开发,不仅帮助企业快速搭建内部应用,还支持快速切换到新模型服务。