国产 AI 推理服务器英睿特 K-I8 V1 昇腾推理服务器
昇腾 AI 推理与知识库平台面向政企知识库、RAG、视觉识别和国产 AI 服务化部署的昇腾推理平台,重点确认模型框架、算子适配和并发吞吐。
硬件结构与交付视图
把主图、后部接口和内部风道放在同一处确认,帮助采购判断上架、扩展、供电、散热和交付边界。
01用于确认产品形态、尺寸方向和现场部署方式。
最终以报价单、项目确认表和交付验收为准。
02用于确认接口、扩展、供电和线缆规划。
最终接口和扩展能力需按实际配置确认。图片用于说明平台结构和配置方向,不替代最终料号。实际接口、GPU 型号、盘位、电源和风道以报价单、供应情况和项目确认表为准。
是否适合这个型号
先判断工作负载和交付环境,再进入具体配置和报价。
政企知识库、RAG、国产大模型推理、视觉识别和 AI 服务化部署。
如果重点是训练或微调,应比较 K-T8;如果要求 CUDA/NVIDIA 软件栈,应转 G/T 系列重新评估。
适合以下场景
国产 AI 推理、知识库和 RAG 服务
模型可适配 CANN/MindIE 或已有昇腾生态方案
需要政企内网部署、权限和国产化验收
这些情况建议换产品线
要求 NVIDIA CUDA 生态无改造迁移
未确认模型、算子或框架能适配昇腾
只做普通业务服务器或低并发轻量服务
必须先确认的条件
模型来源和框架
CANN/MindIE 版本
并发/QPS/上下文长度
向量库、知识库数据路径和验收样例
需要确认检索、重排、生成和权限审计的完整链路。
先用实际模型样例验证,再进入容量规划。
适合政企视觉类应用,重点看端到端吞吐和稳定性。
配置决策顺序
先把采购边界讲清楚,再进入具体料号和报价,避免只看单个参数导致选型偏差。
先判断平台角色
昇腾 AI 推理与知识库平台 / 国产 AI 推理 / RAG / 知识库 / 视觉识别
昇腾 AI 推理与知识库平台再确认计算瓶颈
4 个鲲鹏 920 处理器 / 8 模组昇腾推理加速方向,可选 NPU 全互联
围绕软件版本、模型规模和并发方式确认锁定数据与扩展
32 个 DDR4 内存插槽,最高 3200MT/s / 8 * 2.5 SATA + 2 * 2.5 NVMe,或 4 * 2.5 SATA + 6 * 2.5 NVMe
围绕项目文件、缓存、结果数据和后续扩展确认最后确认交付环境
国产 AI 推理服务器 / 按昇腾加速卡供应、模型适配、CANN/MindIE 环境和验收样例确认
围绕机房、办公室、电力、散热和售后响应确认CPU
- 4 * 鲲鹏 920
- 按供货版本确认
GPU
- 8 模组昇腾推理方向
- 可选 NPU 全互联机型
- 整机互联带宽 392GB/s
MEMORY
- 32 个 DDR4 内存插槽
- 最高 3200MT/s
- 单根 16/32/64GB
STORAGE
- 8 * 2.5 SATA + 2 * 2.5 NVMe
- 4 * 2.5 SATA + 6 * 2.5 NVMe
- 8 * 200GE QSFP RoCE
推荐配置档
先用档位快速判断预算和性能边界,再根据软件版本、数据规模、交付周期细化硬件。
标准档
适合预算明确、需求边界清晰的项目,用来建立专业平台的可靠起点。
4U 昇腾推理平台,4 * 鲲鹏 920,32 个 DDR4 插槽,NVMe 向量库/缓存盘,CANN/MindIE 基础环境
K 系列国产信创服务器与 AI 算力平台主力档
适合大多数正式采购,优先平衡性能、扩展、交付周期和后续维护。
8 模组昇腾推理方向,可选 NPU 全互联,8 * 200GE RoCE,模型适配与并发验证
K 系列国产信创服务器与 AI 算力平台项目档
适合有特殊软件、数据规模、机房条件或交付验证要求的项目制采购。
政企知识库、国产大模型推理、视觉识别和多部门 AI 服务平台
K 系列国产信创服务器与 AI 算力平台技术规格
优先展示采购最常看的规格组,完整技术边界可展开查看。最终以报价单、供应情况和项目确认表为准。
以上参数依据公开平台资料与英睿特产品规划整理,具体部件版本、供货状态、兼容认证和交付配置以项目确认表与正式报价单为准。
处理器与平台
- CPU 选项
- 4 个鲲鹏 920 处理器
- 平台体系
- 昇腾平台
- 可选平台
- 4 * 鲲鹏 920 / 按供货版本确认
- 平台定位
- 4 个鲲鹏 920 处理器,面向国产大模型推理、RAG、知识库和视觉识别服务
- 平台主板
- 4U AI 推理服务器底座,采用 8 模组高效推理方向,按 CANN/MindIE、模型框架和并发吞吐确认
- 芯片组/通道
- 鲲鹏 920 + 昇腾 AI 推理加速平台,需确认 CANN、驱动固件、模型算子和精度边界
- 系统环境
- openEuler / 麒麟 / 统信 / EulerOS / Linux 发行版按客户信创要求确认
内存与扩展
- 内存范围
- 32 个 DDR4 内存插槽,最高 3200MT/s
- 可选内存
- 32 个 DDR4 内存插槽 / 最高 3200MT/s / 单根 16/32/64GB
- 内存拓扑
- 32 个 DDR4 内存插槽,最高 3200 MT/s,单根内存条容量支持 16/32/64GB
- 容量建议
- 建议从 512GB 起步,RAG/知识库、向量库和多模型并发建议按 1TB+ ECC 规划
- PCIe 扩展
- 最多支持 3 个 PCIe 4.0 扩展插槽
GPU 与加速
- GPU 方向
- 8 模组昇腾推理加速方向,可选 NPU 全互联
- 可选 GPU
- 8 模组昇腾推理方向 / 可选 NPU 全互联机型 / 整机互联带宽 392GB/s
- 拓扑/数量
- 8 模组昇腾推理加速方向,可选 NPU 全互联机型,整机互联带宽 392GB/s
- 供电关注
- AI 加速平台需核算整机满载功耗、冗余电源、机柜 PDU、进风温度和散热余量
- 适配软件
- CANN / MindIE / MindSpore / PyTorch 适配 / 向量数据库
展开完整技术规格与交付边界
存储与数据
- 存储策略
- 8 * 2.5 SATA + 2 * 2.5 NVMe,或 4 * 2.5 SATA + 6 * 2.5 NVMe
- 可选存储
- 8 * 2.5 SATA + 2 * 2.5 NVMe / 4 * 2.5 SATA + 6 * 2.5 NVMe / 8 * 200GE QSFP RoCE
- 盘位/缓存
- 本地存储可选 8 * 2.5 SATA + 2 * 2.5 NVMe,或 4 * 2.5 SATA + 6 * 2.5 NVMe
- 数据分层
- 支持 RAID 0/1/10/5/50/6/60,建议系统盘、向量库盘、模型盘和日志盘分离
- 保护策略
- 按政企数据安全、快照、备份、权限审计和国产化平台运维要求规划
网络与管理
- 网络选项
- 8 * 200GE QSFP 接口直出,RoCE 协议方向,需同步确认交换机和端到端吞吐
- 远程管理
- 带外管理、国产 OS 镜像、驱动/固件版本、容器镜像和平台运维清单按项目交付
- 安全策略
- 重点确认国产操作系统、数据库、中间件、虚拟化、容器和安全软件的兼容认证
- 部署运维
- 可提供国产化兼容性确认清单、配置方案、驱动/固件版本、基础测试记录和验收建议
机箱电源散热
- 机箱形态
- 国产 AI 推理服务器
- 电源策略
- 4 个热插拔 2.6kW 电源模块,支持 2+2 冗余;供电支持 200-240V AC、240V DC
- 散热验证
- 4U AI 推理节点需验证 NPU、CPU、NVMe、网卡和满载推理温度
- 部署环境
- 建议部署在机房或设备间,国产 AI 平台和多节点项目需提前确认供电、制冷和承重
- 交付边界
- 昇腾 AI 推理与知识库平台
交付与支持
- 交付周期
- 按昇腾加速卡供应、模型适配、CANN/MindIE 环境和验收样例确认
- 满载验证
- 建议验证 CANN/MindIE、模型加载、RAG 并发、NPU 互联、RoCE 网络、日志和告警
- 交付资料
- 可提供国产化兼容性确认清单、配置方案、驱动/固件版本、基础测试记录和验收建议
- 项目说明
- 以上参数依据公开平台资料与英睿特产品规划整理,具体部件版本、供货状态、兼容认证和交付配置以项目确认表与正式报价单为准
软件与工作流适配
不只看软件名称,更要看版本、插件、数据规模和团队使用方式。
建议结合实际项目文件、用户数量和交付环境进一步确认配置。
建议结合实际项目文件、用户数量和交付环境进一步确认配置。
建议结合实际项目文件、用户数量和交付环境进一步确认配置。
建议结合实际项目文件、用户数量和交付环境进一步确认配置。
建议结合实际项目文件、用户数量和交付环境进一步确认配置。
部署边界与风险确认
高性能系统的风险通常不在单个参数,而在供电、散热、数据路径和交付环境。
确认虚拟化、数据库、备份恢复、管理口和业务网络隔离策略。
确认本地盘、项目盘、共享存储、备份和数据不落地要求。
交付前建议记录驱动版本、系统环境、满载测试和基础软件验证结果。
关联解决方案
同一台设备在不同工作流里承担的角色不同,建议从方案页继续确认软件、数据和交付路径。
AI / Deep Learning为算法团队、科研实验室和企业 AI 平台规划从单机开发到多 GPU 训练的硬件路径。
Data / Remote Platform为 AI 数据集、影视素材库、工程归档和远程设计团队规划容量、缓存、备份、权限和集中运维。
HPC / Scientific Simulation面向高校实验室、科研机构和工程仿真团队,规划有限元、多物理场、流体和科学计算节点。
延伸资料与采购依据
产品页用于锁定平台方向,方案、知识库、下载资料和案例负责补齐采购沟通里的证据链。
服务与交付验证
硬件交付不是结束,稳定运行和可维护性才是专业系统的重点。
交付前调优
按应用场景检查 BIOS、电源策略、驱动和散热曲线。
稳定性验证
针对持续负载、显卡温度、存储读写和系统日志做基础验证。
企业支持
支持售前方案、远程诊断、备件策略和项目制技术响应。

Z5 V8 塔式工作站Z 系列塔式工作站与计算平台
Z7 V8 高端专业工作站Z 系列塔式工作站与计算平台