返回K 系列国产信创服务器与 AI 算力平台
英睿特 K-I8 V1 昇腾推理服务器国产 AI 推理服务器
国产 AI 推理 / RAG / 知识库 / 视觉识别K 系列国产信创服务器与 AI 算力平台昇腾平台主推型号

英睿特 K-I8 V1 昇腾推理服务器

昇腾 AI 推理与知识库平台

面向政企知识库、RAG、视觉识别和国产 AI 服务化部署的昇腾推理平台,重点确认模型框架、算子适配和并发吞吐。

CPU 平台4 个鲲鹏 920 处理器
GPU 方向8 模组昇腾推理加速方向,可选 NPU 全互联
内存范围32 个 DDR4 内存插槽,最高 3200MT/s
存储策略8 * 2.5 SATA + 2 * 2.5 NVMe,或 4 * 2.5 SATA + 6 * 2.5 NVMe
昇腾推理 RAG / 知识库 国产 AI 服务化
K Line昇腾平台昇腾推理与知识库平台国产 AI 推理服务器按昇腾加速卡供应、模型适配、CANN/MindIE 环境和验收样例确认

硬件结构与交付视图

把主图、后部接口和内部风道放在同一处确认,帮助采购判断上架、扩展、供电、散热和交付边界。

英睿特 K-I8 V1 昇腾推理服务器 产品外观与部署形态01
外观主图产品外观与部署形态

用于确认产品形态、尺寸方向和现场部署方式。

最终以报价单、项目确认表和交付验收为准。
英睿特 K-I8 V1 昇腾推理服务器 接口与扩展确认02
后部 I/O接口与扩展确认

用于确认接口、扩展、供电和线缆规划。

最终接口和扩展能力需按实际配置确认。
交付说明

图片用于说明平台结构和配置方向,不替代最终料号。实际接口、GPU 型号、盘位、电源和风道以报价单、供应情况和项目确认表为准。

是否适合这个型号

先判断工作负载和交付环境,再进入具体配置和报价。

型号角色昇腾 AI 推理与知识库平台
优先匹配

政企知识库、RAG、国产大模型推理、视觉识别和 AI 服务化部署。

切换提醒

如果重点是训练或微调,应比较 K-T8;如果要求 CUDA/NVIDIA 软件栈,应转 G/T 系列重新评估。

适合采购

适合以下场景

国产 AI 推理、知识库和 RAG 服务

模型可适配 CANN/MindIE 或已有昇腾生态方案

需要政企内网部署、权限和国产化验收

换方案提醒

这些情况建议换产品线

要求 NVIDIA CUDA 生态无改造迁移

未确认模型、算子或框架能适配昇腾

只做普通业务服务器或低并发轻量服务

报价前确认

必须先确认的条件

模型来源和框架

CANN/MindIE 版本

并发/QPS/上下文长度

向量库、知识库数据路径和验收样例

RAG / 知识库模型适配、向量库、并发吞吐

需要确认检索、重排、生成和权限审计的完整链路。

国产大模型推理CANN/MindIE、模型格式、显存/内存

先用实际模型样例验证,再进入容量规划。

视觉识别输入吞吐、批处理、延迟

适合政企视觉类应用,重点看端到端吞吐和稳定性。

政企知识库RAG 推理视觉识别国产 AI 服务

配置决策顺序

先把采购边界讲清楚,再进入具体料号和报价,避免只看单个参数导致选型偏差。

01

先判断平台角色

昇腾 AI 推理与知识库平台 / 国产 AI 推理 / RAG / 知识库 / 视觉识别

昇腾 AI 推理与知识库平台
02

再确认计算瓶颈

4 个鲲鹏 920 处理器 / 8 模组昇腾推理加速方向,可选 NPU 全互联

围绕软件版本、模型规模和并发方式确认
03

锁定数据与扩展

32 个 DDR4 内存插槽,最高 3200MT/s / 8 * 2.5 SATA + 2 * 2.5 NVMe,或 4 * 2.5 SATA + 6 * 2.5 NVMe

围绕项目文件、缓存、结果数据和后续扩展确认
04

最后确认交付环境

国产 AI 推理服务器 / 按昇腾加速卡供应、模型适配、CANN/MindIE 环境和验收样例确认

围绕机房、办公室、电力、散热和售后响应确认
Optional Range可选范围用于确认报价边界,最终以项目确认表为准。

CPU

  • 4 * 鲲鹏 920
  • 按供货版本确认

GPU

  • 8 模组昇腾推理方向
  • 可选 NPU 全互联机型
  • 整机互联带宽 392GB/s

MEMORY

  • 32 个 DDR4 内存插槽
  • 最高 3200MT/s
  • 单根 16/32/64GB

STORAGE

  • 8 * 2.5 SATA + 2 * 2.5 NVMe
  • 4 * 2.5 SATA + 6 * 2.5 NVMe
  • 8 * 200GE QSFP RoCE

推荐配置档

先用档位快速判断预算和性能边界,再根据软件版本、数据规模、交付周期细化硬件。

01清晰预算

标准档

适合预算明确、需求边界清晰的项目,用来建立专业平台的可靠起点。

4U 昇腾推理平台,4 * 鲲鹏 920,32 个 DDR4 插槽,NVMe 向量库/缓存盘,CANN/MindIE 基础环境

K 系列国产信创服务器与 AI 算力平台
02推荐优先

主力档

适合大多数正式采购,优先平衡性能、扩展、交付周期和后续维护。

8 模组昇腾推理方向,可选 NPU 全互联,8 * 200GE RoCE,模型适配与并发验证

K 系列国产信创服务器与 AI 算力平台
03按需定制

项目档

适合有特殊软件、数据规模、机房条件或交付验证要求的项目制采购。

政企知识库、国产大模型推理、视觉识别和多部门 AI 服务平台

K 系列国产信创服务器与 AI 算力平台

技术规格

优先展示采购最常看的规格组,完整技术边界可展开查看。最终以报价单、供应情况和项目确认表为准。

采购提示

以上参数依据公开平台资料与英睿特产品规划整理,具体部件版本、供货状态、兼容认证和交付配置以项目确认表与正式报价单为准。

处理器与平台

CPU 选项
4 个鲲鹏 920 处理器
平台体系
昇腾平台
可选平台
4 * 鲲鹏 920 / 按供货版本确认
平台定位
4 个鲲鹏 920 处理器,面向国产大模型推理、RAG、知识库和视觉识别服务
平台主板
4U AI 推理服务器底座,采用 8 模组高效推理方向,按 CANN/MindIE、模型框架和并发吞吐确认
芯片组/通道
鲲鹏 920 + 昇腾 AI 推理加速平台,需确认 CANN、驱动固件、模型算子和精度边界
系统环境
openEuler / 麒麟 / 统信 / EulerOS / Linux 发行版按客户信创要求确认

内存与扩展

内存范围
32 个 DDR4 内存插槽,最高 3200MT/s
可选内存
32 个 DDR4 内存插槽 / 最高 3200MT/s / 单根 16/32/64GB
内存拓扑
32 个 DDR4 内存插槽,最高 3200 MT/s,单根内存条容量支持 16/32/64GB
容量建议
建议从 512GB 起步,RAG/知识库、向量库和多模型并发建议按 1TB+ ECC 规划
PCIe 扩展
最多支持 3 个 PCIe 4.0 扩展插槽

GPU 与加速

GPU 方向
8 模组昇腾推理加速方向,可选 NPU 全互联
可选 GPU
8 模组昇腾推理方向 / 可选 NPU 全互联机型 / 整机互联带宽 392GB/s
拓扑/数量
8 模组昇腾推理加速方向,可选 NPU 全互联机型,整机互联带宽 392GB/s
供电关注
AI 加速平台需核算整机满载功耗、冗余电源、机柜 PDU、进风温度和散热余量
适配软件
CANN / MindIE / MindSpore / PyTorch 适配 / 向量数据库
展开完整技术规格与交付边界

存储与数据

存储策略
8 * 2.5 SATA + 2 * 2.5 NVMe,或 4 * 2.5 SATA + 6 * 2.5 NVMe
可选存储
8 * 2.5 SATA + 2 * 2.5 NVMe / 4 * 2.5 SATA + 6 * 2.5 NVMe / 8 * 200GE QSFP RoCE
盘位/缓存
本地存储可选 8 * 2.5 SATA + 2 * 2.5 NVMe,或 4 * 2.5 SATA + 6 * 2.5 NVMe
数据分层
支持 RAID 0/1/10/5/50/6/60,建议系统盘、向量库盘、模型盘和日志盘分离
保护策略
按政企数据安全、快照、备份、权限审计和国产化平台运维要求规划

网络与管理

网络选项
8 * 200GE QSFP 接口直出,RoCE 协议方向,需同步确认交换机和端到端吞吐
远程管理
带外管理、国产 OS 镜像、驱动/固件版本、容器镜像和平台运维清单按项目交付
安全策略
重点确认国产操作系统、数据库、中间件、虚拟化、容器和安全软件的兼容认证
部署运维
可提供国产化兼容性确认清单、配置方案、驱动/固件版本、基础测试记录和验收建议

机箱电源散热

机箱形态
国产 AI 推理服务器
电源策略
4 个热插拔 2.6kW 电源模块,支持 2+2 冗余;供电支持 200-240V AC、240V DC
散热验证
4U AI 推理节点需验证 NPU、CPU、NVMe、网卡和满载推理温度
部署环境
建议部署在机房或设备间,国产 AI 平台和多节点项目需提前确认供电、制冷和承重
交付边界
昇腾 AI 推理与知识库平台

交付与支持

交付周期
按昇腾加速卡供应、模型适配、CANN/MindIE 环境和验收样例确认
满载验证
建议验证 CANN/MindIE、模型加载、RAG 并发、NPU 互联、RoCE 网络、日志和告警
交付资料
可提供国产化兼容性确认清单、配置方案、驱动/固件版本、基础测试记录和验收建议
项目说明
以上参数依据公开平台资料与英睿特产品规划整理,具体部件版本、供货状态、兼容认证和交付配置以项目确认表与正式报价单为准

软件与工作流适配

不只看软件名称,更要看版本、插件、数据规模和团队使用方式。

CANN按版本、数据规模和插件确认硬件瓶颈

建议结合实际项目文件、用户数量和交付环境进一步确认配置。

MindIE按版本、数据规模和插件确认硬件瓶颈

建议结合实际项目文件、用户数量和交付环境进一步确认配置。

MindSpore按版本、数据规模和插件确认硬件瓶颈

建议结合实际项目文件、用户数量和交付环境进一步确认配置。

PyTorch 适配按版本、数据规模和插件确认硬件瓶颈

建议结合实际项目文件、用户数量和交付环境进一步确认配置。

向量数据库按版本、数据规模和插件确认硬件瓶颈

建议结合实际项目文件、用户数量和交付环境进一步确认配置。

CANNMindIEMindSporePyTorch 适配向量数据库

部署边界与风险确认

高性能系统的风险通常不在单个参数,而在供电、散热、数据路径和交付环境。

业务连续性

确认虚拟化、数据库、备份恢复、管理口和业务网络隔离策略。

数据路径

确认本地盘、项目盘、共享存储、备份和数据不落地要求。

交付验证

交付前建议记录驱动版本、系统环境、满载测试和基础软件验证结果。

确认软件版本、插件和数据规模 确认机房/办公室供电、散热和噪声边界 确认本地盘、共享存储和备份策略 确认交付前测试项和售后响应方式

服务与交付验证

硬件交付不是结束,稳定运行和可维护性才是专业系统的重点。

交付前调优

按应用场景检查 BIOS、电源策略、驱动和散热曲线。

稳定性验证

针对持续负载、显卡温度、存储读写和系统日志做基础验证。

企业支持

支持售前方案、远程诊断、备件策略和项目制技术响应。