国产 AI 推理服务器

国产 AI 推理 / RAG / 知识库 / 视觉识别K 系列国产信创服务器与 AI 算力平台昇腾平台主推型号

英睿特 K-I8 V1 昇腾推理服务器

Name: 英睿特 K-I8 V1 昇腾推理服务器
Brand: 英睿特
SKU: yrt-k-i8-v1

昇腾 AI 推理与知识库平台

面向政企知识库、RAG、视觉识别和国产 AI 服务化部署的昇腾推理平台，重点确认模型框架、算子适配和并发吞吐。

CPU 平台4 个鲲鹏 920 处理器

GPU 方向8 模组昇腾推理加速方向，可选 NPU 全互联

内存范围32 个 DDR4 内存插槽，最高 3200MT/s

存储策略8 * 2.5 SATA + 2 * 2.5 NVMe，或 4 * 2.5 SATA + 6 * 2.5 NVMe

昇腾推理 RAG / 知识库国产 AI 服务化

K Line昇腾平台昇腾推理与知识库平台国产 AI 推理服务器按昇腾加速卡供应、模型适配、CANN/MindIE 环境和验收样例确认

硬件结构与交付视图

把主图、后部接口和内部风道放在同一处确认，帮助采购判断上架、扩展、供电、散热和交付边界。

英睿特 K-I8 V1 昇腾推理服务器产品外观与部署形态 — 外观主图**产品外观与部署形态**
用于确认产品形态、尺寸方向和现场部署方式。
*最终以报价单、项目确认表和交付验收为准。*

英睿特 K-I8 V1 昇腾推理服务器接口与扩展确认 — 后部 I/O接口与扩展确认
用于确认接口、扩展、供电和线缆规划。
*最终接口和扩展能力需按实际配置确认。*

交付说明

图片用于说明平台结构和配置方向，不替代最终料号。实际接口、GPU 型号、盘位、电源和风道以报价单、供应情况和项目确认表为准。

是否适合这个型号

先判断工作负载和交付环境，再进入具体配置和报价。

型号角色昇腾 AI 推理与知识库平台

优先匹配

政企知识库、RAG、国产大模型推理、视觉识别和 AI 服务化部署。

切换提醒

如果重点是训练或微调，应比较 K-T8；如果要求 CUDA/NVIDIA 软件栈，应转 G/T 系列重新评估。

适合采购

适合以下场景

国产 AI 推理、知识库和 RAG 服务

模型可适配 CANN/MindIE 或已有昇腾生态方案

需要政企内网部署、权限和国产化验收

换方案提醒

这些情况建议换产品线

要求 NVIDIA CUDA 生态无改造迁移

未确认模型、算子或框架能适配昇腾

只做普通业务服务器或低并发轻量服务

报价前确认

必须先确认的条件

模型来源和框架

CANN/MindIE 版本

并发/QPS/上下文长度

向量库、知识库数据路径和验收样例

RAG / 知识库模型适配、向量库、并发吞吐

需要确认检索、重排、生成和权限审计的完整链路。

国产大模型推理CANN/MindIE、模型格式、显存/内存

先用实际模型样例验证，再进入容量规划。

视觉识别输入吞吐、批处理、延迟

适合政企视觉类应用，重点看端到端吞吐和稳定性。

配置决策顺序

先把采购边界讲清楚，再进入具体料号和报价，避免只看单个参数导致选型偏差。

先判断平台角色

昇腾 AI 推理与知识库平台 / 国产 AI 推理 / RAG / 知识库 / 视觉识别

昇腾 AI 推理与知识库平台

再确认计算瓶颈

4 个鲲鹏 920 处理器 / 8 模组昇腾推理加速方向，可选 NPU 全互联

围绕软件版本、模型规模和并发方式确认

锁定数据与扩展

32 个 DDR4 内存插槽，最高 3200MT/s / 8 * 2.5 SATA + 2 * 2.5 NVMe，或 4 * 2.5 SATA + 6 * 2.5 NVMe

围绕项目文件、缓存、结果数据和后续扩展确认

最后确认交付环境

国产 AI 推理服务器 / 按昇腾加速卡供应、模型适配、CANN/MindIE 环境和验收样例确认

围绕机房、办公室、电力、散热和售后响应确认

Optional Range可选范围用于确认报价边界，最终以项目确认表为准。

CPU

4 * 鲲鹏 920
按供货版本确认

GPU

8 模组昇腾推理方向
可选 NPU 全互联机型
整机互联带宽 392GB/s

MEMORY

32 个 DDR4 内存插槽
最高 3200MT/s
单根 16/32/64GB

STORAGE

8 * 2.5 SATA + 2 * 2.5 NVMe
4 * 2.5 SATA + 6 * 2.5 NVMe
8 * 200GE QSFP RoCE

技术规格

优先展示采购最常看的规格组，完整技术边界可展开查看。最终以报价单、供应情况和项目确认表为准。

采购提示

以上参数依据公开平台资料与英睿特产品规划整理，具体部件版本、供货状态、兼容认证和交付配置以项目确认表与正式报价单为准。

处理器与平台

CPU 选项: 4 个鲲鹏 920 处理器
平台体系: 昇腾平台
可选平台: 4 * 鲲鹏 920 / 按供货版本确认
平台定位: 4 个鲲鹏 920 处理器，面向国产大模型推理、RAG、知识库和视觉识别服务
平台主板: 4U AI 推理服务器底座，采用 8 模组高效推理方向，按 CANN/MindIE、模型框架和并发吞吐确认
芯片组/通道: 鲲鹏 920 + 昇腾 AI 推理加速平台，需确认 CANN、驱动固件、模型算子和精度边界
系统环境: openEuler / 麒麟 / 统信 / EulerOS / Linux 发行版按客户信创要求确认

内存与扩展

内存范围: 32 个 DDR4 内存插槽，最高 3200MT/s
可选内存: 32 个 DDR4 内存插槽 / 最高 3200MT/s / 单根 16/32/64GB
内存拓扑: 32 个 DDR4 内存插槽，最高 3200 MT/s，单根内存条容量支持 16/32/64GB
容量建议: 建议从 512GB 起步，RAG/知识库、向量库和多模型并发建议按 1TB+ ECC 规划
PCIe 扩展: 最多支持 3 个 PCIe 4.0 扩展插槽

GPU 与加速

GPU 方向: 8 模组昇腾推理加速方向，可选 NPU 全互联
可选 GPU: 8 模组昇腾推理方向 / 可选 NPU 全互联机型 / 整机互联带宽 392GB/s
拓扑/数量: 8 模组昇腾推理加速方向，可选 NPU 全互联机型，整机互联带宽 392GB/s
供电关注: AI 加速平台需核算整机满载功耗、冗余电源、机柜 PDU、进风温度和散热余量
适配软件: CANN / MindIE / MindSpore / PyTorch 适配 / 向量数据库

展开完整技术规格与交付边界

存储与数据

存储策略: 8 * 2.5 SATA + 2 * 2.5 NVMe，或 4 * 2.5 SATA + 6 * 2.5 NVMe
可选存储: 8 * 2.5 SATA + 2 * 2.5 NVMe / 4 * 2.5 SATA + 6 * 2.5 NVMe / 8 * 200GE QSFP RoCE
盘位/缓存: 本地存储可选 8 * 2.5 SATA + 2 * 2.5 NVMe，或 4 * 2.5 SATA + 6 * 2.5 NVMe
数据分层: 支持 RAID 0/1/10/5/50/6/60，建议系统盘、向量库盘、模型盘和日志盘分离
保护策略: 按政企数据安全、快照、备份、权限审计和国产化平台运维要求规划