# DeepSeek 一体机

### 截至 2025 年 2 月

* 尽管一体机普遍宣传支持“满血版” DeepSeek，但实际效果受算力卡性能限制，V3/R1 模型推荐 FP8 和 BF16 推理精度。
* 第三方运营方为降低成本普遍采用：BF16 权重转换（占比约 65%）和 INT8 量化方案（占比约 30%），导致用户实测效果比 DeepSeek 官方原版低 15-25%。
* **选购建议：** 要求提供官方 FP8 兼容性认证，实测复杂场景下的响应速度与准确率

### 三种精度方案对比

1. **最佳方案:** 原生支持 FP8 精度的 GPU，实现 100% 满血推理效果
2. **次优方案:** BF16 精度需自行转换模型权重，精度接近无损但系统开销增加，推理效率降低约 20-30%
3. **较差方案 (残血版):** 量化为 INT8/INT4 模型，推理效率提升 3-5 倍，模型精度损失达 40-60%

### 各厂商 DeepSeek 一体机情况（截至2025年2月）

| 厂商    | 型号/版本                                                | 备注                                     |
| ----- | ---------------------------------------------------- | -------------------------------------- |
| 新华三   | 旗舰版 (671B 满血) 、标准版 (32B、70B) 、经济版 (32B 及以下)          | 可选全套 AI 工具链及灵犀使能平台、内置多种智慧应用            |
| 联想    | 预装 DeepSeek 不同尺寸模型的一体机                               | 面向智能体开发和公文写作                           |
| 浪潮信息  | 基础版、标准版、高级版、冰魂版、集群版多种规格                              | 适配不同尺寸 DeepSeek 模型, 提供全套 AI 工具链、数据安全保障 |
| 中科曙光  | 多硬件规格，支持从 10 亿级参数模型推理到 1000 亿级参数模型训练                 | 内置 AI 工具链和模型管理平台 (并支持对外贴牌 OEM)         |
| 超聚变   | 旗舰版 (671B 满血) 、标准版 (32B、70B) 、轻量版 (14B 以下)           | 可选全套 AI 工具链                            |
| 华为    | FusionCube A3000 训推超融合满血 Ultra 版、蒸馏 Pro 版、蒸馏 Lite 版。 | 并支持生态伙伴推出各种异构版 DeepSeek 一体机            |
| 宁畅    | 旗舰版 (671B) 、专业版 (70B) 、标准版 (14B/32B) 、轻量版 (14B 及以下)  | 集成常用数据集及 AI 工具链                        |
| 趋云    | 高级版 (DS671B、Llama405B) 、企业版 (70B) 、基础版 (32B 及以下)     | 集成算法、调度、运维等组件                          |
| 中兴通讯  | AICube 训推一体机, 支持 DeepSeek R1 全系列蒸馏模型                 | 提供大型开发工具链                              |
| 京东云   | vGPU 智算一体机，包括满血版、极致性价比版、轻量版                          | 内置智能体 + 知识库双引擎、方案模板和插件                 |
| 大华    | 支持多规格，从 7B 到满血版 (满血需 4 台组集群)                         |                                        |
| 神州数码  | 推出多种规格一体机，适配满血版及蒸馏版推理                                | 并联合焱融存储推出“训推一体”方案                      |
| 百度智能云 | 百舸一体机，支持昆仑芯 P800 单机 8 卡满血版 DeepSeek; 千帆一体机，四种规格      | 并提供全栈工具链                               |
| 浪潮云   | 预置满血版 DeepSeek V3 和 R1 的海若一体机，包括启航版、进阶版、旗舰版          | 并提供全套工具链                               |
| 威努特   | 满血版 (4 台集群) 、蒸馏版 (单台多种规格)，鲲鹏、海光、英特尔全覆盖               |                                        |
| 天融信   | DeepSeek 安全智算一体机                                     |                                        |
| 中国移动  | 移动云智算一体机 DeepSeek 版，基于移动云边缘智能小站打造                    | 全栈国产化，一云多芯，安全可信，预置 DeepSeek 模型镜像、工具链   |
| 中国电信  | 天翼云息壤智算一体机 DeepSeek 版, 全栈国产化（昇腾+鲲鹏）                  | 适配 DeepSeek 系列模型, 提供工具链                |
| 中国联通  | 联通云 DeepSeek 一体机，适配国产算力芯片，预置包含满血版 DeepSeek 在内的多尺寸模型  | 内置安全体系                                 |
| 无问芯穹  | 满血 DeepSeek-R1 多并发一体机                                | 支持联网搜索, 支持国产和定制化硬件                     |

### 基础模型精度：FP8

| 配置   | 平台                      | 加速卡/NPU                  |
| ---- | ----------------------- | ------------------------ |
| 配置 1 | 昇腾 910B 800I A2 整机 \* 2 | 64G 显存 NPU 模组            |
| 配置 2 | H20 整机 \* 1             | NVIDIA 141GB H20-8GPU 模组 |
| 配置 3 | 海光 K100-A1 整机 \* 2      | 海光 DCU K100-A1 (64GB)    |

### 基础模型精度：FP16

| 配置   | 平台                      | 加速卡/NPU                   |
| ---- | ----------------------- | ------------------------- |
| 配置 1 | 昇腾 910B 800I A2 整机 \* 4 | 64G 显存 NPU 模组             |
| 配置 2 | H20 整机 \* 2             | NVIDIA 141GB H20-8GPU 模组  |
| 配置 3 | AMD-MI300X 整机 \* 1      | AMD MI300X GPU 模组 (192GB) |

### DeepSeek 32B 与 70B - 性能看板

**1 个并发按照 10 个用户计算 (假设访问的时候只有十分之一的时间在使用模型生成)**

#### 32B

| 显卡                 | 模型                           | 并发数 | 常规访问用户数 |
| ------------------ | ---------------------------- | --- | ------- |
| 8 \* 4090 (24G 显存) | DeepSeek R1 32B-4K, 支持 24 并发 | 24  | 240     |
| 8 \* 4090 (24G 显存) | DeepSeek R1 32B-8K, 支持 12 并发 | 12  | 120     |
| 8 \* 5090 (32G 显存) | DeepSeek R1 32B-4K, 支持 32 并发 | 32  | 320     |
| 8 \* 5090 (32G 显存) | DeepSeek R1 32B-8K, 支持 16 并发 | 16  | 160     |
| 8 \* L40S (48G 显存) | DeepSeek R1 32B-4K, 支持 48 并发 | 48  | 480     |
| 8 \* L40S (48G 显存) | DeepSeek R1 32B-8K, 支持 24 并发 | 24  | 240     |

#### 70B

| 显卡                 | 模型                           | 并发数 | 常规访问用户数 |
| ------------------ | ---------------------------- | --- | ------- |
| 8 \* 4090 (24G 显存) | DeepSeek R1 70B-4K, 支持 10 并发 | 10  | 100     |
| 8 \* 4090 (24G 显存) | DeepSeek R1 70B-8K, 支持 5 并发  | 5   | 50      |
| 8 \* 5090 (32G 显存) | DeepSeek R1 70B-4K, 支持 12 并发 | 12  | 120     |
| 8 \* 5090 (32G 显存) | DeepSeek R1 70B-8K, 支持 6 并发  | 6   | 60      |
| 8 \* L40S (48G 显存) | DeepSeek R1 70B-4K, 支持 20 并发 | 20  | 200     |
| 8 \* L40S (48G 显存) | DeepSeek R1 70B-8K, 支持 10 并发 | 10  | 100     |

### 三个推荐配置

#### DeepSeek 基础版 7B (基础模型精度：FP16)

| 类别      | 规格描述                                                                                                                               | 部件数 |
| ------- | ---------------------------------------------------------------------------------------------------------------------------------- | --- |
| **平台**  | <p>1、4U4 卡机架式服务器<br>2、支持 2 颗 Intel 第 4 代 CPU<br>3、16 根 DDR5 内存，最高 4800MHz，最大 4TB<br>4、8 块 3.5/2.5，不支持 NVME, 支持 2 块 NVME 协议 M.2</p> | x1  |
| **CPU** | INTEL 5418Y Sapphire Rapids/24C/48T/2.0GHz/45MB/185W/4400MHz                                                                       | x2  |
| **内存**  | 32GB/RECC/DDR5/4800MHz                                                                                                             | x4  |
| **系统盘** | 960G/2.5 寸/SATA/1DWPD                                                                                                              | x2  |
| **数据盘** | 1.92T/2.5 寸/U.2 NVME/1DWPD                                                                                                         | x1  |
| **GPU** | RTX4090 24GB/GDDR6X/PCIE/450W/双宽/16PIN /主动                                                                                         | x2  |

#### DeepSeek 标准版 32B (基础模型精度：FP16)

| 类别      | 规格描述                                                                                                                               | 部件数 |
| ------- | ---------------------------------------------------------------------------------------------------------------------------------- | --- |
| **平台**  | <p>1、4U4 卡机架式服务器<br>2、支持 2 颗 Intel 第 4 代 CPU<br>3、16 根 DDR5 内存，最高 4800MHz，最大 4TB<br>4、8 块 3.5/2.5，不支持 NVME, 支持 2 块 NVME 协议 M.2</p> | x1  |
| **CPU** | INTEL 5418Y Sapphire Rapids/24C/48T/2.0GHz/45MB/185W/4400MHz                                                                       | x2  |
| **内存**  | 32GB/RECC/DDR5/4800MHz                                                                                                             | x8  |
| **系统盘** | 960G/2.5 寸/SATA/1DWPD                                                                                                              | x2  |
| **数据盘** | 3.84T/2.5 寸/U.2 NVME/1DWPD                                                                                                         | x1  |
| **GPU** | RTX4090 24GB/GDDR6X/PCIE/450W/双宽/16PIN /主动                                                                                         | x4  |

#### DeepSeek 旗舰版 671B (基础模型精度：FP16)

| 类别      | 规格描述                                                                                                                                                                                                | 部件数 |
| ------- | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | --- |
| **平台**  | <p>NF5688M7<br>1. LSI 9560-8i(4G)Raid 卡不带电容 \*1<br>2. Mellanox CX7400G 单光口 HCA 卡(不带模块) \*8<br>3. 自研 X710 10G 双光口网卡(带模块) \*1<br>4. 3200W 铂金电源 \*2<br>5. 2700w 铂金电源 \*6 / 导轨 / 国标 16A 电源线/3 年 NBD</p> | x1  |
| **CPU** | Intel 8480+ (56C, 2.0Ghz)\*2                                                                                                                                                                        | x2  |
| **内存**  | 64G 4800MHz DDR5                                                                                                                                                                                    | x24 |
| **系统盘** | 960GB SATA SSD                                                                                                                                                                                      | x2  |
| **数据盘** | 3.84T/2.5 寸/U.2 NVME/1DWPD                                                                                                                                                                          | x4  |
| **GPU** | GPU Nvidia HGX-H20-8GPU                                                                                                                                                                             | x1  |
|         | 整机台数                                                                                                                                                                                                | x2  |

| 类别                            | 适用场景                                             | 性能                        | 报价     |
| ----------------------------- | ------------------------------------------------ | ------------------------- | ------ |
| **DeepSeek 基础版 (7B)**         | 文本摘要、多轮对话系统 (智能客服) 、高精度轻量级任务                     | 并发约 15-30；吞吐约 10-20 请求/秒  | 8.8 万  |
| **DeepSeek 标准版 (32B)**        | 科研与学术的研究支持，专业领域问答和复杂逻辑推理，软件工程与高质量代码生成，企业战略分析与决策等 | 并发约 15-30；吞吐约 10-15 请求/秒  | 16.8 万 |
| **DeepSeek 旗舰版 (671B) (满血版)** | 国家级大型 AI 项目研究、气候建模等；院校算力中心建设                     | 并发约 90-190；吞吐约 30-60 请求/秒 | 199 万  |


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://blog.rui-nnovation.cool/deepseek-yi-ti-ji.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.