📊 任务管理器 · 性能 · GPU 0 📌 始终在最前

显存分配 · 三模型同时常驻 · 总占用 79.6 / 96.0 GB

专用 GPU 显存(64 GB)+ 共享 GPU 显存(最多 32 GB) 79.6 / 96.0 GB
qwen3.6:35b-a3b · 22.4 GB
bge-m3 · 8.2 GB
qwen3.6:8b · 17.8 GB
free · 16.4
qwen3.6:35b-a3b 主推理 22.4 GB
bge-m3:13b 嵌入向量 8.2 GB
qwen3.6:8b 摘要生成 17.8 GB
空闲显存 系统&工作区 16.4 GB
多模型常驻显存是这台机器的"杀手级用法"——智能体的不同节点用不同模型,所有模型一开始就预载到显存里,调度时零等待。
这是 24G 显存的笔记本物理上做不到的事。
进程 显存 GPU% 状态
ollama_runner.exe (qwen3.6:35b-a3b) 22.4 GB 82% RUNNING
ollama_runner.exe (bge-m3:13b) 8.2 GB 5% IDLE (loaded)
ollama_runner.exe (qwen3.6:8b) 17.8 GB 3% IDLE (loaded)
claude_code.exe 0.8 GB 1% RUNNING
dwm.exe 0.4 GB 0% RUNNING