TT 官网_Fieres中文网

本地运行大模型，要买什么显卡？|内存|gb|大语言模型|nvidia

大家好，我是章北海大模型训练动辄几千个 A100，几个月的训练，上亿美元的成本。像 GPT-4o 这样的模型训练成本约为 1 亿美元，Anthropic 最新严打的大模型训练成本可能高达 10 亿美元。前段时间震惊海外的 DeepSeek V3 最亮眼的是大幅压缩的预训练成本，也使用了 2000 多个 H800GPU、2 个月时间和 550 万美元。训练模型这事儿跟普通人太过遥远。。。本地部署做做推理还稍微能拼一拼众所知识，模型参数越大、精度越高，做推理时所需的显卡性能越强（显存、算力、带宽）... [2025-01-22]