想离线运行下大模型玩玩，现在还能搞到 4090 么？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 264 天前的主题，其中的信息可能已经有所发展或是发生改变。

想离线运行下大模型玩玩，有几个问题比较纠结，请教下各位大佬 1.现在还能搞到 4090 么？有啥便宜靠谱的渠道么？ 2.4090 和 4090d 差距有多大呢？ 3.入手 4090 还是等等 5090

29 条回复 • 2024-04-10 20:09:49 +08:00

dcalsky

264 天前

现实：4090 只能跑 13B ，且无法 finetune 。

LanhuaMa

264 天前

你是要运行多"大"的模型...

实测咸鱼三百块的 P4 显卡可以流畅运行 gemma 7b, 生成速度没统计，但是差不多是 GPT4 的两倍。想要跑再大一点的模型多查几张 P4 或者换 P40 都可以的吧。。

444571840

264 天前

本地能跑的大模型（ 13B 以下的），基本和弱智一下，胡编乱造。。。

TabGre

264 天前 via iPhone

要跑 SD 需要什么显卡？出图不卡顿

8E9aYW8oj31rnbOK

264 天前

我有两张 A100 。

如果楼主只是玩玩，可以去租算力，算力租赁平台很多，技术也比较成熟了

evan9527

264 天前

@TabGre #4 手持 3060 ，500x500 生图几秒一张，至少比我 A 卡的 macbook 快多了，还得是英伟达。

jmc891205

264 天前

192G 的 M2 ultra 的 Mac Studio
或者等 256G 的 M3 ultrl

ichou

264 天前

https://featurize.cn/ 玩一下的话，建议租一个

JayZXu

264 天前

个人部署的离线大模型的话，性价比最高的应该还是 M40 24G 版本的
只是运行大模型的话，显存足够大能加载模型就行，速度其实都是次要的

如果微调或者训练模型的话，一张 4090 也不太行，少说也要准备 100G 以上才能得到比较理想的效果

所以如果真的不是能有确定的项目收入，不如直接租个服务器玩玩算了，大多数情况下，直接调用各个收费模型免费的 API 额度都比自己搭的模型靠谱