Akasha Terminal: dev🍃
一觉醒来发现 qwen3 发布了,跑了一下,mac 和 win 都试过了。亮点应该是 30B 激活参数量 3B 的模型,性能跟传统 30B 模型相当的同时,大大加快了运行速度。
就是这 5090D 怎么跟 mac 一个水平了,这么拉了?
疑似是显存瓶颈,GPU 核心使用率上不去。这1.8T/s 的带宽保真吗(

总之 30 t/s 也妥妥够用了,个人级设备不折腾不捡垃圾也能跑。这个参数量用 ktransformer 加速意义不大,但是 200B 那个估计有机会。再等等吧。
至于说云服务商提供的多卡运行几百 tps 的场景,在离线非交互(比如deepwiki)才有用,30 t/s 已经跟完整速读速度差不多了,再快就需要略读了,基本上能满足纯本地化的日常使用了。
#AI
Qwen3 写代码能力貌似还可以?我还没来得及试。
https://fixupx.com/karminski3/status/1917019006428713333 karminski-牙医 (@karminski3)
 
 
Back to Top