十周年直接虚拟入侵外星飞船了。 杰夫怎么也没有想到,孟繁岐还真没在画饼。 虽然时间上稍微吹了点牛,夸张了一些。比如ChatGPT这个级别的千亿参数大模型,没有英伟达的A100会比较难去训练。 卡如果不够好不够先进,分布式所需要的卡数量就越多。卡的数量越多就越有可能出现硬件上的问题,一旦有几卡出现错误,整个流程可能都会受到影响。 按英伟达的发售时间来看,想要