1.jpg
它可以训练相当于GPT-4、Gemini十几倍的下一代AI大模型,能在单一逻辑内存空间内存储24万亿参数,无需分区或者重构。用它来训练1万亿参数大模型的速度,相当于用GPU训练10亿参数。四颗并联,它能在一天之内完成700亿参数的调教,而且支持最多2048路互连,一天就可以完成Llama 700亿参数的训练。WSE-3的具体功耗、价格没公布,根据上代的情况看应该在200多万美元。
本站部分信息来源于网络,如有侵权请与我们联系。本站原创内容转载请注明出处。
Copyright @2022- All Rights Reserved 口碑家电 版权所有
邮箱:jokerdeyouxiang@sina.com
备案号:皖ICP备2023005497号