马斯克宣布开源Grok-2 最强开源模型问世
马斯克宣布开源Grok-2 最强开源模型问世!马斯克终于开源了Grok-2。xAI正式宣布向所有人开放Grok-2,并预告Grok-3将在6个月后开源。Grok-2于2024年完成训练,体积超过500GB,其混合专家(MoE)架构在Grok-1的基础上进行了改进。
此次开源包括Grok-2的核心部分,技术特点如下:总参数量高达9050亿,在推理时每次激活其中的1360亿参数,使其成为目前最强大的开源模型之一;支持高达131,072 token的上下文长度,可以一次性处理非常长的文档或对话历史;采用混合专家架构,可以在不增加巨大计算成本的前提下大幅扩展模型规模;预训练数据覆盖了大量的文本和代码,截止到2024年初。
关于开源权限,当关联公司年收入低于一百万美元时,才可用于商业用途,超过此门槛的商业用途需获得xAI的单独许可。除非协议条款允许对Grok 2进行修改或微调,否则不得使用材料、衍生品或输出来训练、创建或改进任何基础、大型语言或通用人工智能模型。
现在,Grok-2已在Hugging Face上开放下载。用户可以通过SGLang部署,下载权重文件并启动服务器。下载过程中可能会遇到一些错误,需要多次重试直到成功。下载完成后,该文件夹下应包含42个文件,总大小约500GB。启动服务器需要安装最新版的SGLang推理引擎,并使用正确的对话模板发送请求。
网友XFreeze表示,xAI的发展速度极其惊人,仅用122天建成并全面投入运营的孟菲斯巨像数据中心配备了100,000块英伟达H100 GPU。短短两年内,xAI凭借Grok 4的发布,以极其精简的团队登顶全球最强人工智能之巅。黄仁勋曾称这是“超人”之举,只有马斯克能做到。有网友认为,这一切就像在实时观看一个科幻梦想成真,真正达到了创新的巅峰。预计5年内,xAI将打造出5000块H100巨无霸超算,老马自信满满地表示,xAI很快就能超越谷歌以外的所有对手。马斯克宣布开源Grok-2 最强开源模型问世