Grok-1 是一个由 xAI 训练的 3140 亿参数专家混合模型 (8 个专家),给定输入上有 25% 的活跃权重。该权重为2023年10月预训练结束时的原始权重,这意味着此时没有针对任何特定对话进行微调。