北京商报讯(记者 陶凤 王天逸)4月8日,智谱正式上线并开源新一代旗舰模型GLM-5.1,在长程任务(Long Horizon Task)处理能力上实现了显著突破,壁仞科技发文称,公司壁砺166系列产品在模型发布当日完成适配,成为国内首批适配GLM-5.1的国产GPU厂商之一。
公司表示,针对GLM-5.1的744B MoE架构、200K长上下文、DSA稀疏注意力等核心特性,壁仞科技开展全栈深度优化;依托自研芯片的高算力优势与BIRENSUPA软件栈的算子级深度协同能力,基于vLLM、SGLang两大主流开源框架,精准适配40B激活参数与Interleave Thinking交叉推理模式,实现200K上下文无损推理。同时,通过MoE调度、稀疏计算、Tensor Parallel、Context Parallel、MTP等多重优化技术,实现低时延、高吞吐的高效推理。