LLM HunYuan 等 聊一聊 计算量和 参数量 MFU MoE

LLM HunYuan 等 聊一聊 计算量和 参数量 MFU MoE

一、背景最近在看腾讯最新混元大模型的Paper时,[2411.02265]Hunyuan,Large,AnOpen,SourceMoEModelwith52BillionActivatedParametersbyTencent[1],,看到......
萌子哥 11-14
168 472 529