具体过程如下:
输入样本进入门控网络:门控网络(Gate Network)会根据样本的特征,计算出每个专家的激活权重。
选取Top-K个专家:通过Softmax计算,门控网络会为每个样本选择Top-K个最相关的专家(通常是1或2个)。
专家计算并输出结果:选中的专家会对输入样本进行计算,最终将各专家输出的结果加权合并,得出最终的预测结果。
这种机制确保了只有部分专家会被激活,从而减少了计算资源的浪费。
解决多模态问题
垂直领域应用
提高模型规模与效率
自然语言处理
八、总结
参考资料:图片来源论文和网络
| 欢迎光临 链载Ai (https://www.lianzai.com/) | Powered by Discuz! X3.5 |