链载Ai

标题: 非常全面!如何选择合适的模型? [打印本页]

作者: 链载Ai    时间: 昨天 22:40
标题: 非常全面!如何选择合适的模型?

机器学习模型的种类繁多,应用广泛,如下列举一些常用模型:

1、线性模型

2、基于树的模型

3、神经网络模型

4、支持向量机

5、近邻模型

6、概率图模型

7、集成学习模型

8、聚类模型

9、降维模型

10、其他模型

在众多机器学习模型中,我们如何在各种实际情况下做出恰当的选择呢?本文我从如下几个方面系统地分析下~ 有帮助的话点个赞哦。

1. 场景的角度

a. 图像识别

b. 自然语言处理

c. 推荐系统


d. 表格数据的任务

适用模型:自然语言及图像识别上面深度学习无疑是王者,但在表格类异构数据上,xgboost等集成学习树模型才是实打实的神器。大量实验表明基于树的模型在中型表格数据集上仍然是 SOTA。

对于这一结论,下文给出了确凿的证据,在表格数据上,使用基于树的方法比深度学习(甚至是现代架构)更容易实现良好的预测,研究者并探明了其中的原因。

论文地址:https://hal.archives-ouvertes.fr/hal-03723551/document


2. 可解释性的角度

3. 预测标签

4. 数据规模与特征情况

5. 计算资源及时间

6. 模型效度

很多时候模型效度需要实际验证的时候才知道优劣,通常情况下那个模型效度好,才是最终决定我们选择那种模型,或者考虑所有模型一起上(模型融合)。

模型融合:是一种结合多个模型的预测结果以生成更强大、更准确的预测结果的策略。它通过将多个弱模型(基模型)的预测结果整合,以降低误差并提高模型的泛化能力。常见的模型融合方法,如Bagging、Stacking与Boosting。

常用的效度评估指标如下:







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5