从机器学习竞赛状态报告中发现的有趣结论-机器学习实战

2023-08-09 18:12:52

 

机器学习竞赛通常能够表明哪些技术在新数据集上有效。一份非常全面的《The State of Competitive Machine Learning》报告近期刚刚发布,其中包含了一些有趣的结论,分享给大家。

1、NLP领域,如大家所料,Transformer继续在NLP中占据主导地位,所有NLP获奖方案都使用了Transformer。并Transformer开始在计算机视觉中与卷积神经网络竞争。

2、CV领域,卷积神经网络(CNN)仍然主导着计算机视觉。EfficientNet是计算机视觉最流行的预训练架构——大多数人都会对预训练模型进行微调,而不是从头开始训练。

3、tabular比赛的一大惊喜:XGBoost的统治似乎结束了。虽然梯度增强仍然赢得了大多数表格比赛,但LightGBM现在是首选方法,CatBoost位居第二。XGBoost排名第三。

4、尽管单一模式的解决方案也会胜出,但大型集成(Large ensembles)在获奖者中更常见。

5、在46个使用深度学习的获奖解决方案中,44个使用PyTorch,只有2个使用TensorFlow(可能还是受到额外5W刀奖金的影响,后面说)。

6、大约50%的获奖者是单人获奖者;50%的获奖者是首次获奖者;30%的人以前赢过不止一次。

7、几乎每个人都用python,使用其他语言的是个位数。

在46个使用深度学习的获奖解决方案中,44个使用PyTorch作为主要建模包,只有两个使用TensorFlow。更明显的是,在使用TensorFlow赢得的两项比赛中,Kaggle的Great Barrier Reef Competition提供了额外的5万美元奖金,只有使用TensorFlow的队伍才能获得奖金!使用TensorFlow赢得的另一场比赛使用了高级Keras API。TF尴尬了……

参考:

https://mlcontests.com/state-of-competitive-machine-learning-2022


以上就是关于《从机器学习竞赛状态报告中发现的有趣结论-机器学习实战》的全部内容,本文网址:https://www.7ca.cn/baike/62298.shtml,如对您有帮助可以分享给好友,谢谢。
标签:
声明

排行榜