您的位置：首页 >运营 >

训练2021年每个SOTA模型，他的「核武」策略意外收获Kaggle银牌

时间：2022-02-14 13:45:35 | 来源：机器之心Pro

可谓是「无心插柳柳成荫」。

在 Kaggle 的世界，软件开发者、金融模式和行为研究公司 Deep trading 的创始人 Yam Peleg 称得上一位「大神」。目前，他在 Notebooks Grandmaster 中排名第 11，在 Discussion Grandmaster 中排名第 5。

最近，他干的一件事在 reddit 上引发了网友热议：他训练了 2021 年的每一个 SOTA 模型，并在最近的一项 Kaggle 图像分类比赛中意外斩获了一枚银牌。这项 Kaggle 比赛名为「Pawpularity Contest」，这是一个典型的多模态回归问题，根据宠物图片来预测它们的可爱程度。

图源：https://www.kaggle.com/c/petfinder-pawpularity-score

他的思路是这样的：训练每个 SOTA 模型，使用 100 亿参数的集合的集合（ensemble of ensembles）来「核武攻击」（Nuke）Kaggle 比赛的排行榜。

对于这一策略（trick）的命名 ——「Nuke option」，网友表示非常喜欢，并将在其他比赛中用这一命名。

另一位网友称赞道，「在 Kaggle 环境中完成所有事情真了不起。」

方案解读

根据 Yam Peleg 的 Notebook 介绍，他训练的模型包括如下：

EfficientNet

NFNet

ViT

Swin Transformer

Deep Orthogonal Fusion of Local and Global Features（DOLG）

Hybrid Swin Transformer

External Attention Transformer（EAT）

他将自己的方案称为「Nuclear Protocols for Image Classification」，并表示只有用尽了其他方案才考虑使用。pipeline 如下图所示：提出的方法是 7 个堆叠 pipeline（140 + 模型）的集合，并且每个 pipeline 都有一个在提取图像嵌入上训练的第二阶段（2nd）模型。

实现步骤

训练这些 SOTA 模型之前，Yam Peleg 首先导入库：

接着安装其他配置，完成数据填充（seeding）：

配置部分截图

配置部分截图

配置部分截图

然后是 TPU 配置、加载元数据、CV 的分层 K 折回归（Stratified KFold for Regression）、增强（Augmentations）等步骤。数据 pipeline 如下所示：

读取原始文件，然后解码到 tf.Tensor

按需求重新调整图像大小

将数据类型变为 float32

缓存数据以提升速度

使用增强来降低过拟合，并使模型更稳健

将数据分割为 batch

最后依次训练模型，并将 Notebook 提交至了 Pawpularity Contest 中，获得了一枚银牌。

完整排行榜：https://www.kaggle.com/c/petfinder-pawpularity-score/leaderboard

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如有侵权行为，请第一时间联系我们修改或删除，多谢。

相关推荐

猜你喜欢

图文推荐

凭借其强大的商业模式这支医疗保健股票将迎来光明的未来

凭借其强大的商业模式这支医疗保健股票将迎来光明的未来

富国银行因拒绝修改抵押贷款而分叉超过1200万美元

富国银行因拒绝修改抵押贷款而分叉超过1200万美元

这家冬衣制造商在公布财报后股价下跌

这家冬衣制造商在公布财报后股价下跌

迪士尼井喷报告的3大要点

迪士尼井喷报告的3大要点

投资加密货币共同基金

投资加密货币共同基金

亚马逊股票飙升至3000美元以上

亚马逊股票飙升至3000美元以上

奥斯卡提名显示这些天AMC股票出了什么问题

奥斯卡提名显示这些天AMC股票出了什么问题

今天阿里巴巴股票大涨

今天阿里巴巴股票大涨

最新文章

精彩内容

交易价格接近52周低点的2只高收益股

2022-02-11
这两只快速增长的科技股值得在您的下一个购买清单上占有一席之地

2022-02-11
这家在线教育公司刚刚超出了一些低预期

2022-02-11
2个长期购买的顶级股息王

2022-02-11
可以在您的投资组合中复利多年的可靠股票不需要花费很多钱

2022-02-10
今年你是否面临重大投资错误的风险

2022-02-10
这两只股票可能是您投资组合的堡垒

2022-02-10
在其他人之前购买这只被低估的股票

2022-02-10

随机推荐