如何
提升深度学习
性能?数据、算法、模型一个都不能少
你是如何
提升深度学习模型的效果? 这是我经常被问到的一个问题。 有时候也会换一种问法: 我该如何提高模型的准确率呢? ……或者反过来问: 如果我的网络模型效果不好,我该怎么办? 通常我的回答是:“具体原因我不清楚,但我有一些想法可以试试。”然后我会列举一些我认为能够
提升性能的方法。 为了避免重复罗列这些内容,我打算在本文中把它们都写出来。 这些想法不仅可以用于深度学习,事实上可以用在任何机器学习的算法上。
提升算法
性能的想法
我把这个列表划分为四块:
从数据上
提升性能
从算法上
提升性能
从算法调优上
提升性能
从模型融合上
提升性能
性能提升的力度按上表的顺序从上到下依次递减。举个例子,新的建模方法或者更多的数据带来的效果
提升往往好于调出最优的参数。但这并不是绝对的,只是大多数情况下如此。
我在文章中添加了不少经典神经网络问题。 其中有一些想法只是针对人工神经网络,但大多数想法都是通用性的。你可以将它们与其它技术结合起来使用。
1.从数据上
提升性能
调整训练数据或是问题的抽象
定义方法可能会带来巨大的效果改善。甚至是最显著的改善。 下面是概览:
收集更多的数据
产生更多的数据
对数据做缩放
对数据做变换
特征选择
重新
定义问题