记2018华为软件精英挑战赛

第一次参加这种大数据的比赛,虽然华为办的这个比赛这是第三年了,但前两年都是传统算法。偏偏到今年变成了大数据的这种类型的比赛,对于机器学习小白的我真的是非常难受。先把总体感受写下,之后继续填坑。

题目给了给了我们一些不同的虚拟机种类,然后给了这些虚拟机的几个月的使用记录,然后让我们预测未来1-2周这些虚拟主机的使用记录情况,然后同时需要把这些虚拟机分配到一些物理主机上,一个物理主机的资源可以安排几个虚拟机。第一部分是一个时间序列预测问题,当时就想到了美赛套用的arima模型但当时是调的库,第二部分是一个传统问题:装箱问题(二维装箱问题,bin packing)

华为的这个比赛对比赛的调库比较严格,python只允许用标准库,而且只支持2.7。c++也不允许调用第三方库,而且也禁止大段照写库代码。于是,我们就用了c++(emm可能相对来说c++稍微熟悉一点,既然不能调库)

然后几个fail的点,之后继续补充:

  1. 泛化能力差。写到最后,正常遇到的情况是,我觉得有用的优化,甚至在本地已经跑了我觉得有效果的优化,一提交就凉。调参的无力感。
  2. 没有充分找到数据特点建立合适的模型。
  3. 降噪非常失败。或者说写到最后就没有降噪吧。
  4. 模型过于简单,第一部分和第二部分都是。第二部分用的first fit感觉效果可能都不如best fit.
  5. 马拉松比赛中途懈怠了。刚开始做的时候还挺靠前的,一两周没搞瞬间降了很多(也有可能是初始的数据有点问题,所以我们一开始虚高在上面了)

明天就是初赛的正式用例了,两天只能交10次,第一天还要封榜。也不想再大改了,感觉挤进前64名很难了。

点赞

发表评论

电子邮件地址不会被公开。 必填项已用*标注