字节跳动搜索部门算法实习生面试

投了头条的 AI Lab 计算机视觉暑期实习,但是二面安排在 4 个小时的组会之后,智商下线直接 GG。然后追随学姐,投了搜索部门,面了五面……最后到了学姐在的抖音搜索组。一面简单做了自我介绍,然后就让我手撕代码,因为我写的比较快,面试官说:“你已经通过了,但是时间不够,继续写几个吧”快速幂一个 01 背包问题问了召回率准确率啥的环形字符串匹配给一个数组,找一个数字,使得这个数字到所有数字的距离之

- 阅读全文 -

[SkipInit] Batch Normalization Biases Deep Residual Networks Towards Shallow Paths

文章地址本文介绍了 BN 在很深的 Resnet 中起到的作用:通过正则化使得网络最大训练深度增加。同时提出了一个替代 BN 的方法。BN 在 Deep Resnet 中作用一个朴素的 CNN 如果太多层,就很难训练的动。Resnet 通过 shortcut 使得梯度更轻松的传播,在这里 BN 发挥了很大的作用:BN 限制了每次 Conv 后 feature map 的大小。有了 BN 和 sho

- 阅读全文 -

[L3Fnet] Harnessing Multi-View Perspective of Light Fields for Low-Light Imaging

文章地址本文贡献:发布低光照光场图片数据集:Low-Light Light Field (L3F)。提出了一种新的网络 L3Fnet 解决光场图片的低光恢复任务。Low-Light Light Field Dataset光场相机没有遥控快门,所以就很原始的固定机位手动按快门拍摄,像素会不可避免的对不齐。数据集采集方法是:在傍晚同一场景下,使用正常曝光,$1/20$ 的正常曝光,$1/50$ 的正常

- 阅读全文 -

[Distillation] Relational Knowledge Distillation

文章地址在以往的知识蒸馏中,我们要求 teacher 和 student 的 feature 或者 logits 直接数值上的靠近。但是由于 teacher 和 student 网络的差异,直接使用数值上的靠近可能对 student 比较困难。Method本文提出的方法是,蒸馏 teacher 和 student 之间 feature 的分布,而忽略数值上的一一对应,从而具有更好的灵活性。RKD

- 阅读全文 -

[Sublinear Memory][LocalConv] MegEngine 好处都有啥?谁说对了就给他

旷视最近开源了深度学习框架 MegEngine。众所周知,MegDL 一直是贵司的核心技术(大坑)。快速高效,安全可控,灵活定制一直是 MegDL 的核心。老矿工肯定熟悉下面的画面,这是 MegDL 的官方文档主页:可以从上面的截图就能非常明显的看出,要简单概括 MegDL,那就是“糙、快、猛”……文档不全,天坑很多,为了业务 xjb 改的地方非常非常多……所以开源其实是一件好事,至少能整理一下代

- 阅读全文 -