deep learning compiler调研报告

在不同DL硬件上部署各种深度学习模型，促进了社区深度学习编译器的研发。从行业和学术界已经提出了几个DL编译器，如Tensorflow XLA和TVM。同样，DL编译器将不同DL框架中描述的DL模型作为输入，然后为不同的DL硬件生成优化的代码作为输出。然而，现有的调查没有全面分析DL-编译器的独特设计。在本文中，我们对现有DL编译器进行了全面调查，对常见设计进行了详细剖析，重点介绍了面向DL的多级IR和前端后端优化。从不同方面，我们对现有DL和编译器进行了全面的比较。此外，我们还详细介绍了多级IR设计和编译器优化技术。最后几个见解被突出显示为DL编译器的潜在研究方向。这是一份重点介绍DL编译器独特设计的最值得关注的调查论文，我们希望，这能为未来DL编译器的研究铺平道路。

4月 29 深度学习 compiler 评论

软件开发license问题

现今存在的开源协议很多，而经过Open Source Initiative组织通过批准的开源协议目前有58种。我们现在常见的开源协议如BSD, Apache,GPL, LGPL,MIT等都是OSI批准的协议。如果要开源自己的代码，最好也是选择这些被批准的开源协议。今天介绍几种常见的开源软件协议。
"opensource"

4月 28 技术总结 license 评论

topk in GPU

topk(input, k, dim=None, largest=True, sorted=True, out=None) -> (Tensor, LongTensor)
Semantics:
Returns the :attr:k largest elements of the given :attr:input tensor, a long a given dimension.

"topk"

4月 22 深度学习 GPU, topk 评论

Programming GPUs with SYCL

Introduction to GPGPU

Why program GPUs
CPU VS GPU architecture
General GPU programming tips
SYCL for OpenCL

Overview
Features
SYCL example

Vector add

4月 15 GPU SYCL 评论

深度学习面试常见问题集锦

这篇文章用来记录总结深度学习领域常见面试题。题目来源于各大门户网站和招聘网站。一来用于了解当前面试常考热点问题，二来在工作闭门造车的同时，弥补下自己深度学习理论方面的不足。

4月 14 机器学习面试评论

2020读书笔记

　　这篇用来记录2020年读的书籍和看的有意义的纪录片。电影则单独另作一文。希望每月抽出时间静下心来用心读一本书，内容可涉及各行各业，不必都是专业相关。一来扩宽专业领域，多去探索未知领域，激发好奇心，不要局限在自己局限的世界观内。二来也希望在这个节奏快、功利心强，一心想要追逐都立竿见影效果的社会，慢慢沉淀自己，时时放慢自己的脚本，思索下生活，享受这份难得的静谧。

4月 13 读书读书评论

深度学习中的batch的大小对学习效果有何影响？

最近在跑某个深度学习的模型训练时，发现训练时采用的batch size对训练的效果有一定的影响，因此这里想要做个总结。这篇文章也是参考了知乎上面几位网友的答案：
原文链接：https://www.zhihu.com/question/32673260/answer/71137399

4月 11 机器学习 batch-size 评论

专访罗永浩：我今年四十八岁，还可以承受无数次的失败

原文链接：http://baijiahao.baidu.com/s?id=1663496784360695202

罗永浩的回归依然万众瞩目。
4月1日直播首秀结束后，比起他自己的内心世界，外界对他的情感和评价或许更丰富也更复杂：支持、感动、激动，鄙夷、质疑、嘲讽，这些字眼全都混杂到一起，重新建立罗永浩的舆论形象。
他的主播身份越来越鲜明，但不疑有他的是，关注他的人一刻也没有忘记他走过的那条路，以及路途上发生的故事。

"laoluo"

4月 10 其他新闻评论

First PyTorch PR merged

在等待了22天之后，第一个PyTorch pull request终于merge进去! PR虽小，但也是新的尝试，这也是继MXnet之后的第二个做过Contribution的深度学习框架了。写文记之，再接再厉！

4月 10 机器学习 pytorch 评论

volatile in cplusplus

volatile关键字是一种类型修饰符，用它声明的类型变量表示可以被某些编译器未知的因素更改，比如：操作系统、硬件或者其它线程等。遇到这个关键字声明的变量，编译器对访问该变量的代码就不再进行优化，从而可以提供对特殊地址的稳定访问。

4月 2 技术总结 volatile 评论

黄志远

研发攻城狮