deep learning compiler调研报告

在不同DL硬件上部署各种深度学习模型,促进了社区深度学习编译器的研发。从行业和学术界已经提出了几个DL编译器,如Tensorflow XLA和TVM。同样,DL编译器将不同DL框架中描述的DL模型作为输入,然后为不同的DL硬件生成优化的代码作为输出。然而,现有的调查没有全面分析DL-编译器的独特设计。在本文中,我们对现有DL编译器进行了全面调查,对常见设计进行了详细剖析,重点介绍了面向DL的多级IR和前端后端优化。从不同方面,我们对现有DL和编译器进行了全面的比较。此外,我们还详细介绍了多级IR设计和编译器优化技术。最后几个见解被突出显示为DL编译器的潜在研究方向。这是一份重点介绍DL编译器独特设计的最值得关注的调查论文,我们希望,这能为未来DL编译器的研究铺平道路。

topk in GPU

topk(input, k, dim=None, largest=True, sorted=True, out=None) -> (Tensor, LongTensor)
Semantics:
Returns the :attr:k largest elements of the given :attr:input tensor, a long a given dimension.

"topk"

2020读书笔记

  这篇用来记录2020年读的书籍和看的有意义的纪录片。电影则单独另作一文。希望每月抽出时间静下心来用心读一本书,内容可涉及各行各业,不必都是专业相关。一来扩宽专业领域,多去探索未知领域,激发好奇心,不要局限在自己局限的世界观内。二来也希望在这个节奏快、功利心强,一心想要追逐都立竿见影效果的社会,慢慢沉淀自己,时时放慢自己的脚本,思索下生活,享受这份难得的静谧。

专访罗永浩:我今年四十八岁,还可以承受无数次的失败

原文链接:http://baijiahao.baidu.com/s?id=1663496784360695202

罗永浩的回归依然万众瞩目。
4月1日直播首秀结束后,比起他自己的内心世界,外界对他的情感和评价或许更丰富也更复杂:支持、感动、激动,鄙夷、质疑、嘲讽,这些字眼全都混杂到一起,重新建立罗永浩的舆论形象。
他的主播身份越来越鲜明,但不疑有他的是,关注他的人一刻也没有忘记他走过的那条路,以及路途上发生的故事。

"laoluo"

volatile in cplusplus

volatile关键字是一种类型修饰符,用它声明的类型变量表示可以被某些编译器未知的因素更改,比如:操作系统、硬件或者其它线程等。遇到这个关键字声明的变量,编译器对访问该变量的代码就不再进行优化,从而可以提供对特殊地址的稳定访问。