implement basic cache and support resnet in tvm backend #76

zrr1999 · 2023-09-29T16:37:46Z

本 PR 包含以下内容：

实现基础的 cache 机制，目前支持输入为 tensor 的情况（只判断shape和dtype是否一致）
为 TVM 后端添加多 tuple 返回值支持
修复子图打断中，多个 tensor 只会返回第一个的问题。
完善tvm后端，支持resnet

zrr1999 · 2023-10-03T07:02:13Z

目前已经可以实现 ResNet 的端到端推理（tvm后端），目前速度比 paddle动态图慢了很多，大概耗时是20倍，不优化的 tvm.tir 看起来速度非常慢
@jzhang533 @gglin001

jzhang533 · 2023-10-07T10:02:16Z

对比速度的脚本是哪个呀，我可以看一看。

zrr1999 · 2023-10-07T12:54:18Z

对比速度的脚本是哪个呀，我可以看一看。

我对比速度现在是用的viztracer直接把每行代码的速度都追踪一下，然后大概看的时间

jzhang533 · 2023-10-08T11:10:12Z

src/paddlefx/compiler/tvm.py

+
+
+class TVMCompiler(CompilerBase):
+    def gen_compiled_func(self, symbol_table: SymbolTable[te.Tensor, paddle.Tensor]):


对于tvm，不知道有没有可能利用现有的tvm的这个API：tvm.relay.frontend.from_paddle。
也就是，先把捕获到的子图，转成paddle的静态图，然后用tvm.relay.frontend.from_paddle给加载进来。

我这几天尝试一下，看起来是可以的。不过这样的话就感觉主要工作量都在动转静和tvm的tvm.relay.frontend.from_paddle这个接口的适配了，看起来 paddlefx 的内容很少

嗯，可以探索看看。好处是，可以复用现有的tvm里已有的，成熟的，paddle IR到tvm IR的转换，理论上，能很快实现较多的模型，lower到tvm来运行。
如果从头做fx graph到tvm IR的转换的话，感觉工作量是不少的。

zrr1999 added 20 commits September 30, 2023 00:35

impl basic cache (only tensor inputs)

adb792e

suuport simple_dynamo

ed9d458

use dir

26e464b

fix layer

b54786e

fix bug in tvm compiler

10a4fbc

improve tests

c27ab22

fix bug

5a549b8

impl SybolTable and support tuple outputs

d12ef93

fix bug in PyCodegen call

33f0832

improve tests

a5dc37e

fix bug in codegen

29965f0

fix

c5a4350

use 1234 seed

ef684c9

fix typos

9b05c21

fix

6b79fb8

rm dummy_outputs

904ae8f

rm dymmy and gl

843c369

support call module(Linear Conv)

45995ed

mv CodeCacheManager

93d9ce7

improve

f21b6dc

zrr1999 changed the title ~~implement basic cache~~ implement basic cache and support resnet in tvm backend Oct 2, 2023

jzhang533 reviewed Oct 8, 2023

View reviewed changes

zrr1999 mentioned this pull request Oct 10, 2023

tvm relay backend #79

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

implement basic cache and support resnet in tvm backend #76

implement basic cache and support resnet in tvm backend #76

zrr1999 commented Sep 29, 2023 •

edited

Loading

zrr1999 commented Oct 3, 2023

jzhang533 commented Oct 7, 2023

zrr1999 commented Oct 7, 2023

jzhang533 Oct 8, 2023

zrr1999 Oct 9, 2023

jzhang533 Oct 9, 2023 •

edited

Loading



		class TVMCompiler(CompilerBase):
		def gen_compiled_func(self, symbol_table: SymbolTable[te.Tensor, paddle.Tensor]):

implement basic cache and support resnet in tvm backend #76

Are you sure you want to change the base?

implement basic cache and support resnet in tvm backend #76

Conversation

zrr1999 commented Sep 29, 2023 • edited Loading

zrr1999 commented Oct 3, 2023

jzhang533 commented Oct 7, 2023

zrr1999 commented Oct 7, 2023

jzhang533 Oct 8, 2023

Choose a reason for hiding this comment

zrr1999 Oct 9, 2023

Choose a reason for hiding this comment

jzhang533 Oct 9, 2023 • edited Loading

Choose a reason for hiding this comment

zrr1999 commented Sep 29, 2023 •

edited

Loading

jzhang533 Oct 9, 2023 •

edited

Loading