Skip to main content

produce NPU instructions

Project description

# NPU compiler

produce NPU instructions

## Release Notes

### Release 1.0.11
  • 增加了DepthwiseConv2dNative,AvgPool, Conv2DBackpropInput, Maximum, Minimum, GreaterEqual, LessEqual, Assert, Tile, All, Any, BatchMatMul, ReverseV2, Exp
  • 支持做MatMul时,权重(第二个输入数据)在编译阶段不确定的情况。
  • BUG修复。
### Release 1.0.10
  • 对Conv2D, Slice等OP的优化。
  • 增加了Max, Min, FloorDiv, FloorMod OP
  • 增加了空间优化的选项,可以根据模型时间敏感还是空间敏感来配置。配置项为 SPACE_OPTIMIZATION:0/1 数字越大表示需要内存空间越小,相应速度会慢,目前只支持0或1。目前只有Conv2D, Slice OP在某些条件下会起作用。
  • BUG修复。
### Release 1.0.9
  • 针对NPU硬件的问题增加了补丁。
  • 优化了Mean, Sum, Conv2D等OP
  • 增加对1x1卷积核的支持。
  • BUG修复。

### Release 1.0.8 (空缺)

### Release 1.0.7
  • 配置文件中可以任意指定输出OP,不执行和输出OP无关的OP
  • 增加LogSoftmax OP
  • OP优化和BUG修复
### Release 1.0.6
  • 配置文件增加新配置项 CORENAME,可以选择 LEO 或 LEO_MPE,默认为 LEO
  • 对OP log 和 softmax 合并在一起计算,减少计算误差。
  • 加速多 batch LSTM计算,加速归一化计算。
  • 参数 fp32 转 fp16 由截位变成四舍五入。
  • bug 修复。

Project details


Release history Release notifications | RSS feed

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Files for npu-compiler, version 1.0.12a2
Filename, size File type Python version Upload date Hashes
Filename, size npu_compiler-1.0.12a2-py2-none-any.whl (9.5 MB) File type Wheel Python version py2 Upload date Hashes View

Supported by

Pingdom Pingdom Monitoring Google Google Object Storage and Download Analytics Sentry Sentry Error logging AWS AWS Cloud computing DataDog DataDog Monitoring Fastly Fastly CDN DigiCert DigiCert EV certificate StatusPage StatusPage Status page