发行说明
Qualcomm 神经处理SDK v1.22.0 更新说明
本版本为主要发布版本,增加了对两种新骁龙移动平台的支持:骁龙855和骁龙675。我们引入了对Qualcomm® Hexagon™ Tensor Accelerator (“HTA”) 的支持,新的“AIP”运行时在HTA上执行神经网络并在必要时回退到HVX。以下是主要特性,包含了平常收集的错误修复和较小特性:
• 支持内置张量加速器(Tensor Accelerator)、Vector eXtensions、Adreno GPU和CPU的骁龙855移动平台(Hexagon DSP)
• 支持骁龙675移动平台(Hexagon DSP,Adreno GPU和CPU)
硬件要求
• 为骁龙855增加了新的AIP运行时
• 增加了DSP工作负载的优先级控制
• 支持手动设置量化范围
• 添加了新的“snpe-throughput-net-run”工具,支持同时在不同核心上执行
Qualcomm 神经处理SDK v1.19.2 更新说明
本版本主要增加了新的运算,填补运营商支持空白,优化现有运算,如解卷积。
• 支持Qualcomm QCS605 SoC(Hexagon DSP(Android,Linux)、Adreno GPU、CPU)
• 在GPU和CPU上增加了对TensorFlow和ONNX的ELU运算的支持
• 在GPU上增加了对Caffe2 Power运算的支持
• 增加支持Python 3.4
•优化了DSP上的解卷积、Slice和大型Softmax运算
Qualcomm 神经处理SDK v1.18.0 更新说明
本版本支持三种骁龙移动平台,提高了与MobileNet SSD网络的兼容性,扩展了TensorFlow和ONNX转换器上支持的运算。此外,本版本还优化了对批处理的支持,尤其是在DSP运行时执行MobileNets时的批处理。
• 支持骁龙632移动平台(Hexagon DSP、Adreno GPU和CPU)
• 支持骁龙439和429移动平台(Adreno GPU和CPU)
• 改善了MobileNets网络的兼容性,包括对MobileNet SSD变体的扩展支持
• 支持Adreno GPU上的TensorFlow 'pad'和elementwise减法
• 增加了对TensorFlow转换器的ChannelShuffle支持
• 增加了ONNX转换器对Shape和Pad的支持
Qualcomm 神经处理SDK v1.17.0 更新说明
本版本增加了部分特性,同时专注于提高质量和稳定性,并带来部分微小的优化。
• 增加DSP批处理支持,所有运行时现在均有基本的批处理支持。
• 扩展对ChannelShuffle层的批处理支持
• 扩展Snapdragon DSP的Caffe Scale层支持
• 优化DSP有效利用
• 更新了SDK示例
Qualcomm 神经处理SDK v1.16.0 更新说明
本版本主要增加了输入批处理的支持,能够在“批处理”维度上处理具有多个元素的输入张量。适用于在骁龙 GPU和CPU核心上运行的Caffe、Caffe2、TensorFlow和ONNX模型。
• 骁龙GPU和CPU上输入批处理
• 支持新层:ChannelShuffle(GPU和CPU,针对Caffe2模型)
• 优化Sigmoid、批量标准化和实例标准化层
• 示例APP中增加了Inception-v3模型
Qualcomm 神经处理SDK v1.15.0 更新说明
本版本增加了对基于Caffe的MobileNet SSD网络的支持,并引入了加速实例规范化,初步支持分组解卷积、按通道批量标准化和电源层。请参见“参考指南”(在线及SDK中提供)的“层和限制”部分,了解更多详细信息。
• 支持基于Caffe的MobileNet SSD
• 支持新层:实例规范化
• 扩展支持分组解卷积和1D批量标准化
• MobileNet SSD在GPU 16位上的速度提升了49%
• 在支持的芯片组和加速核心上,平均网络速度提高了9%
Qualcomm 神经处理SDK v1.14.0 更新说明
本次SDK发布版本支持深度学习模型的开放标准格式ONNX 1.0,具体支持的运算,请参阅SDK文档或本网站的文档部分。另外,还增加了对两个新层和新性能配置文件模式的支持。
• 支持ONNX 1.0模型(Beta)
• 支持新层:生成Proposal和RoIAlign
• 增加了手动性能模式
Qualcomm 神经处理SDK v1.13.0 更新说明
本次更新改善了推理性能,特别是增加了对骁龙845移动平台新数字信号处理器的支持。此外,还优化了16位浮点运行时。
• 支持骁龙845移动平台数字信号处理器
• 改善16位浮点运行时的性能
• 改善GPU运行时的性能
• DSP运行时初步支持Caffe2 Generate Proposals和RoiAlign层
Qualcomm 神经处理SDK v1.12.0 更新说明
本版本为主要更新版本,为16位GPU计算引入了全新的加速运行时,并支持包含MobileNets的TensorFlow式SSD网络。此外,我们还引入了新的库变体优化。
• 支持MobileNet SSD(CPU、GPU)
• 添加了GPU 16位浮点运行时
• 优化骁龙845移动平台的DSP运行时
• 添加了Android LLVM库
• 支持Symphony System Manager SDK共享库
Qualcomm 神经处理SDK v1.10.1 更新说明
本版本增加了对新骁龙平台的支持,部署了全新的DSP运行时,修复了错误并完成了对MobileNets的支持。
• 初步支持骁龙845移动平台
• 在DSP上支持MobileNets;请注意,8位量化可能无法在此网络结构上正常工作
• 升级DSP加速运行时,提高性能和兼容性
• 修复了Faster R-CNN UserBuffers操作
• 支持Snapdragon Flight板
Qualcomm 神经处理SDK v1.8.0 更新说明
本版本增加了对新网络架构的支持,并扩大了对骁龙处理器的支持。
• 支持MobileNets(CPU、GPU)
• 支持骁龙636
• 添加了Android ARM 64位库
Qualcomm 神经处理SDK v1.6.0 更新说明
本版本改善了稳定性,修复了AI生态系统以及我们的开发者社区报告的部分重要问题。
• 支持Qualcomm® 骁龙™ 450(CPU、GPU)
• 错误修复和性能改进,包括如果缺少OpenCL库,NPE将无法运行的问题
Qualcomm 神经处理SDK v1.4.0 更新说明
本版本增加了对新网络架构的支持,并扩大了对骁龙处理器的支持。
• 支持骁龙630(CPU、GPU)
• 支持骁龙820 Automotive(ADSP)
• 支持FasterRCNN(CPU、DSP)
Qualcomm 神经处理SDK v1.2.2 更新说明
本版本是在Qualcomm开发者网络上发布的首个公开版本。
• 可在Qualcomm开发者网络下载并使用
• 支持重排和置换层
• Caffe2增强功能
• 文档更新
Qualcomm 神经处理SDK v1.2.0 更新说明
本版本主要增加支持Caffe2。
• Beta Caffe2 converter
• Beta版Caffe2转换器
Qualcomm 神经处理SDK v1.0.2 更新说明
本版本增加了对最新骁龙移动平台的支持。
• 支持骁龙660(CPU、GPU和cDSP)
• 支持骁龙820 Automotive(CPU、GPU)
• 文档更新
Qualcomm 神经处理SDK v1.0 更新说明
本版本主要增加TensorFlow支持并稳定了API。
• 正式支持TensorFlow转换
• 支持DSP运行时
• 新的dlc-quantize工具
• API变更(进行了非向后兼容的变更)
• 1.0版本之前创建的DLC文件需重新生成
Qualcomm 开发者专区是 Qualcomm 联合CSDN 共同打造的面向中国开发者的技术专区。致力于通过提供全球最新资讯和最多元的技术资源及支持,为开发者们打造全面一流的开发环境。本专区将以嵌入式、物联网、游戏开发、Qualcomm® 骁龙™处理器的软件优化等技术为核心,打造全面的开发者技术服务社区,为下一代高性能体验和设计带来更多的想法和灵感。
加入 Qualcomm 开发者专区