特性概述

Intel Advanced Matrix Extensions (Intel AMX)是英特尔在即将发布的第四代英特尔至强可扩展处理器上引入的全新的加速引擎,通过指令集层面的支持来显著加速深度学习算法中的张量计算。它包含一组被命名为 TILE 的二维寄存器,以及称之为 TMUL(Tile Matrix Multiply Unit)的硬件逻辑,用来实现加速基于 TILE 寄存器的矩阵运算。
Intel AMX 支持 INT8 和 BF16 这两种业界广泛应用的数据类型,拥有可扩展的硬件架构和优化的软件生态(AI Framework,Libraries & Toolkits),是英特尔至强可扩展处理器内建的适配 AI 加速场景的重要构件。

AMX特性涉及到软件包oneDNN和Tensorflow集成。
共计执行6个oneDNN单元测试用例,主要覆盖了AMX对数据类型BF16和INT8的测试。
以及一个在Tensorflow中运行混合精度MNIST模型的AMX集成测试用例。
发现问题已解决,回归通过,无遗留风险,整体质量良好。

测试活动 活动评价
功能测试 已通过oneDNN单元测试: test_gemm_bf16bf16bf16, test_gemm_bf16bf16f32, test_gemm_s8s8s32, test_gemm_s8u8s32, test_gemm_u8s8s32, test_gemm_u8u8s32
专项测试 已通过Tensorflow混合精度集成测试:https://www.intel.com/content/www/us/en/developer/articles/guide/getting-started-with-automixedprecisionmkl.html