提问者:小点点

当使用具有AVX-512加载和存储的掩码寄存器时,是否会因对掩码元素的无效访问而引发故障?


当我做一个写掩码的AVX-512商店时,像这样:

vmovdqu8 [rsi] {k1}, zmm0

如果在[rsi, rsi 63]访问的内存的某些部分没有映射,但所有这些位置的写掩码为零(即,由于掩码,数据实际上没有被修改),则指令会出错。

另一种询问方式是,这些AVX-512屏蔽存储是否具有与AVX中引入的vmaskmov类似的故障抑制能力。


共1个答案

匿名用户

如果被屏蔽的元素触及无效内存,则不会引发故障。

这里有一些Windows测试代码来证明屏蔽确实可以抑制内存故障。

#include <immintrin.h>
#include <iostream>
#include <Windows.h>
using namespace std; 


int main(){
    const size_t PAGE = 4096;

    //  Map 2 pages.
    char* ptr = (char*)VirtualAlloc(
        nullptr, 2*PAGE,
        MEM_COMMIT,
        PAGE_READWRITE
    );

    //  Store 64 bytes across page boundary.
    cout << "Store across page boundary." << endl;
    _mm512_storeu_si512(ptr + PAGE - 32, _mm512_set1_epi8(-1));

    //  Unmap top page.
    cout << "Unmap top page." << endl;
    VirtualFree(ptr + PAGE, PAGE, MEM_DECOMMIT);

    //  Write on boundary masking out the part that touches the top (unmapped page).
    //  Does not crash because bad accesses are masked out.
    cout << "Store across page boundary, but mask out bytes that are on unmapped page." << endl;
    _mm512_mask_storeu_epi8(ptr + PAGE - 32, 0x00000000ffffffff, _mm512_set1_epi8(-1));

    //  Store 64 bytes across page boundary.
    //  Crashes because of bad access.
    cout << "Store across page boundary." << endl;
    _mm512_storeu_si512(ptr + PAGE - 32, _mm512_set1_epi8(-1));

    cout << "Release bottom page." << endl;
    VirtualFree(ptr, 0, MEM_RELEASE);

    system("pause");
}

输出:

Store across page boundary.
Unmap top page.
Store across page boundary, but mask out bytes that are on unmapped page.
Store across page boundary.
**Access violation**

该测试的工作原理如下:

  1. 映射2个相邻页面。
  2. 跨页面边界执行AVX512存储以证明两个页面都被映射。
  3. 取消映射上层页面。
  4. 执行相同的AVX512存储,但屏蔽掉上层页面上的字节。它不会崩溃。
  5. 重复第一个AVX512存储(不屏蔽)。它崩溃了,从而证明上层页面已经被取消映射,并且屏蔽抑制了崩溃。