Path: blob/master/thirdparty/embree/common/simd/vboold4_avx512.h
9912 views
// Copyright 2009-2021 Intel Corporation1// SPDX-License-Identifier: Apache-2.023#pragma once45#define vboolf vboolf_impl6#define vboold vboold_impl7#define vint vint_impl8#define vuint vuint_impl9#define vllong vllong_impl10#define vfloat vfloat_impl11#define vdouble vdouble_impl1213namespace embree14{15/* 4-wide AVX-512 bool type */16template<>17struct vboold<4>18{19typedef vboold4 Bool;20typedef vint4 Int;2122enum { size = 4 }; // number of SIMD elements23__mmask8 v; // data2425////////////////////////////////////////////////////////////////////////////////26/// Constructors, Assignment & Cast Operators27////////////////////////////////////////////////////////////////////////////////2829__forceinline vboold() {}30__forceinline vboold(const vboold4& t) { v = t.v; }31__forceinline vboold4& operator =(const vboold4& f) { v = f.v; return *this; }3233__forceinline vboold(const __mmask8 &t) { v = t; }34__forceinline operator __mmask8() const { return v; }3536__forceinline vboold(bool b) { v = b ? 0xf : 0x0; }37__forceinline vboold(int t) { v = (__mmask8)t; }38__forceinline vboold(unsigned int t) { v = (__mmask8)t; }3940/* return int8 mask */41__forceinline __m128i mask8() const {42return _mm_movm_epi8(v);43}4445/* return int32 mask */46__forceinline __m128i mask32() const {47return _mm_movm_epi32(v);48}4950/* return int64 mask */51__forceinline __m256i mask64() const {52return _mm256_movm_epi64(v);53}5455////////////////////////////////////////////////////////////////////////////////56/// Constants57////////////////////////////////////////////////////////////////////////////////5859__forceinline vboold(FalseTy) : v(0x0) {}60__forceinline vboold(TrueTy) : v(0xf) {}6162////////////////////////////////////////////////////////////////////////////////63/// Array Access64////////////////////////////////////////////////////////////////////////////////6566__forceinline bool operator [](size_t index) const {67assert(index < 4); return (mm512_mask2int(v) >> index) & 1;68}69};7071////////////////////////////////////////////////////////////////////////////////72/// Unary Operators73////////////////////////////////////////////////////////////////////////////////7475__forceinline vboold4 operator !(const vboold4& a) { return _mm512_kandn(a, 0xf); }7677////////////////////////////////////////////////////////////////////////////////78/// Binary Operators79////////////////////////////////////////////////////////////////////////////////8081__forceinline vboold4 operator &(const vboold4& a, const vboold4& b) { return _mm512_kand(a, b); }82__forceinline vboold4 operator |(const vboold4& a, const vboold4& b) { return _mm512_kor(a, b); }83__forceinline vboold4 operator ^(const vboold4& a, const vboold4& b) { return _mm512_kxor(a, b); }8485__forceinline vboold4 andn(const vboold4& a, const vboold4& b) { return _mm512_kandn(b, a); }8687////////////////////////////////////////////////////////////////////////////////88/// Assignment Operators89////////////////////////////////////////////////////////////////////////////////9091__forceinline vboold4& operator &=(vboold4& a, const vboold4& b) { return a = a & b; }92__forceinline vboold4& operator |=(vboold4& a, const vboold4& b) { return a = a | b; }93__forceinline vboold4& operator ^=(vboold4& a, const vboold4& b) { return a = a ^ b; }9495////////////////////////////////////////////////////////////////////////////////96/// Comparison Operators + Select97////////////////////////////////////////////////////////////////////////////////9899__forceinline vboold4 operator !=(const vboold4& a, const vboold4& b) { return _mm512_kxor(a, b); }100__forceinline vboold4 operator ==(const vboold4& a, const vboold4& b) { return _mm512_kand(_mm512_kxnor(a, b), 0xf); }101102__forceinline vboold4 select(const vboold4& s, const vboold4& a, const vboold4& b) {103return _mm512_kor(_mm512_kand(s, a), _mm512_kandn(s, b));104}105106////////////////////////////////////////////////////////////////////////////////107/// Reduction Operations108////////////////////////////////////////////////////////////////////////////////109110__forceinline int all (const vboold4& a) { return a.v == 0xf; }111__forceinline int any (const vboold4& a) { return _mm512_kortestz(a, a) == 0; }112__forceinline int none(const vboold4& a) { return _mm512_kortestz(a, a) != 0; }113114__forceinline int all (const vboold4& valid, const vboold4& b) { return all((!valid) | b); }115__forceinline int any (const vboold4& valid, const vboold4& b) { return any(valid & b); }116__forceinline int none(const vboold4& valid, const vboold4& b) { return none(valid & b); }117118__forceinline size_t movemask(const vboold4& a) { return _mm512_kmov(a); }119__forceinline size_t popcnt (const vboold4& a) { return popcnt(a.v); }120121////////////////////////////////////////////////////////////////////////////////122/// Conversion Operations123////////////////////////////////////////////////////////////////////////////////124125__forceinline unsigned int toInt(const vboold4& a) { return mm512_mask2int(a); }126127////////////////////////////////////////////////////////////////////////////////128/// Get/Set Functions129////////////////////////////////////////////////////////////////////////////////130131__forceinline bool get(const vboold4& a, size_t index) { assert(index < 4); return (toInt(a) >> index) & 1; }132__forceinline void set(vboold4& a, size_t index) { assert(index < 4); a |= 1 << index; }133__forceinline void clear(vboold4& a, size_t index) { assert(index < 4); a = andn(a, 1 << index); }134135////////////////////////////////////////////////////////////////////////////////136/// Output Operators137////////////////////////////////////////////////////////////////////////////////138139__forceinline embree_ostream operator <<(embree_ostream cout, const vboold4& a)140{141cout << "<";142for (size_t i=0; i<4; i++) {143if ((a.v >> i) & 1) cout << "1"; else cout << "0";144}145return cout << ">";146}147}148149#undef vboolf150#undef vboold151#undef vint152#undef vuint153#undef vllong154#undef vfloat155#undef vdouble156157158