Path: blob/master/thirdparty/embree/common/simd/vboolf8_avx512.h
9912 views
// Copyright 2009-2021 Intel Corporation1// SPDX-License-Identifier: Apache-2.023#pragma once45#define vboolf vboolf_impl6#define vboold vboold_impl7#define vint vint_impl8#define vuint vuint_impl9#define vllong vllong_impl10#define vfloat vfloat_impl11#define vdouble vdouble_impl1213namespace embree14{15/* 8-wide AVX-512 bool type */16template<>17struct vboolf<8>18{19typedef vboolf8 Bool;20typedef vint8 Int;2122enum { size = 8 }; // number of SIMD elements23__mmask8 v; // data2425////////////////////////////////////////////////////////////////////////////////26/// Constructors, Assignment & Cast Operators27////////////////////////////////////////////////////////////////////////////////2829__forceinline vboolf() {}30__forceinline vboolf(const vboolf8& t) { v = t.v; }31__forceinline vboolf8& operator =(const vboolf8& f) { v = f.v; return *this; }3233__forceinline vboolf(const __mmask8 &t) { v = t; }34__forceinline operator __mmask8() const { return v; }3536__forceinline vboolf(bool b) { v = b ? 0xff : 0x00; }37__forceinline vboolf(int t) { v = (__mmask8)t; }38__forceinline vboolf(unsigned int t) { v = (__mmask8)t; }3940__forceinline vboolf(bool a, bool b, bool c, bool d, bool e, bool f, bool g, bool h)41: v((__mmask8)((int(h) << 7) | (int(g) << 6) | (int(f) << 5) | (int(e) << 4) | (int(d) << 3) | (int(c) << 2) | (int(b) << 1) | int(a))) {}4243/* return int8 mask */44__forceinline __m128i mask8() const {45return _mm_movm_epi8(v);46}4748/* return int32 mask */49__forceinline __m256i mask32() const {50return _mm256_movm_epi32(v);51}5253/* return int64 mask */54__forceinline __m512i mask64() const {55return _mm512_movm_epi64(v);56}5758////////////////////////////////////////////////////////////////////////////////59/// Constants60////////////////////////////////////////////////////////////////////////////////6162__forceinline vboolf(FalseTy) : v(0x00) {}63__forceinline vboolf(TrueTy) : v(0xff) {}6465////////////////////////////////////////////////////////////////////////////////66/// Array Access67////////////////////////////////////////////////////////////////////////////////6869__forceinline bool operator [](size_t index) const {70assert(index < 8); return (mm512_mask2int(v) >> index) & 1;71}72};7374////////////////////////////////////////////////////////////////////////////////75/// Unary Operators76////////////////////////////////////////////////////////////////////////////////7778__forceinline vboolf8 operator !(const vboolf8& a) { return _mm512_knot(a); }7980////////////////////////////////////////////////////////////////////////////////81/// Binary Operators82////////////////////////////////////////////////////////////////////////////////8384__forceinline vboolf8 operator &(const vboolf8& a, const vboolf8& b) { return _mm512_kand(a, b); }85__forceinline vboolf8 operator |(const vboolf8& a, const vboolf8& b) { return _mm512_kor(a, b); }86__forceinline vboolf8 operator ^(const vboolf8& a, const vboolf8& b) { return _mm512_kxor(a, b); }8788__forceinline vboolf8 andn(const vboolf8& a, const vboolf8& b) { return _mm512_kandn(b, a); }8990////////////////////////////////////////////////////////////////////////////////91/// Assignment Operators92////////////////////////////////////////////////////////////////////////////////9394__forceinline vboolf8& operator &=(vboolf8& a, const vboolf8& b) { return a = a & b; }95__forceinline vboolf8& operator |=(vboolf8& a, const vboolf8& b) { return a = a | b; }96__forceinline vboolf8& operator ^=(vboolf8& a, const vboolf8& b) { return a = a ^ b; }9798////////////////////////////////////////////////////////////////////////////////99/// Comparison Operators + Select100////////////////////////////////////////////////////////////////////////////////101102__forceinline vboolf8 operator !=(const vboolf8& a, const vboolf8& b) { return _mm512_kxor(a, b); }103__forceinline vboolf8 operator ==(const vboolf8& a, const vboolf8& b) { return _mm512_kxnor(a, b); }104105__forceinline vboolf8 select(const vboolf8& s, const vboolf8& a, const vboolf8& b) {106return _mm512_kor(_mm512_kand(s, a), _mm512_kandn(s, b));107}108109////////////////////////////////////////////////////////////////////////////////110/// Reduction Operations111////////////////////////////////////////////////////////////////////////////////112113__forceinline int all (const vboolf8& a) { return a.v == 0xff; }114__forceinline int any (const vboolf8& a) { return _mm512_kortestz(a, a) == 0; }115__forceinline int none(const vboolf8& a) { return _mm512_kortestz(a, a) != 0; }116117__forceinline int all (const vboolf8& valid, const vboolf8& b) { return all((!valid) | b); }118__forceinline int any (const vboolf8& valid, const vboolf8& b) { return any(valid & b); }119__forceinline int none(const vboolf8& valid, const vboolf8& b) { return none(valid & b); }120121__forceinline size_t movemask(const vboolf8& a) { return _mm512_kmov(a); }122__forceinline size_t popcnt (const vboolf8& a) { return popcnt(a.v); }123124////////////////////////////////////////////////////////////////////////////////125/// Conversion Operations126////////////////////////////////////////////////////////////////////////////////127128__forceinline unsigned int toInt(const vboolf8& a) { return mm512_mask2int(a); }129130////////////////////////////////////////////////////////////////////////////////131/// Get/Set Functions132////////////////////////////////////////////////////////////////////////////////133134__forceinline bool get(const vboolf8& a, size_t index) { assert(index < 8); return (toInt(a) >> index) & 1; }135__forceinline void set(vboolf8& a, size_t index) { assert(index < 8); a |= 1 << index; }136__forceinline void clear(vboolf8& a, size_t index) { assert(index < 8); a = andn(a, 1 << index); }137138////////////////////////////////////////////////////////////////////////////////139/// Output Operators140////////////////////////////////////////////////////////////////////////////////141142__forceinline embree_ostream operator <<(embree_ostream cout, const vboolf8& a)143{144cout << "<";145for (size_t i=0; i<8; i++) {146if ((a.v >> i) & 1) cout << "1"; else cout << "0";147}148return cout << ">";149}150}151152#undef vboolf153#undef vboold154#undef vint155#undef vuint156#undef vllong157#undef vfloat158#undef vdouble159160161