Path: blob/master/thirdparty/embree/common/simd/vboold8_avx512.h
9912 views
// Copyright 2009-2021 Intel Corporation1// SPDX-License-Identifier: Apache-2.023#pragma once45#define vboolf vboolf_impl6#define vboold vboold_impl7#define vint vint_impl8#define vuint vuint_impl9#define vllong vllong_impl10#define vfloat vfloat_impl11#define vdouble vdouble_impl1213namespace embree14{15/* 8-wide AVX-512 bool type */16template<>17struct vboold<8>18{19typedef vboold8 Bool;20typedef vint8 Int;2122enum { size = 8 }; // number of SIMD elements23__mmask8 v; // data2425////////////////////////////////////////////////////////////////////////////////26/// Constructors, Assignment & Cast Operators27////////////////////////////////////////////////////////////////////////////////2829__forceinline vboold() {}30__forceinline vboold(const vboold8& t) { v = t.v; }31__forceinline vboold8& operator =(const vboold8& f) { v = f.v; return *this; }3233__forceinline vboold(const __mmask8& t) { v = t; }34__forceinline operator __mmask8() const { return v; }3536__forceinline vboold(bool b) { v = b ? 0xff : 0x00; }37__forceinline vboold(int t) { v = (__mmask8)t; }38__forceinline vboold(unsigned int t) { v = (__mmask8)t; }3940/* return int8 mask */41__forceinline __m128i mask8() const {42return _mm_movm_epi8(v);43}4445/* return int64 mask */46__forceinline __m512i mask64() const {47return _mm512_movm_epi64(v);48}4950////////////////////////////////////////////////////////////////////////////////51/// Constants52////////////////////////////////////////////////////////////////////////////////5354__forceinline vboold(FalseTy) : v(0x00) {}55__forceinline vboold(TrueTy) : v(0xff) {}5657////////////////////////////////////////////////////////////////////////////////58/// Array Access59////////////////////////////////////////////////////////////////////////////////6061__forceinline bool operator [](size_t index) const {62assert(index < 8); return (mm512_mask2int(v) >> index) & 1;63}64};6566////////////////////////////////////////////////////////////////////////////////67/// Unary Operators68////////////////////////////////////////////////////////////////////////////////6970__forceinline vboold8 operator !(const vboold8& a) { return _mm512_knot(a); }7172////////////////////////////////////////////////////////////////////////////////73/// Binary Operators74////////////////////////////////////////////////////////////////////////////////7576__forceinline vboold8 operator &(const vboold8& a, const vboold8& b) { return _mm512_kand(a, b); }77__forceinline vboold8 operator |(const vboold8& a, const vboold8& b) { return _mm512_kor(a, b); }78__forceinline vboold8 operator ^(const vboold8& a, const vboold8& b) { return _mm512_kxor(a, b); }7980__forceinline vboold8 andn(const vboold8& a, const vboold8& b) { return _mm512_kandn(b, a); }8182////////////////////////////////////////////////////////////////////////////////83/// Assignment Operators84////////////////////////////////////////////////////////////////////////////////8586__forceinline vboold8& operator &=(vboold8& a, const vboold8& b) { return a = a & b; }87__forceinline vboold8& operator |=(vboold8& a, const vboold8& b) { return a = a | b; }88__forceinline vboold8& operator ^=(vboold8& a, const vboold8& b) { return a = a ^ b; }8990////////////////////////////////////////////////////////////////////////////////91/// Comparison Operators + Select92////////////////////////////////////////////////////////////////////////////////9394__forceinline vboold8 operator !=(const vboold8& a, const vboold8& b) { return _mm512_kxor(a, b); }95__forceinline vboold8 operator ==(const vboold8& a, const vboold8& b) { return _mm512_kxnor(a, b); }9697__forceinline vboold8 select(const vboold8& s, const vboold8& a, const vboold8& b) {98return _mm512_kor(_mm512_kand(s, a), _mm512_kandn(s, b));99}100101////////////////////////////////////////////////////////////////////////////////102/// Reduction Operations103////////////////////////////////////////////////////////////////////////////////104105__forceinline int all (const vboold8& a) { return a.v == 0xff; }106__forceinline int any (const vboold8& a) { return _mm512_kortestz(a, a) == 0; }107__forceinline int none(const vboold8& a) { return _mm512_kortestz(a, a) != 0; }108109__forceinline int all (const vboold8& valid, const vboold8& b) { return all((!valid) | b); }110__forceinline int any (const vboold8& valid, const vboold8& b) { return any(valid & b); }111__forceinline int none(const vboold8& valid, const vboold8& b) { return none(valid & b); }112113__forceinline size_t movemask(const vboold8& a) { return _mm512_kmov(a); }114__forceinline size_t popcnt (const vboold8& a) { return popcnt(a.v); }115116////////////////////////////////////////////////////////////////////////////////117/// Conversion Operations118////////////////////////////////////////////////////////////////////////////////119120__forceinline unsigned int toInt(const vboold8& a) { return mm512_mask2int(a); }121122////////////////////////////////////////////////////////////////////////////////123/// Get/Set Functions124////////////////////////////////////////////////////////////////////////////////125126__forceinline bool get(const vboold8& a, size_t index) { assert(index < 8); return (toInt(a) >> index) & 1; }127__forceinline void set(vboold8& a, size_t index) { assert(index < 8); a |= 1 << index; }128__forceinline void clear(vboold8& a, size_t index) { assert(index < 8); a = andn(a, 1 << index); }129130////////////////////////////////////////////////////////////////////////////////131/// Output Operators132////////////////////////////////////////////////////////////////////////////////133134__forceinline embree_ostream operator <<(embree_ostream cout, const vboold8& a)135{136cout << "<";137for (size_t i=0; i<8; i++) {138if ((a.v >> i) & 1) cout << "1"; else cout << "0";139}140return cout << ">";141}142}143144#undef vboolf145#undef vboold146#undef vint147#undef vuint148#undef vllong149#undef vfloat150#undef vdouble151152153