Path: blob/master/thirdparty/embree/common/math/vec2fa_sycl.h
9912 views
// Copyright 2009-2021 Intel Corporation1// SPDX-License-Identifier: Apache-2.023#pragma once45#include "../sys/alloc.h"6#include "emath.h"7#include "../simd/sse.h"89namespace embree10{11struct Vec3fa;1213////////////////////////////////////////////////////////////////////////////////14/// SSE Vec2fa Type15////////////////////////////////////////////////////////////////////////////////1617struct __aligned(16) Vec2fa18{19//ALIGNED_STRUCT_(16);2021typedef float Scalar;22enum { N = 2 };23struct { float x,y; };2425////////////////////////////////////////////////////////////////////////////////26/// Constructors, Assignment & Cast Operators27////////////////////////////////////////////////////////////////////////////////2829__forceinline Vec2fa( ) {}30//__forceinline Vec2fa( const __m128 a ) : m128(a) {}31explicit Vec2fa(const Vec3fa& a);3233__forceinline explicit Vec2fa( const vfloat<4>& a ) {34x = a[0];35y = a[1];36}3738__forceinline Vec2fa ( const Vec2<float>& other ) { x = other.x; y = other.y; }39__forceinline Vec2fa& operator =( const Vec2<float>& other ) { x = other.x; y = other.y; return *this; }4041__forceinline Vec2fa ( const Vec2fa& other ) { x = other.x; y = other.y; }42__forceinline Vec2fa& operator =( const Vec2fa& other ) { x = other.x; y = other.y; return *this; }4344__forceinline explicit Vec2fa( const float a ) : x(a), y(a) {}45__forceinline Vec2fa( const float x, const float y) : x(x), y(y) {}4647//__forceinline explicit Vec2fa( const __m128i a ) : m128(_mm_cvtepi32_ps(a)) {}4849//__forceinline operator const __m128&() const { return m128; }50//__forceinline operator __m128&() { return m128; }5152////////////////////////////////////////////////////////////////////////////////53/// Loads and Stores54////////////////////////////////////////////////////////////////////////////////5556static __forceinline Vec2fa load( const void* const a ) {57const float* ptr = (const float*)a;58return Vec2fa(ptr[0],ptr[1]);59}6061static __forceinline Vec2fa loadu( const void* const a ) {62const float* ptr = (const float*)a;63return Vec2fa(ptr[0],ptr[1]);64}6566static __forceinline void storeu ( void* a, const Vec2fa& v ) {67float* ptr = (float*)a;68ptr[0] = v.x; ptr[1] = v.y;69}7071////////////////////////////////////////////////////////////////////////////////72/// Constants73////////////////////////////////////////////////////////////////////////////////7475__forceinline Vec2fa( ZeroTy ) : x(0.0f), y(0.0f) {}76__forceinline Vec2fa( OneTy ) : x(1.0f), y(1.0f) {}77__forceinline Vec2fa( PosInfTy ) : x(+INFINITY), y(+INFINITY) {}78__forceinline Vec2fa( NegInfTy ) : x(-INFINITY), y(-INFINITY) {}7980////////////////////////////////////////////////////////////////////////////////81/// Array Access82////////////////////////////////////////////////////////////////////////////////8384//__forceinline const float& operator []( const size_t index ) const { assert(index < 2); return (&x)[index]; }85//__forceinline float& operator []( const size_t index ) { assert(index < 2); return (&x)[index]; }86};8788////////////////////////////////////////////////////////////////////////////////89/// Unary Operators90////////////////////////////////////////////////////////////////////////////////9192__forceinline Vec2fa operator +( const Vec2fa& a ) { return a; }93__forceinline Vec2fa operator -( const Vec2fa& a ) { return Vec2fa(-a.x,-a.y); }94__forceinline Vec2fa abs ( const Vec2fa& a ) { return Vec2fa(sycl::fabs(a.x),sycl::fabs(a.y)); }95__forceinline Vec2fa sign ( const Vec2fa& a ) { return Vec2fa(sycl::sign(a.x),sycl::sign(a.y)); }9697//__forceinline Vec2fa rcp ( const Vec2fa& a ) { return Vec2fa(sycl::native::recip(a.x),sycl::native::recip(a.y)); }98__forceinline Vec2fa rcp ( const Vec2fa& a ) { return Vec2fa(sycl::native::recip(a.x),sycl::native::recip(a.y)); }99__forceinline Vec2fa sqrt ( const Vec2fa& a ) { return Vec2fa(sycl::sqrt(a.x),sycl::sqrt(a.y)); }100__forceinline Vec2fa sqr ( const Vec2fa& a ) { return Vec2fa(a.x*a.x,a.y*a.y); }101102__forceinline Vec2fa rsqrt( const Vec2fa& a ) { return Vec2fa(sycl::rsqrt(a.x),sycl::rsqrt(a.y)); }103104__forceinline Vec2fa zero_fix(const Vec2fa& a) {105const float x = sycl::fabs(a.x) < min_rcp_input ? min_rcp_input : a.x;106const float y = sycl::fabs(a.y) < min_rcp_input ? min_rcp_input : a.y;107return Vec2fa(x,y);108}109__forceinline Vec2fa rcp_safe(const Vec2fa& a) {110return rcp(zero_fix(a));111}112__forceinline Vec2fa log ( const Vec2fa& a ) {113return Vec2fa(sycl::log(a.x),sycl::log(a.y));114}115116__forceinline Vec2fa exp ( const Vec2fa& a ) {117return Vec2fa(sycl::exp(a.x),sycl::exp(a.y));118}119120////////////////////////////////////////////////////////////////////////////////121/// Binary Operators122////////////////////////////////////////////////////////////////////////////////123124__forceinline Vec2fa operator +( const Vec2fa& a, const Vec2fa& b ) { return Vec2fa(a.x+b.x, a.y+b.y); }125__forceinline Vec2fa operator -( const Vec2fa& a, const Vec2fa& b ) { return Vec2fa(a.x-b.x, a.y-b.y); }126__forceinline Vec2fa operator *( const Vec2fa& a, const Vec2fa& b ) { return Vec2fa(a.x*b.x, a.y*b.y); }127__forceinline Vec2fa operator *( const Vec2fa& a, const float b ) { return a * Vec2fa(b); }128__forceinline Vec2fa operator *( const float a, const Vec2fa& b ) { return Vec2fa(a) * b; }129__forceinline Vec2fa operator /( const Vec2fa& a, const Vec2fa& b ) { return Vec2fa(a.x/b.x, a.y/b.y); }130__forceinline Vec2fa operator /( const Vec2fa& a, const float b ) { return Vec2fa(a.x/b, a.y/b); }131__forceinline Vec2fa operator /( const float a, const Vec2fa& b ) { return Vec2fa(a/b.x, a/b.y); }132133__forceinline Vec2fa min( const Vec2fa& a, const Vec2fa& b ) {134return Vec2fa(sycl::fmin(a.x,b.x), sycl::fmin(a.y,b.y));135}136__forceinline Vec2fa max( const Vec2fa& a, const Vec2fa& b ) {137return Vec2fa(sycl::fmax(a.x,b.x), sycl::fmax(a.y,b.y));138}139140/*141#if defined(__SSE4_1__)142__forceinline Vec2fa mini(const Vec2fa& a, const Vec2fa& b) {143const vint4 ai = _mm_castps_si128(a);144const vint4 bi = _mm_castps_si128(b);145const vint4 ci = _mm_min_epi32(ai,bi);146return _mm_castsi128_ps(ci);147}148#endif149150#if defined(__SSE4_1__)151__forceinline Vec2fa maxi(const Vec2fa& a, const Vec2fa& b) {152const vint4 ai = _mm_castps_si128(a);153const vint4 bi = _mm_castps_si128(b);154const vint4 ci = _mm_max_epi32(ai,bi);155return _mm_castsi128_ps(ci);156}157#endif158159__forceinline Vec2fa pow ( const Vec2fa& a, const float& b ) {160return Vec2fa(powf(a.x,b),powf(a.y,b));161}162*/163164////////////////////////////////////////////////////////////////////////////////165/// Ternary Operators166////////////////////////////////////////////////////////////////////////////////167168__forceinline Vec2fa madd ( const Vec2fa& a, const Vec2fa& b, const Vec2fa& c) { return Vec2fa(madd(a.x,b.x,c.x), madd(a.y,b.y,c.y)); }169__forceinline Vec2fa msub ( const Vec2fa& a, const Vec2fa& b, const Vec2fa& c) { return Vec2fa(msub(a.x,b.x,c.x), msub(a.y,b.y,c.y)); }170__forceinline Vec2fa nmadd ( const Vec2fa& a, const Vec2fa& b, const Vec2fa& c) { return Vec2fa(nmadd(a.x,b.x,c.x), nmadd(a.y,b.y,c.y)); }171__forceinline Vec2fa nmsub ( const Vec2fa& a, const Vec2fa& b, const Vec2fa& c) { return Vec2fa(nmsub(a.x,b.x,c.x), nmsub(a.y,b.y,c.y)); }172173__forceinline Vec2fa madd ( const float a, const Vec2fa& b, const Vec2fa& c) { return madd(Vec2fa(a),b,c); }174__forceinline Vec2fa msub ( const float a, const Vec2fa& b, const Vec2fa& c) { return msub(Vec2fa(a),b,c); }175__forceinline Vec2fa nmadd ( const float a, const Vec2fa& b, const Vec2fa& c) { return nmadd(Vec2fa(a),b,c); }176__forceinline Vec2fa nmsub ( const float a, const Vec2fa& b, const Vec2fa& c) { return nmsub(Vec2fa(a),b,c); }177178////////////////////////////////////////////////////////////////////////////////179/// Assignment Operators180////////////////////////////////////////////////////////////////////////////////181182__forceinline Vec2fa& operator +=( Vec2fa& a, const Vec2fa& b ) { return a = a + b; }183__forceinline Vec2fa& operator -=( Vec2fa& a, const Vec2fa& b ) { return a = a - b; }184__forceinline Vec2fa& operator *=( Vec2fa& a, const Vec2fa& b ) { return a = a * b; }185__forceinline Vec2fa& operator *=( Vec2fa& a, const float b ) { return a = a * b; }186__forceinline Vec2fa& operator /=( Vec2fa& a, const Vec2fa& b ) { return a = a / b; }187__forceinline Vec2fa& operator /=( Vec2fa& a, const float b ) { return a = a / b; }188189////////////////////////////////////////////////////////////////////////////////190/// Reductions191////////////////////////////////////////////////////////////////////////////////192193__forceinline float reduce_add(const Vec2fa& v) { return v.x+v.y; }194__forceinline float reduce_mul(const Vec2fa& v) { return v.x*v.y; }195__forceinline float reduce_min(const Vec2fa& v) { return sycl::fmin(v.x,v.y); }196__forceinline float reduce_max(const Vec2fa& v) { return sycl::fmax(v.x,v.y); }197198////////////////////////////////////////////////////////////////////////////////199/// Comparison Operators200////////////////////////////////////////////////////////////////////////////////201202__forceinline bool operator ==( const Vec2fa& a, const Vec2fa& b ) { return a.x == b.x && a.y == b.y; }203__forceinline bool operator !=( const Vec2fa& a, const Vec2fa& b ) { return a.x != b.x || a.y != b.y; }204205////////////////////////////////////////////////////////////////////////////////206/// Euclidian Space Operators207////////////////////////////////////////////////////////////////////////////////208209__forceinline float dot ( const Vec2fa& a, const Vec2fa& b ) {210return reduce_add(a*b);211}212213__forceinline Vec2fa cross ( const Vec2fa& a ) {214return Vec2fa(-a.y,a.x);215}216217__forceinline float sqr_length ( const Vec2fa& a ) { return dot(a,a); }218__forceinline float rcp_length ( const Vec2fa& a ) { return rsqrt(dot(a,a)); }219__forceinline float rcp_length2( const Vec2fa& a ) { return rcp(dot(a,a)); }220__forceinline float length ( const Vec2fa& a ) { return sqrt(dot(a,a)); }221__forceinline Vec2fa normalize( const Vec2fa& a ) { return a*rsqrt(dot(a,a)); }222__forceinline float distance ( const Vec2fa& a, const Vec2fa& b ) { return length(a-b); }223224////////////////////////////////////////////////////////////////////////////////225/// Select226////////////////////////////////////////////////////////////////////////////////227228__forceinline Vec2fa select( bool s, const Vec2fa& t, const Vec2fa& f ) {229return Vec2fa(s ? t.x : f.x, s ? t.y : f.y);230}231232__forceinline Vec2fa lerp(const Vec2fa& v0, const Vec2fa& v1, const float t) {233return madd(1.0f-t,v0,t*v1);234}235236__forceinline int maxDim ( const Vec2fa& a )237{238const Vec2fa b = abs(a);239if (b.x > b.y) return 0;240else return 1;241}242243////////////////////////////////////////////////////////////////////////////////244/// Rounding Functions245////////////////////////////////////////////////////////////////////////////////246247__forceinline Vec2fa trunc( const Vec2fa& a ) { return Vec2fa(sycl::trunc(a.x),sycl::trunc(a.y)); }248__forceinline Vec2fa floor( const Vec2fa& a ) { return Vec2fa(sycl::floor(a.x),sycl::floor(a.y)); }249__forceinline Vec2fa ceil ( const Vec2fa& a ) { return Vec2fa(sycl::ceil (a.x),sycl::ceil (a.y)); }250251////////////////////////////////////////////////////////////////////////////////252/// Output Operators253////////////////////////////////////////////////////////////////////////////////254255inline embree_ostream operator<<(embree_ostream cout, const Vec2fa& a) {256return cout << "(" << a.x << ", " << a.y << ")";257}258259/*template<>260__forceinline vfloat_impl<4>::vfloat_impl(const Vec2fa& a)261{262v = 0;263const unsigned int lid = get_sub_group_local_id();264if (lid == 0) v = a.x;265if (lid == 1) v = a.y;266}*/267268typedef Vec2fa Vec2fa_t;269}270271272