Context Navigation

← Previous Change
Next Change →

mul.c

Timestamp:

2011-08-06T07:04:50Z (13 years ago)

Author:

Petr Koupy <petr.koupy@…>

Branches:

lfn, master, serial, ticket/834-toolchain-update, topic/msim-upgrade, topic/simplify-dev-export

Children:

d3e241a, e0e922d

Parents:

9a6034a

Message:

Quadruple-precision softfloat, coding style improvements. Details below…

Highlights:

completed double-precision support
added quadruple-precision support
added SPARC quadruple-precision wrappers
added doxygen comments
corrected and unified coding style

Current state of the softfloat library:

Support for single, double and quadruple precision is currently almost complete (apart from power, square root, complex multiplication and complex division) and provides the same set of features (i.e. the support for all three precisions is now aligned). In order to extend softfloat library consistently, addition of quadruple precision was done in the same spirit as already existing single and double precision written by Josef Cejka in 2006 - that is relaxed standard-compliance for corner cases while mission-critical code sections heavily inspired by the widely used softfloat library written by John R. Hauser (although I personally think it would be more appropriate for HelenOS to use something less optimized, shorter and more readable).

Most of the quadruple-precision code is just an adapted double-precision code to work on 128-bit variables. That means if there is TODO, FIXME or some defect in single or double-precision code, it is most likely also in the quadruple-precision code. Please note that quadruple-precision functions are currently not tested - it is challenging task for itself, especially when the ports that use them are either not finished (mips64) or badly supported by simulators (sparc64). To test whole softfloat library, one would probably have to either write very non-trivial native tester, or use some existing one (e.g. TestFloat from J. R. Hauser) and port it to HelenOS (or rip the softfloat library out of HelenOS and test it on a host system). At the time of writing this, the code dependent on quadruple-precision functions (on mips64 and sparc64) is just a libposix strtold() function (and its callers, most notably scanf backend).

File:

: 1 edited

uspace/lib/softfloat/generic/mul.c (modified) (15 diffs)

Legend:

: Unmodified
: Added
: Removed

uspace/lib/softfloat/generic/mul.c

-              r9a6034a
+              rc67aff2
 /*
  * Copyright (c) 2005 Josef Cejka
+ * Copyright (c) 2011 Petr Koupy
  * All rights reserved.
+ *
 …
  * @{
  */
 /** @file
+/** @file Multiplication functions.
  */
 …
 #include <common.h>
+/** Multiply two 32 bit float numbers
+ *
+/**
+ * Multiply two single-precision floats.
+ *
+ * @param a First input operand.
+ * @param b Second input operand.
+ * @return Result of multiplication.
  */
 float32 mulFloat32(float32 a, float32 b)
 …
         result.parts.sign = a.parts.sign ^ b.parts.sign;
         if (isFloat32NaN(a) || isFloat32NaN(b) ) {
+        if (isFloat32NaN(a) || isFloat32NaN(b)) {
                 /* TODO: fix SigNaNs */
                 if (isFloat32SigNaN(a)) {
 …
                         result.parts.exp = a.parts.exp;
                         return result;
                 };
+                }
                 if (isFloat32SigNaN(b)) { /* TODO: fix SigNaN */
                         result.parts.fraction = b.parts.fraction;
                         result.parts.exp = b.parts.exp;
                         return result;
                 };
+                }
                 /* set NaN as result */
                 result.binary = FLOAT32_NAN;
                 return result;
         };
+        }
         if (isFloat32Infinity(a)) {
 …
                 result.parts.sign = a.parts.sign ^ b.parts.sign;
                 return result;
         };
+        }
         if (exp < 0) {
 …
                 result.parts.exp = 0x0;
                 return result;
         };
+        }
         frac1 = a.parts.fraction;
 …
         } else {
                 ++exp;
         };
+        }
         frac2 = b.parts.fraction;
 …
         } else {
                 ++exp;
         };
+        }
         frac1 <<= 1; /* one bit space for rounding */
         frac1 = frac1 * frac2;
+/* round and return */
         while ((exp < FLOAT32_MAX_EXPONENT) && (frac1 >= ( 1 << (FLOAT32_FRACTION_SIZE + 2)))) {
                 /* 23 bits of fraction + one more for hidden bit (all shifted 1 bit left)*/
+        /* round and return */
+        while ((exp < FLOAT32_MAX_EXPONENT) && (frac1 >= (1 << (FLOAT32_FRACTION_SIZE + 2)))) {
+                /* 23 bits of fraction + one more for hidden bit (all shifted 1 bit left) */
                 ++exp;
                 frac1 >>= 1;
         };
+        }
         /* rounding */
 …
                 ++exp;
                 frac1 >>= 1;
         };
         if (exp >= FLOAT32_MAX_EXPONENT ) {
+        }
+        if (exp >= FLOAT32_MAX_EXPONENT) {
                 /* TODO: fix overflow */
                 /* return infinity*/
 …
                         frac1 >>= 1;
                         ++exp;
                 };
+                }
                 if (frac1 == 0) {
                         /* FIXME : underflow */
                 result.parts.exp = 0;
                 result.parts.fraction = 0;
                 return result;
                 };
         };
+                        result.parts.exp = 0;
+                        result.parts.fraction = 0;
+                        return result;
+                }
+        }
         result.parts.exp = exp;
         result.parts.fraction = frac1 & ( (1 << FLOAT32_FRACTION_SIZE) - 1);
+        result.parts.fraction = frac1 & ((1 << FLOAT32_FRACTION_SIZE) - 1);
         return result;
+}
+/** Multiply two 64 bit float numbers
+ *
+/**
+ * Multiply two double-precision floats.
+ *
+ * @param a First input operand.
+ * @param b Second input operand.
+ * @return Result of multiplication.
  */
 float64 mulFloat64(float64 a, float64 b)
 …
         result.parts.sign = a.parts.sign ^ b.parts.sign;
         if (isFloat64NaN(a) || isFloat64NaN(b) ) {
+        if (isFloat64NaN(a) || isFloat64NaN(b)) {
                 /* TODO: fix SigNaNs */
                 if (isFloat64SigNaN(a)) {
 …
                         result.parts.exp = a.parts.exp;
                         return result;
                 };
+                }
                 if (isFloat64SigNaN(b)) { /* TODO: fix SigNaN */
                         result.parts.fraction = b.parts.fraction;
                         result.parts.exp = b.parts.exp;
                         return result;
                 };
+                }
                 /* set NaN as result */
                 result.binary = FLOAT64_NAN;
                 return result;
         };
+        }
         if (isFloat64Infinity(a)) {
 …
         } else {
                 ++exp;
         };
+        }
         frac2 = b.parts.fraction;
 …
         } else {
                 ++exp;
         };
+        }
         frac1 <<= (64 - FLOAT64_FRACTION_SIZE - 1);
         frac2 <<= (64 - FLOAT64_FRACTION_SIZE - 2);
         mul64integers(frac1, frac2, &frac1, &frac2);
         frac2 |= (frac1 != 0);
         if (frac2 & (0x1ll << 62)) {
                 frac2 <<= 1;
+        mul64(frac1, frac2, &frac1, &frac2);
+        frac1 |= (frac2 != 0);
+        if (frac1 & (0x1ll << 62)) {
+                frac1 <<= 1;
                 exp--;
+        }
         result = finishFloat64(exp, frac2, result.parts.sign);
+        result = finishFloat64(exp, frac1, result.parts.sign);
         return result;
+}
+/** Multiply two 64 bit numbers and return result in two parts
+ * @param a first operand
+ * @param b second operand
+ * @param lo lower part from result
+ * @param hi higher part of result
+ */
+void mul64integers(uint64_t a,uint64_t b, uint64_t *lo, uint64_t *hi)
+/**
+ * Multiply two quadruple-precision floats.
+ *
+ * @param a First input operand.
+ * @param b Second input operand.
+ * @return Result of multiplication.
+ */
+float128 mulFloat128(float128 a, float128 b)
+{
+        uint64_t low, high, middle1, middle2;
+        uint32_t alow, blow;
+        alow = a & 0xFFFFFFFF;
+        blow = b & 0xFFFFFFFF;
+        a >>= 32;
+        b >>= 32;
+        low = ((uint64_t)alow) * blow;
+        middle1 = a * blow;
+        middle2 = alow * b;
+        high = a * b;
+        middle1 += middle2;
+        high += (((uint64_t)(middle1 < middle2)) << 32) + (middle1 >> 32);
+        middle1 <<= 32;
+        low += middle1;
+        high += (low < middle1);
+        *lo = low;
+        *hi = high;
+        return;
+        float128 result;
+        uint64_t frac1_hi, frac1_lo, frac2_hi, frac2_lo, tmp_hi, tmp_lo;
+        int32_t exp;
+        result.parts.sign = a.parts.sign ^ b.parts.sign;
+        if (isFloat128NaN(a) || isFloat128NaN(b)) {
+                /* TODO: fix SigNaNs */
+                if (isFloat128SigNaN(a)) {
+                        result.parts.frac_hi = a.parts.frac_hi;
+                        result.parts.frac_lo = a.parts.frac_lo;
+                        result.parts.exp = a.parts.exp;
+                        return result;
+                }
+                if (isFloat128SigNaN(b)) { /* TODO: fix SigNaN */
+                        result.parts.frac_hi = b.parts.frac_hi;
+                        result.parts.frac_lo = b.parts.frac_lo;
+                        result.parts.exp = b.parts.exp;
+                        return result;
+                }
+                /* set NaN as result */
+                result.binary.hi = FLOAT128_NAN_HI;
+                result.binary.lo = FLOAT128_NAN_LO;
+                return result;
+        }
+        if (isFloat128Infinity(a)) {
+                if (isFloat128Zero(b)) {
+                        /* FIXME: zero * infinity */
+                        result.binary.hi = FLOAT128_NAN_HI;
+                        result.binary.lo = FLOAT128_NAN_LO;
+                        return result;
+                }
+                result.parts.frac_hi = a.parts.frac_hi;
+                result.parts.frac_lo = a.parts.frac_lo;
+                result.parts.exp = a.parts.exp;
+                return result;
+        }
+        if (isFloat128Infinity(b)) {
+                if (isFloat128Zero(a)) {
+                        /* FIXME: zero * infinity */
+                        result.binary.hi = FLOAT128_NAN_HI;
+                        result.binary.lo = FLOAT128_NAN_LO;
+                        return result;
+                }
+                result.parts.frac_hi = b.parts.frac_hi;
+                result.parts.frac_lo = b.parts.frac_lo;
+                result.parts.exp = b.parts.exp;
+                return result;
+        }
+        /* exp is signed so we can easy detect underflow */
+        exp = a.parts.exp + b.parts.exp - FLOAT128_BIAS - 1;
+        frac1_hi = a.parts.frac_hi;
+        frac1_lo = a.parts.frac_lo;
+        if (a.parts.exp > 0) {
+                or128(frac1_hi, frac1_lo,
+                FLOAT128_HIDDEN_BIT_MASK_HI, FLOAT128_HIDDEN_BIT_MASK_LO,
+                &frac1_hi, &frac1_lo);
+        } else {
+                ++exp;
+        }
+        frac2_hi = b.parts.frac_hi;
+        frac2_lo = b.parts.frac_lo;
+        if (b.parts.exp > 0) {
+                or128(frac2_hi, frac2_lo,
+                    FLOAT128_HIDDEN_BIT_MASK_HI, FLOAT128_HIDDEN_BIT_MASK_LO,
+                    &frac2_hi, &frac2_lo);
+        } else {
+                ++exp;
+        }
+        lshift128(frac2_hi, frac2_lo,
+- FLOAT128_FRACTION_SIZE, &frac2_hi, &frac2_lo);
+        tmp_hi = frac1_hi;
+        tmp_lo = frac1_lo;
+        mul128(frac1_hi, frac1_lo, frac2_hi, frac2_lo,
+            &frac1_hi, &frac1_lo, &frac2_hi, &frac2_lo);
+        add128(frac1_hi, frac1_lo, tmp_hi, tmp_lo, &frac1_hi, &frac1_lo);
+        frac2_hi |= (frac2_lo != 0x0ll);
+        if ((FLOAT128_HIDDEN_BIT_MASK_HI << 1) <= frac1_hi) {
+                frac2_hi >>= 1;
+                if (frac1_lo & 0x1ll) {
+                        frac2_hi |= (0x1ull < 64);
+                }
+                rshift128(frac1_hi, frac1_lo, 1, &frac1_hi, &frac1_lo);
+                ++exp;
+        }
+        result = finishFloat128(exp, frac1_hi, frac1_lo, result.parts.sign, frac2_hi);
+        return result;
+}

Note: See TracChangeset for help on using the changeset viewer.

Context Navigation

Changeset c67aff2 in mainline for uspace/lib/softfloat/generic/mul.c

Legend:

uspace/lib/softfloat/generic/mul.c

Download in other formats: