Blame - src/ieee754.h - mirror/QCBOR - TrustedFirmware Git Browser

blob: 47bfea56affe7ff9ecea30cfa20287814eb35714 [file] [log] [blame]

Laurence Lundblade	cc2ed34	2018-09-22 17:29:55 -0700	[diff] [blame]	1	/*==============================================================================
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	2	ieee754.c -- floating-point conversion between half, double & single-precision
Laurence Lundblade	035bd78	2019-01-21 17:01:31 -0800	[diff] [blame]	3
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	4	Copyright (c) 2018-2020, Laurence Lundblade. All rights reserved.
Laurence Lundblade	035bd78	2019-01-21 17:01:31 -0800	[diff] [blame]	5
Laurence Lundblade	a3fd49f	2019-01-21 10:16:22 -0800	[diff] [blame]	6	SPDX-License-Identifier: BSD-3-Clause
Laurence Lundblade	035bd78	2019-01-21 17:01:31 -0800	[diff] [blame]	7
Laurence Lundblade	a3fd49f	2019-01-21 10:16:22 -0800	[diff] [blame]	8	See BSD-3-Clause license in README.md
Laurence Lundblade	035bd78	2019-01-21 17:01:31 -0800	[diff] [blame]	9
Laurence Lundblade	a3fd49f	2019-01-21 10:16:22 -0800	[diff] [blame]	10	Created on 7/23/18
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	11	=============================================================================*/
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	12
Laurence Lundblade	9682a53	2020-06-06 18:33:04 -0700	[diff] [blame^]	13	#ifndef QCBOR_CONFIG_DISABLE_ENCODE_IEEE754
				14
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	15	#ifndef ieee754_h
				16	#define ieee754_h
				17
				18	#include <stdint.h>
				19
				20
Laurence Lundblade	8db3d3e	2018-09-29 11:46:37 -0700	[diff] [blame]	21
				22	/*
				23	General comments
Laurence Lundblade	3aee3a3	2018-12-17 16:17:45 -0800	[diff] [blame]	24
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	25	This is a complete in that it handles all conversion cases including
				26	+/- infinity, +/- zero, subnormal numbers, qNaN, sNaN and NaN
				27	payloads.
Laurence Lundblade	3aee3a3	2018-12-17 16:17:45 -0800	[diff] [blame]	28
Laurence Lundblade	c5fef68	2020-01-25 11:38:45 -0800	[diff] [blame]	29	This conforms to IEEE 754-2008, but note that this doesn't specify
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	30	conversions, just the encodings.
Laurence Lundblade	3aee3a3	2018-12-17 16:17:45 -0800	[diff] [blame]	31
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	32	NaN payloads are preserved with alignment on the LSB. The qNaN bit is
				33	handled differently and explicity copied. It is always the MSB of the
				34	significand. The NaN payload MSBs (except the qNaN bit) are truncated
				35	when going from double or single to half.
Laurence Lundblade	3aee3a3	2018-12-17 16:17:45 -0800	[diff] [blame]	36
Laurence Lundblade	8db3d3e	2018-09-29 11:46:37 -0700	[diff] [blame]	37	TODO: what does the C cast do with NaN payloads from
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	38	double to single? It probably depends entirely on the
				39	CPU.
Laurence Lundblade	3aee3a3	2018-12-17 16:17:45 -0800	[diff] [blame]	40
Laurence Lundblade	8db3d3e	2018-09-29 11:46:37 -0700	[diff] [blame]	41	*/
				42
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	43	/*
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	44	Most simply just explicilty encode the type you want, single or
				45	double. This works easily everywhere since standard C supports both
				46	these types and so does qcbor. This encoder also supports half
				47	precision and there's a few ways to use it to encode floating-point
				48	numbers in less space.
Laurence Lundblade	3aee3a3	2018-12-17 16:17:45 -0800	[diff] [blame]	49
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	50	Without losing precision, you can encode a single or double such that
				51	the special values of 0, NaN and Infinity encode as half-precision.
				52	This CBOR decodoer and most others should handle this properly.
Laurence Lundblade	3aee3a3	2018-12-17 16:17:45 -0800	[diff] [blame]	53
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	54	If you don't mind losing precision, then you can use half-precision.
				55	One way to do this is to set up your environment to use
				56	___fp_16. Some compilers and CPUs support it even though it is not
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	57	standard C. What is nice about this is that your program will use
				58	less memory and floating-point operations like multiplying, adding
				59	and such will be faster.
Laurence Lundblade	3aee3a3	2018-12-17 16:17:45 -0800	[diff] [blame]	60
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	61	Another way to make use of half-precision is to represent the values
				62	in your program as single or double, but encode them in CBOR as
				63	half-precision. This cuts the size of the encoded messages by 2 or 4,
				64	but doesn't reduce memory needs or speed because you are still using
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	65	single or double in your code.
Laurence Lundblade	3aee3a3	2018-12-17 16:17:45 -0800	[diff] [blame]	66
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	67	*/
				68
Laurence Lundblade	8db3d3e	2018-09-29 11:46:37 -0700	[diff] [blame]	69
				70
				71	/*
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	72	Convert single-precision float to half-precision float. Precision
				73	and NaN payload bits will be lost. Too-large values will round up to
				74	infinity and too small to zero.
Laurence Lundblade	8db3d3e	2018-09-29 11:46:37 -0700	[diff] [blame]	75	*/
Laurence Lundblade	cc2ed34	2018-09-22 17:29:55 -0700	[diff] [blame]	76	uint16_t IEEE754_FloatToHalf(float f);
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	77
Laurence Lundblade	8db3d3e	2018-09-29 11:46:37 -0700	[diff] [blame]	78
				79	/*
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	80	Convert half-precision float to single-precision float. This is a
				81	loss-less conversion.
Laurence Lundblade	8db3d3e	2018-09-29 11:46:37 -0700	[diff] [blame]	82	*/
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	83	float IEEE754_HalfToFloat(uint16_t uHalfPrecision);
				84
Laurence Lundblade	8db3d3e	2018-09-29 11:46:37 -0700	[diff] [blame]	85
				86	/*
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	87	Convert double-precision float to half-precision float. Precision
				88	and NaN payload bits will be lost. Too-large values will round up to
				89	infinity and too small to zero.
Laurence Lundblade	8db3d3e	2018-09-29 11:46:37 -0700	[diff] [blame]	90	*/
Laurence Lundblade	cc2ed34	2018-09-22 17:29:55 -0700	[diff] [blame]	91	uint16_t IEEE754_DoubleToHalf(double d);
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	92
Laurence Lundblade	8db3d3e	2018-09-29 11:46:37 -0700	[diff] [blame]	93
				94	/*
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	95	Convert half-precision float to double-precision float.
Laurence Lundblade	8db3d3e	2018-09-29 11:46:37 -0700	[diff] [blame]	96	This is a loss-less conversion.
				97	*/
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	98	double IEEE754_HalfToDouble(uint16_t uHalfPrecision);
				99
				100
Laurence Lundblade	9682a53	2020-06-06 18:33:04 -0700	[diff] [blame^]	101	/*
				102	Convert float to double-precision without using any
				103	floating-point HW or compiler-supplied SW.
				104	This is a loss-less conversion.
				105	*/
				106	double IEEE754_FloatToDouble(float f);
				107
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	108
Laurence Lundblade	577d821	2018-11-01 14:04:08 +0700	[diff] [blame]	109	// Both tags the value and gives the size
				110	#define IEEE754_UNION_IS_HALF 2
				111	#define IEEE754_UNION_IS_SINGLE 4
				112	#define IEEE754_UNION_IS_DOUBLE 8
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	113
				114	typedef struct {
Laurence Lundblade	577d821	2018-11-01 14:04:08 +0700	[diff] [blame]	115	uint8_t uSize; // One of IEEE754_IS_xxxx
				116	uint64_t uValue;
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	117	} IEEE754_union;
				118
				119
Laurence Lundblade	8db3d3e	2018-09-29 11:46:37 -0700	[diff] [blame]	120	/*
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	121	Converts double-precision to single-precision or half-precision if
				122	possible without loss of precisions. If not, leaves it as a
				123	double. Only converts to single-precision unless bAllowHalfPrecision
				124	is set.
Laurence Lundblade	8db3d3e	2018-09-29 11:46:37 -0700	[diff] [blame]	125	*/
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	126	IEEE754_union IEEE754_DoubleToSmallestInternal(double d, int bAllowHalfPrecision);
				127
				128	/*
Laurence Lundblade	8db3d3e	2018-09-29 11:46:37 -0700	[diff] [blame]	129	Converts double-precision to single-precision if possible without
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	130	loss of precision. If not, leaves it as a double.
				131	*/
				132	static inline IEEE754_union IEEE754_DoubleToSmall(double d)
				133	{
				134	return IEEE754_DoubleToSmallestInternal(d, 0);
				135	}
				136
				137
				138	/*
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	139	Converts double-precision to single-precision or half-precision if
				140	possible without loss of precisions. If not, leaves it as a double.
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	141	*/
				142	static inline IEEE754_union IEEE754_DoubleToSmallest(double d)
				143	{
				144	return IEEE754_DoubleToSmallestInternal(d, 1);
				145	}
				146
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	147
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	148	/*
Laurence Lundblade	ee85174	2020-01-08 08:37:05 -0800	[diff] [blame]	149	Converts single-precision to half-precision if possible without loss
				150	of precision. If not leaves as single-precision.
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	151	*/
				152	IEEE754_union IEEE754_FloatToSmallest(float f);
				153
				154
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	155	#endif /* ieee754_h */
				156
				157
Laurence Lundblade	9682a53	2020-06-06 18:33:04 -0700	[diff] [blame^]	158	#endif /* QCBOR_CONFIG_DISABLE_ENCODE_IEEE754 */
Laurence Lundblade	12d32c5	2018-09-19 11:25:27 -0700	[diff] [blame]	159
				160
				161
				162