Skip to content

Commit dcbf835

Browse files
committed
<stdfloat> : 残りを書いた #1022
1 parent 4818ff7 commit dcbf835

File tree

7 files changed

+820
-24
lines changed

7 files changed

+820
-24
lines changed

GLOBAL_QUALIFY_LIST.txt

+5
Original file line numberDiff line numberDiff line change
@@ -167,6 +167,11 @@
167167
* <stack>[link /reference/stack.md]
168168
* <stacktrace>[link /reference/stacktrace.md]
169169
* <stdexcept>[link /reference/stdexcept.md]
170+
* <stdfloat>[link /reference/stdfloat.md]
171+
* std::bfloat16_t[link /reference/stdfloat/bfloat16_t.md]
172+
* std::float16_t[link /reference/stdfloat/float16_t.md]
173+
* std::float32_t[link /reference/stdfloat/float32_t.md]
174+
* std::float64_t[link /reference/stdfloat/float64_t.md]
170175
* <stop_token>[link /reference/stop_token.md]
171176
* <streambuf>[link /reference/streambuf.md]
172177
* <string>[link /reference/string.md]

reference/stdfloat.md

+4-4
Original file line numberDiff line numberDiff line change
@@ -10,10 +10,10 @@
1010
| 名前 | 説明 | 対応バージョン |
1111
|------|------|----------------|
1212
| [`float16_t`](stdfloat/float16_t.md) | 16ビット半精度の浮動小数点数型 | C++23 |
13-
| [`float32_t`](stdfloat/float32_t.md.nolink) | 32ビット単精度の浮動小数点数型 | C++23 |
14-
| [`float64_t`](stdfloat/float64_t.md.nolink) | 64ビット倍精度の浮動小数点数型 | C++23 |
15-
| [`float128_t`](stdfloat/float128_t.md.nolink) | 128ビット四倍精度の浮動小数点数型 | C++23 |
16-
| [`bfloat16_t`](stdfloat/bfloat16_t.md.nolink) | 16ビットのbrain floating point型 | C++23 |
13+
| [`float32_t`](stdfloat/float32_t.md) | 32ビット単精度の浮動小数点数型 | C++23 |
14+
| [`float64_t`](stdfloat/float64_t.md) | 64ビット倍精度の浮動小数点数型 | C++23 |
15+
| [`float128_t`](stdfloat/float128_t.md) | 128ビット四倍精度の浮動小数点数型 | C++23 |
16+
| [`bfloat16_t`](stdfloat/bfloat16_t.md) | 16ビットのbrain floating point型 | C++23 |
1717

1818

1919
## バージョン

reference/stdfloat/bfloat16_t.md

+187
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,187 @@
1+
# bfloat16_t
2+
* stdfloat[meta header]
3+
* std[meta namespace]
4+
* type-alias[meta id-type]
5+
* cpp23[meta cpp]
6+
7+
```cpp
8+
namespace std {
9+
#if defined(__STDCPP_BFLOAT16_T__)
10+
using bfloat16_t = implementation-defined;
11+
#endif
12+
}
13+
```
14+
15+
## 概要
16+
16ビットのbrain floating point型。
17+
18+
19+
### 内部表現
20+
この型はISO/IEC/IEEE 60559 (IEEE 754) にはない16ビットの浮動小数点数型である。
21+
22+
Google社のTPUや、NVIDIAのGPUなどで採用されている内部表現をもつ。
23+
24+
| 型 | 符号ビット数 | 指数ビット数 | 仮数ビット数 | 最大指数 |
25+
|--------------|--------------|--------------|--------------|----------|
26+
| `bfloat16_t` | 1 | 8 | 7 | 127 |
27+
| `float16_t` | 1 | 5 | 10 | 15 |
28+
29+
30+
### リテラル
31+
値にサフィックスとして`bf16`もしくは`BF16`を指定することで、`std::bfloat16_t`のリテラルとすることができる。
32+
33+
```cpp
34+
std::bfloat16_t a = 1.0bf16;
35+
std::bfloat16_t b = 2.0BF16;
36+
```
37+
38+
39+
### 事前定義マクロ
40+
- この型は、事前定義マクロ`__STDCPP_BFLOAT16_T__`が定義されない場合、定義されない
41+
42+
43+
### 順位
44+
浮動小数点数の変換で使用される順位 (rank) は、以下のように定義される:
45+
46+
- `long double` > `double` > `float`のように、`long double`が最も高い順位をもつ
47+
- 同じ値集合をもつ2つの拡張浮動小数点数型は、同じ順位をもつ
48+
- 標準浮動小数点数型と同じ値集合をもつ拡張浮動小数点数型は、同じ順位をもつ
49+
- 標準浮動小数点数型より多くの値集合をもつ拡張浮動小数点数型は、`double`と同じ順位をもつ
50+
51+
注意として、浮動小数点数型`T1`の値集合が浮動小数点数型`T2`の値集合の部分集合でも上位集合でもない場合、浮動小数点数型`T1``T2`の変換順位は順位通りではない。これは、一方の型が他方より大きな範囲と低い精度の両方を持つ場合に起こり得る。
52+
53+
順位が同じ浮動小数点数型は、サブ順位 (subrank) で順序付けられる。拡張浮動小数点数は、標準浮動小数点数型よりも大きなサブ順位をもつ。
54+
55+
56+
### 昇格と変換
57+
C言語の名残と後方互換性のために、オーバーロード解決での`float`から`double`への変換は昇格と見なされるが、ほかの浮動小数点数型では昇格はない。
58+
59+
2つの浮動小数点型の少なくとも一方が拡張浮動小数点型である場合、変換先の型が変換元の型より大きいか等しい場合にのみ、2つの浮動小数点型間の変換が暗黙的に行われる。いかなる暗黙の変換も損失なく、値を正確に保持する。潜在的に損失のある変換はすべて明示的でなければならない。
60+
61+
小さい精度への変換は、`()``{}`による直接初期化、もしくは明示的なキャストのみ許可される。
62+
63+
```cpp
64+
void f(std::float16_t);
65+
void g() {
66+
std::float16_t a = 1.0; // エラー!小さい精度への暗黙変換はできない
67+
std::float16_t b(2.0); // OK : 直接初期化
68+
std::float16_t c{3.0}; // OK : 直接初期化
69+
a = 4.0; // エラー!小さい精度への暗黙変換はできない
70+
f(5.0); // エラー!小さい精度への暗黙変換はできない
71+
f(static_cast<std::float16_t>(5.0)); // OK : 明示的なキャスト
72+
}
73+
```
74+
75+
76+
### 通常の算術変換
77+
算術演算での型変換は、以下のような規則で行われる。
78+
79+
- どちらかのオペランドが浮動小数点数型である場合、
80+
- 両方のオペランドが同じ型であれば、型変換は行われない
81+
- そうでなく、オペランドの一方が浮動小数点数型でなければ、浮動小数点数型のオペランドの型に変換される
82+
- そうでなく、オペランドの浮動小数点数型の変換順位が等しくない場合、小さい方の順位をもつ浮動小数点数型は、もう一方の浮動小数点数型に変換される
83+
- `float + double`は`double`に、`std::float16_t + float`は`float`に変換される
84+
- そうでなく、変換順位が等しい場合、サブ順位で比較が行われ、より大きいサブ順位をもつ浮動小数点数型に変換される
85+
- `float + std::float32_t`は`std::float32_t`に変換される
86+
- そうでなければ、式は不適格となる
87+
- `std::float16_t + std::bfloat16_t`は不適格
88+
89+
```cpp example
90+
#include <stdfloat>
91+
#include <type_traits>
92+
93+
int main() {
94+
float f32 = 1.0;
95+
std::float16_t f16{2.0};
96+
std::bfloat16_t b16{3.0};
97+
std::float32_t f32b{4.0};
98+
99+
auto r1 = f32 + f16; // OK : f16は`float`に変換され、結果の型は`float`となる
100+
auto r2 = f32 + b16; // OK : b16は`float`に変換され、結果の型は`float`となる
101+
//auto r3 = f16 + b16; // エラー!どちらの型も算術変換でもう一方の型に変換できない
102+
auto r4 = f32 + f32b; // OK : f32はより大きいサブ順位をもつ`std::float32_t`に変換される
103+
static_assert(std::is_same_v<decltype(r4), std::float32_t>);
104+
}
105+
```
106+
107+
### オーバーロード解決
108+
- 浮動小数点数型の変換をともなうオーバーロード解決は、値を維持する変換が優先され、同じ変換順位をもつ他の浮動小数点数型への変換が優先して行われる
109+
- 値を維持する変換が曖昧な場合、プログラムは不適格となる
110+
111+
```cpp
112+
#include <stdfloat>
113+
114+
void f(std::float32_t) {}
115+
void f(std::float64_t) {}
116+
void f(long long) {}
117+
118+
int main() {
119+
float x;
120+
std::float16_t y;
121+
f(x); // f(std::float32_t)が呼び出される。
122+
// floatとstd::float32_tが同じ変換順位をもつ
123+
//f(y); // エラー!曖昧。変換順位が等しいオーバーロードが見つからない
124+
}
125+
```
126+
127+
128+
129+
## 備考
130+
- この型は、C23で定義されるオプションキーワード`_Float16`の別名として定義されることになるだろう
131+
- この型は、`_Float16`と相互運用できることが望ましい
132+
133+
134+
## 例
135+
```cpp example
136+
#include <iostream>
137+
#include <stdfloat>
138+
#include <cmath>
139+
140+
int main() {
141+
std::bfloat16_t a = 1.0bf16;
142+
auto b = 2.0f32; // bの型はstd::float32_t
143+
144+
// 明示的型変換によって、
145+
// float16_tとの間の変換ができる
146+
auto aa = static_cast<std::float16_t>(a);
147+
148+
// aはより大きい精度の型float32_tに変換される
149+
auto c = a + b; // cの型はstd::float32_t
150+
151+
// 精度を落とす縮小変換は明示的型変換で行う。
152+
// 拡張浮動小数点数型は数学関数にも渡すことができ、
153+
// 標準浮動小数点数型への暗黙変換もできる
154+
double d = std::log(static_cast<std::bfloat16_t>(c));
155+
156+
// 同じ精度の浮動小数点数型との間で、精度を落とさず変換でき、
157+
// coutでも拡張浮動小数点数のまま出力できる
158+
std::cout << static_cast<std::float64_t>(d) << std::endl;
159+
}
160+
```
161+
* std::log[link /reference/cmath/log.md]
162+
163+
### 出力
164+
```
165+
1.10156
166+
```
167+
168+
## バージョン
169+
### 言語
170+
- C++23
171+
172+
### 処理系
173+
- [Clang](/implementation.md#clang): ??
174+
- [GCC](/implementation.md#gcc): 13.1
175+
- [Visual C++](/implementation.md#visual_cpp): ??
176+
177+
178+
## 関連項目
179+
- [`std::float16_t`](float16_t.md)
180+
- [`std::float32_t`](float32_t.md)
181+
- [`std::float64_t`](float64_t.md)
182+
- [`std::float128_t`](float128_t.md)
183+
184+
185+
## 参照
186+
- [P1467R9 Extended floating-point types and standard names](https://www.open-std.org/jtc1/sc22/wg21/docs/papers/2022/p1467r9.html)
187+

reference/stdfloat/float128_t.md

+179
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,179 @@
1+
# float128_t
2+
* stdfloat[meta header]
3+
* std[meta namespace]
4+
* type-alias[meta id-type]
5+
* cpp23[meta cpp]
6+
7+
```cpp
8+
namespace std {
9+
#if defined(__STDCPP_FLOAT128_T__)
10+
using float128_t = implementation-defined;
11+
#endif
12+
}
13+
```
14+
15+
## 概要
16+
128ビット四倍精度の浮動小数点数型。
17+
18+
### 内部表現
19+
この型は、ISO/IEC/IEEE 60559 (IEEE 754) 浮動小数点数規格のbinary128フォーマットをもつ。
20+
21+
| 符号ビット数 | 指数ビット数 | 仮数ビット数 | 最大指数 |
22+
|--------------|--------------|--------------|----------|
23+
| 1 | 15 | 112 | 16383 |
24+
25+
### リテラル
26+
値にサフィックスとして`f128`もしくは`F128`を指定することで、`std::float128_t`のリテラルとすることができる。
27+
28+
```cpp
29+
std::float128_t a = 1.0f128;
30+
std::float128_t b = 2.0F128;
31+
```
32+
33+
34+
### 事前定義マクロ
35+
- この型は、事前定義マクロ`__STDCPP_FLOAT128_T__`が定義されない場合、定義されない
36+
- ISO/IEC/IEEE 60559 (IEEE 754) のbinary128フォーマットが実装される環境でこのマクロは定義される
37+
38+
39+
### 順位
40+
浮動小数点数の変換で使用される順位 (rank) は、以下のように定義される:
41+
42+
- `long double` > `double` > `float`のように、`long double`が最も高い順位をもつ
43+
- 同じ値集合をもつ2つの拡張浮動小数点数型は、同じ順位をもつ
44+
- 標準浮動小数点数型と同じ値集合をもつ拡張浮動小数点数型は、同じ順位をもつ
45+
- 標準浮動小数点数型より多くの値集合をもつ拡張浮動小数点数型は、`double`と同じ順位をもつ
46+
47+
注意として、浮動小数点数型`T1`の値集合が浮動小数点数型`T2`の値集合の部分集合でも上位集合でもない場合、浮動小数点数型`T1``T2`の変換順位は順位通りではない。これは、一方の型が他方より大きな範囲と低い精度の両方を持つ場合に起こり得る。
48+
49+
順位が同じ浮動小数点数型は、サブ順位 (subrank) で順序付けられる。拡張浮動小数点数は、標準浮動小数点数型よりも大きなサブ順位をもつ。
50+
51+
52+
### 昇格と変換
53+
C言語の名残と後方互換性のために、オーバーロード解決での`float`から`double`への変換は昇格と見なされるが、ほかの浮動小数点数型では昇格はない。
54+
55+
2つの浮動小数点型の少なくとも一方が拡張浮動小数点型である場合、変換先の型が変換元の型より大きいか等しい場合にのみ、2つの浮動小数点型間の変換が暗黙的に行われる。いかなる暗黙の変換も損失なく、値を正確に保持する。潜在的に損失のある変換はすべて明示的でなければならない。
56+
57+
小さい精度への変換は、`()``{}`による直接初期化、もしくは明示的なキャストのみ許可される。
58+
59+
```cpp
60+
void f(std::float16_t);
61+
void g() {
62+
std::float16_t a = 1.0; // エラー!小さい精度への暗黙変換はできない
63+
std::float16_t b(2.0); // OK : 直接初期化
64+
std::float16_t c{3.0}; // OK : 直接初期化
65+
a = 4.0; // エラー!小さい精度への暗黙変換はできない
66+
f(5.0); // エラー!小さい精度への暗黙変換はできない
67+
f(static_cast<std::float16_t>(5.0)); // OK : 明示的なキャスト
68+
}
69+
```
70+
71+
72+
### 通常の算術変換
73+
算術演算での型変換は、以下のような規則で行われる。
74+
75+
- どちらかのオペランドが浮動小数点数型である場合、
76+
- 両方のオペランドが同じ型であれば、型変換は行われない
77+
- そうでなく、オペランドの一方が浮動小数点数型でなければ、浮動小数点数型のオペランドの型に変換される
78+
- そうでなく、オペランドの浮動小数点数型の変換順位が等しくない場合、小さい方の順位をもつ浮動小数点数型は、もう一方の浮動小数点数型に変換される
79+
- `float + double`は`double`に、`std::float16_t + float`は`float`に変換される
80+
- そうでなく、変換順位が等しい場合、サブ順位で比較が行われ、より大きいサブ順位をもつ浮動小数点数型に変換される
81+
- `float + std::float32_t`は`std::float32_t`に変換される
82+
- そうでなければ、式は不適格となる
83+
- `std::float16_t + std::bfloat16_t`は不適格
84+
85+
```cpp example
86+
#include <stdfloat>
87+
#include <type_traits>
88+
89+
int main() {
90+
float f32 = 1.0;
91+
std::float16_t f16{2.0};
92+
std::bfloat16_t b16{3.0};
93+
std::float32_t f32b{4.0};
94+
95+
auto r1 = f32 + f16; // OK : f16は`float`に変換され、結果の型は`float`となる
96+
auto r2 = f32 + b16; // OK : b16は`float`に変換され、結果の型は`float`となる
97+
//auto r3 = f16 + b16; // エラー!どちらの型も算術変換でもう一方の型に変換できない
98+
auto r4 = f32 + f32b; // OK : f32はより大きいサブ順位をもつ`std::float32_t`に変換される
99+
static_assert(std::is_same_v<decltype(r4), std::float32_t>);
100+
}
101+
```
102+
103+
### オーバーロード解決
104+
- 浮動小数点数型の変換をともなうオーバーロード解決は、値を維持する変換が優先され、同じ変換順位をもつ他の浮動小数点数型への変換が優先して行われる
105+
- 値を維持する変換が曖昧な場合、プログラムは不適格となる
106+
107+
```cpp
108+
#include <stdfloat>
109+
110+
void f(std::float32_t) {}
111+
void f(std::float64_t) {}
112+
void f(long long) {}
113+
114+
int main() {
115+
float x;
116+
std::float16_t y;
117+
f(x); // f(std::float32_t)が呼び出される。
118+
// floatとstd::float32_tが同じ変換順位をもつ
119+
//f(y); // エラー!曖昧。変換順位が等しいオーバーロードが見つからない
120+
}
121+
```
122+
123+
124+
125+
## 備考
126+
- この型は、C23で定義されるオプションキーワード`_Float16`の別名として定義されることになるだろう
127+
- この型は、`_Float16`と相互運用できることが望ましい
128+
129+
130+
## 例
131+
```cpp example
132+
#include <iostream>
133+
#include <stdfloat>
134+
#include <cmath>
135+
136+
int main() {
137+
std::float16_t a = 1.0f16;
138+
auto b = 2.0f32; // bの型はstd::float32_t
139+
140+
// aはより大きい精度の型float32_tに変換される
141+
auto c = a + b; // cの型はstd::float32_t
142+
143+
// 精度を落とす縮小変換は明示的型変換で行う。
144+
// 拡張浮動小数点数型は数学関数にも渡すことができ、
145+
// 標準浮動小数点数型への暗黙変換もできる
146+
double d = std::log(static_cast<std::float16_t>(c));
147+
148+
// 同じ精度の浮動小数点数型との間で、精度を落とさず変換でき、
149+
// coutでも拡張浮動小数点数のまま出力できる
150+
std::cout << static_cast<std::float64_t>(d) << std::endl;
151+
}
152+
```
153+
* std::log[link /reference/cmath/log.md]
154+
155+
### 出力
156+
```
157+
1.09863
158+
```
159+
160+
## バージョン
161+
### 言語
162+
- C++23
163+
164+
### 処理系
165+
- [Clang](/implementation.md#clang): ??
166+
- [GCC](/implementation.md#gcc): 13.1
167+
- [Visual C++](/implementation.md#visual_cpp): ??
168+
169+
170+
## 関連項目
171+
- [`std::float16_t`](float16_t.md)
172+
- [`std::float32_t`](float32_t.md)
173+
- [`std::float64_t`](float64_t.md)
174+
- [`std::bfloat16_t`](bfloat16_t.md)
175+
176+
177+
## 参照
178+
- [P1467R9 Extended floating-point types and standard names](https://www.open-std.org/jtc1/sc22/wg21/docs/papers/2022/p1467r9.html)
179+

0 commit comments

Comments
 (0)