3.4 特定のコンテキストにおけるDOI名の構文の制約
DOI名が特定の用途や文脈で用いられる場合、特定文字の使用に要件や制限があるかもしれません。
- 上記のように、Webプロキシのアドレスが先頭に追加されたURL(Uniform Resource Locator)として表示される場合は、一部の文字をパーセントエンコードする必要があります(例えば、「#」は、URLでURLフラグメントの始まりを示すため、エンコードしなければなりません)。
- 特定のネットワークコンテキストや参照コンテキストで直接取り扱えない文字や紛らわしい文字(例えば、マイナス符号、ハイフン、エンダッシュなどはどれでも画面上で似たように見えますが、それぞれ異なる文字値を持っています)は使用を控えるか、適切な方法でエンコードする必要があります(例えば、URLの場合はUTF-8に変換してから16進数エンコードする必要があります)。
Unicode規格は、ISO/IEC 10646:2020、UCS(汎用文字集合)の実装に追加の制約を課しています。詳しくはUnicodeを参照してください。