Unicode 12.0正式版が登場。日本語では小文字の「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が追加。新元号が発表され次第、次の12.1で新元号キャラクタを追加
Unicodeコンソーシアムは「Unicode 12.0」正式版を発表しました。
Unicode 12では4つの言語(script)、554種類の文字が追加されました。これによりUnicodeに収録されている言語は150、文字は13万7292種類になりました。
追加された文字には日本語の文字が7種類、小さな文字としての「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が含まれています(通常の大きさの文字は以前からありました)。これらは古い文書を記述するために使われるとされています。
そのほか、現在のイラン南西部に存在したアケメネス朝で使われていたアラム語のElymaic文字。南インドのサンスクリット語、カンナダ語で使われていたNandinagari文字。ラオス、タイ、ベトナム、フランス、オーストラリア、カナダ、米国などで使われていた現代White Hmong語、Green Hmong語のNyiakeng Puachue Hmong文字。インド、ミャンマー、ブータンの現代Wancho語で使われていたWancho文字。中国のMiaoとYiの方言で使われていたMiao言語の文字などが追加されています。
絵文字も61種類が追加されました。
新元号の文字位置は予約済み。次の12.1で対応
Unicodeには以前から、明治、大正、昭和、平成の元号を表すキャラクタが用意されています。
日本では4月1日に新元号が発表される予定ですが、上の図を見ると分かるように新元号を表す新キャラクタが入る余裕は、既存の元号の周辺にはありません。
そこでUnicodeコンソーシアムは昨年9月、少し離れたところに1文字分空いていた「U+32FF」に新元号のキャラクタを入れると発表しました。
Unicodeコンソーシアムは新元号が発表され次第、速やかに新元号を1文字で表すキャラクタを加えたUnicode 12.1をリリースするとしています。新元号は4月1日に発表される予定ですので、4月中にはUnicode 12.1が登場するのではないでしょうか。
あわせて読みたい
Docker RegistryをP2Pでスケーラブルに再構築した「Kraken」、Uberがオープンソースで公開
≪前の記事
W3C、パスワードを不要にする「Web Authentication」(WebAuthn)を勧告として発表。Chrome、Firefox、Androidなど主要ブラウザですでに実装済み