読者です 読者をやめる 読者になる 読者になる

しろもじメモランダム

文字についてあれこれと。

パーツ?

Unicode の CJK Compatibility ブロックには、㍍ とか ㌷ とか ㍇ とか ㌮ とか、カタカナの組み文字が87種類収録されている(U+3300〜U+3357)。

で、この87文字のうち、1文字を除いた86文字は Adobe-Japan1-6 にすべて収録されている*1。下の画像は、AJ1-6に含まれるグリフのみでコードチャートを表示させた PDF から採ったもの(p. 23)だが、ひとつ U+332C の箇所だけぽっかり空いているのが分かる。

この U+332C は ㌬(パーツ)という文字。Unicode の PDF を見てみても「parts」とあるだけで要するに普通の「パーツ」なんだろうけど、周りの傾向を考えてみると、これひょっとしてバーツの間違いじゃ?なんて思えてくる。

U-PRESS の文字セットやエヌフォー外字DXあたりには、「バーツ」が入っていて「パーツ」は入っていないようだ。前述のようにAJ1-6もこの状態になっている。Unicode の「パーツ」はどこから来たんだろう?

おまけ

MSゴシック*2の ㌬ の音引きがおかしいという話。

そういえばそんなのあったなぁ、とか思っていたら、なんと Windows 7 Beta のMSゴシック ver. 5.01 でも直っていなかった。

てっきり Vista の 5.00 で修正されていたものかと。

おまけ2

なぜか両方とも「バーツ」になってる。

おまけ3

AdobeKen Lunde によれば、2000年の時点でこのエラーは発見されていたとのこと。

An interesting event of historical significance occurred in June of 2000. A former co-worker of mine, David Kelly, observed that the representative glyph for U+332C (SQUARE PAATU) in Unicode didn’t match the Adobe-Japan1-4 glyph (CID+11914) in that the first character in the square katakana ligature was U+30D0 (バ), not U+30D1 (パ). After some discussion, this was quickly determined to be an error from the very beginning of Unicode, as U+0E3F ฿ THAI CURRENCY SYMBOL BAHT and U+332C ㌬ SQUARE PAATU were both included in Version 1.1 (June of 1993). Unfortunately, it was too late to make a correction, due to stability guarantees that are still in place today. Neither the character’s name nor its decomposition (U+30D1 U+30FC U+30C4) could be changed.

“Bahts is [not] parts”

*1:というか、Adobe-Japan1-4 の時点でこの86文字は揃っている。

*2:P・UIも共通。