読者です 読者をやめる 読者になる 読者になる

しろもじメモランダム

文字についてあれこれと。

ここまでのまとめ:10646次版ドラフトの字体チェック

当初はここまでグリフに差があるとは思っていなかったので「字形を比較してみる」としたけど、蓋を開けてみるとデカい差(というか作字ミスというか)がポコポコと出てきたので「字体」の方がいいような気がしてきた。

繰り返しになるが、UCS漢字の包摂規準については自分自身そこまで理解しているわけではないので、あくまでも参考程度に。URO, Ext. A, Ext. B の漢字についてはドラフトの同じ文字同士で比較しただけであり、基本的に現在の版のグリフとは比較していないので注意。既知の重複文字・包摂ミスについても一部しか取り上げていないので、これらについて詳しく知りたい方は漢字データベースプロジェクト漢字関係(異体字等)データベースUCS漢字の統合基準あたりのページをどうぞ。

さて、ここまでの感想を簡単に書いておくと……

各国ネイティブのグリフが一目でわかるようになるマルチカラム化は歓迎だけど、ここまで見てきたようにフォントの品質がちょっと怪しい。今まで Arphic のフォントを使っていたベトナムは、今回からすべて自前のフォントになる。それはそれで喜ばしいことなんだろうけど、どうしてもグリフにミスが目立つ。意外だったのは、台湾のフォントにも少なからず怪しいグリフがあった点。台湾の標準字体は一点一画の細かい箇所まで決められていて、字形や字体についてはかなり厳格(ある種神経質というか)だというイメージがあったのだか、すべてがそうでもないらしい。

上に書いたように、URO, Ext. A, Ext. B の漢字については基本的に現在の版と比較していない。URO や Ext. A については複数ソースを持つ文字が多いので*1、今回のチェックでほとんどカバーできていると思うが、問題なのは Ext. B。チェックしていない文字(ソースが一つしかない文字)が結構あり、その中にはチュノムのように「Vソースのみ」の文字も多い。これがまたなかなか怪しそう。

というわけで、Ext. B については改めて現在の版と比較する必要がある気がする*2

*1:簡体字は大抵Gソースだけだが、ここまで見てきた感覚ではGソースのグリフは基本的に信用できる。

*2:で、現在取り掛かっているところ。