しろもじメモランダム

文字についてあれこれと。

「Windows 8 で変わる文字 - 異体字と Unicode IVS」雑感

Microsoft のセミナーに行ってきた。

目新しい情報はあまりなかったが、イベントレポート書いて的な圧力を Twitter 上で受けてしまったので、ここに雑感を書いてお茶を濁したいと思う。

今回の内容は

  • 前半:これまでの文字コード・漢字施策の変遷に関する、ざっくりとした説明
  • 後半:IVS自体と Windows 上におけるIVS対応についての、ざっくりとした説明

という感じだった。幅広い内容をたったの2時間で扱わなければならないので、どうしてもざっくりになってしまう。ある程度の基礎知識がある人であれば、「あーそうだったよね」と自分の頭の中を整理しつつ、まとめ・おさらい的な感覚で聞けると思うが、逆にまったくの初心者がこの2時間だけで理解するのは難しいと思う。文字コードマニヤ(笑)な人は「ここの説明が不十分」とか「これはこう説明した方が…」とかツッコみながら聞いていたのかもしれない。

個人的に興味があったのは、MS-DOS/Windows はこれまでどのように対応してきたかという点。Shift JIS の誕生からIVS対応まで、今回のセミナーでも各所で触れられていた。ただ、そのまわり(+裏?)には語り尽くせないぐらいのいろいろなエピソードがあると思うので、そのへんを何かの機会にまとめて教えてくれたらおもしろいんだけどなー、と感じる。

Window 8 上のIMEにおけるIVS対応については、Consumer Preview 版のときと同じくデフォルトではオフ(IVS入りの候補は出てこない)になっている。「頻繁に使用される名前、地名はIVSを含む単語としてIMEの辞書に搭載」*1してあるとのことで、設定をオン*2にして、例えば「くず」を変換すると、

  • 葛 [U+845B]:Windows Vista 以降のフォントではJIS2004字形
  • 葛󠄀 [U+845B U+E0100]:Adobe-Japan1 コレクション収録のJIS90字形

の両方が候補に出てくる。完璧を期すのであれば、これに加えてJIS2004字形を明示的に指定する

  • 葛󠄁 [U+845B U+E0101]:Adobe-Japan1 コレクション収録のJIS2004字形

も候補に出してほしいところだが、MS-IMEの辞書ではそうはなっていない。

ちなみに、「いばら」を変換すると

  • 茨 [U+8328]
  • 茨󠄀 [U+8328 U+E0100]*3

の両者が出てくるが、「いばらき」では

  • 茨城 [U+8328 U+57CE]

だけであって、IVSを使ったJIS90字形の

  • 茨󠄀城 [U+8328 U+E0100 U+57CE]

は出てこない。これについては、「茨城県などはJIS2004字形を使っているので、JIS90字形は辞書に入れていない」という、わかるようなわからないような説明があった。

IVS/IVDのコレクションの違いについてほとんど触れられておらず、これはどうなんだろう…という感もある。ただ普通のアプリケーションにとってみれば、Adobe-Japan1 であれ Hanyo-Denshi であれ、どちらもIVSとしての扱い方に差はないので、ここらへんのややこしい話にあまり深入りする必要はないかもしれない。

なお、『Unicode IVS/IVD入門』という本が先日発売されたが、今日の講師の方は「届いたばかりでまだ詳しく読んでいない」とおっしゃっていた。

Unicode IVS/IVD入門

Unicode IVS/IVD入門

セミナー後は、小形さんはじめ文字に詳しそうなみなさんと昼食をご一緒させていただいた。そこでのお話(IVSとは関係ない)も非常におもしろかったので、このあたりの内容、まとめて本なり何なりにならないかな…と思う。

そんな一日でした。レポートおわり。

*1:配布資料 p. 40

*2:「変換文字制限をしない」

*3:変換候補の「単漢字…」の中にある。