しろもじメモランダム

文字についてあれこれと。

はてなダイアリーの文字コードがこの秋UTF-8に

YAPC::Asia TOKYO 2011 で発表された「新はてなダイアリーの裏側」のスライドが公開されている。

ブクマのコメントを見た限りではあまり文字コードの件は注目されていないが、これまでEUC-JPだったはてなダイアリーが、ようやくUTF-8になるらしい。

(スライド11枚目より)

現在のはてなダイアリーでもEUC-JP外の文字が使えないことはないが、保存時に数値文字参照に置き換えられてしまうので、後で修正しようと思ったときに面倒くさい。また、NEC選定IBM文字をそのまま記事中に書いて保存した場合には、文字そのものが別の漢字に化けてしまう。たとえば「﨑」という字はそのままだと「粼」に化けてしまう*1ため、これを回避しようと思ったら数値文字参照で 﨑 と書く必要がある。

はてなダイアリー文字コードUTF-8になればこのあたりの問題は解消されるので、いろいろな文字を記述するときにあれこれ気を揉む必要がなくなる。その他にも新はてなダイアリー(「はてなブログ」という名前になるとか)はいろいろと進化しているらしいので、今からリニューアルに期待。