しろもじメモランダム

文字についてあれこれと。

もじもじカフェ第33回「人の名づけに使える字」に行ってきた

今回のもじもじカフェは初の大阪開催ということだったが、他に「写植の時代」展が開催中ということもあって、ちょっと足を延ばして行ってきた。

ゲストは京大の安岡孝一先生。安岡先生には以前拡張漢字C & GlyphWiki勉強会でお会いしたことがあったが、講演を生で聴くのは今回が初めてだった。先生がお書きになった『キーボード配列 QWERTYの謎』や『文字符号の歴史―欧米と日本編』などは、さまざまな資料に当たって事実関係を徹底的に調査した上で書かれており、正確性も信頼性もかなり高いように感じるが、その反面、「ちょっと気になって開いてみたけどそこまでがっつり興味があるわけでもないし……」というような素人にとっては、率直なところ若干堅すぎる気がしないでもなかった。

キーボード配列QWERTYの謎

キーボード配列QWERTYの謎

文字符号の歴史―欧米と日本編

文字符号の歴史―欧米と日本編

そんなこともあって「お話についていけるだろうか」とちょっと不安だったものの、いざ始まってみるとそんなことは全くの杞憂。終戦直後の話から始まるのだが、早口めな安岡先生のペースにあっという間に引き込まれてしまった。「実はローマ字が人名に使えるようになっていたかもしれなかった」とか「『子供にこの字を使いたい、人名用漢字外なのはおかしい』と訴えのは行政書士さん」とか「平成16年以前に(当時人名用漢字外だったはずの)『凛』ちゃんがたくさんいる」とか、その時々の裏事情や興味深いエピソードが盛りだくさんで、聴いていてとてもおもしろかった。漢字制限の歴史や審判の結果など、「事実」の外側だけを眺めているとなかなか気づかないが、名づけをする親も漢字制限をする法務省もそれを運用する窓口の人も、やっぱり文字を使うのは人間なんだなーというのを再確認。

また「名前の漢字も、ケータイで出るぐらいの範囲ならOKにしてもいいのでは」というような、安岡先生ご自身の率直な意見が聞けたのも、「専門家はこう考えているのか」ということがわかって収穫だった。いわゆるキラキラネーム/DQNネームについても「漢字が制限されているので、なるべく一意となるように識別子をつけようとしたら自然と捻った読みになる」というような説明をされ、(言われてみれば至極当然のことだが)かなり腑に落ちた。

実際のお話はもっともっと盛りだくさんだったが、途中からはメモを取るのも忘れてとてもおもしろく聴くことができた。ちなみに後で大石さんから伺ったところによると、なんでも安岡先生は昔ミュージシャンになりたくて、今でも講演はライブだと思ってやってらっしゃるんだとか。機会があったら文字コードでもタイプライターでも何でもいいので、是非また安岡先生のお話をお聴きしたい。

蛇足

龍ヶ嬢七々々の埋蔵金』なるラノベが出ているようだけど、「七々々」って名前は実際には付けられるんだろうか……?

墨入れしてみた #かな書いてみる

前回で下書きが一通りできた(上の記事参照)。もう一回下書きを書き直して改良するか、それとも次の段階に進むか迷ったが、「とりあえずどんどん進んで困ったらそのとき考えよう」という楽天的な方針で行くことにした。というわけで、次の工程である清書(墨入れ)に進んでみる。

作業としては、下書きを透かして輪郭をトレースし、それを墨で塗っていくだけ。トレースには一番安かった*1下のトレース台を使ってみた。安いなりの造りだが、この用途で使うにあたっては今のところ特に不満もない。

サンコー LEDバックライトUSBトレース台 COTRSTA4

サンコー LEDバックライトUSBトレース台 COTRSTA4

輪郭を鉛筆で方眼紙にトレースしたら、それに墨入れをしていく。墨は墨汁をそのまま使った。筆は家にあった漢字書用の小筆を使ったが、本当は面相筆の方がいいのかもしれない。コシが強い筆の方が、線がフニャらずに良さげ。輪郭は筆の腹で描くとぶるぶるになるので、穂先側で描くようにする。また、自分の描きやすいように紙の向きを変えて描いていくと楽。といっても慣れないとやっぱりなかなか難しい。

一枚書き終わったら、出来を確認する。遠くから見てみたり角度を変えて眺めてみたり、いろいろと方法はあるだろうが、自分の場合、スキャンした画像を縮小表示で見てみると欠点がよくわかった。凹んでいる箇所やはみ出た箇所を墨と修正液で直したりして、何度かこの修整作業を繰り返す。

で、出来上がったのがこちら。




まだまだ統一感に欠けるところもあるが、とりあえずは一通り終わった。

さて次はどうしようか。

*1:といってもトレース台って意外と高い…。

明朝体かな書体を制作中 #かな書いてみる

きっかけ

何年も前から「オリジナルの明朝体かな書体作ってみたいなー」と思っていたが、思っているだけでどうも踏ん切りがつかず、結局のところ特に何も作ってはいなかった。

そんな中、先月大曲都市さんのタイプデザインセミナーに参加した際に、いろいろなお話を聴いて「やっぱり自分も何か手を動かして作ってみないと」と感じたり、懇親会で「最近何やってるの?」と訊かれて「そういえば特にこれといってやってないな」と気づいたりで、ちょうどいい機会だと思ってスパッと始めてみることにした。

計画

今回の目的としては、「書体制作の各過程を実際に経験する」ということがまず挙げられるが、それと同時に自分の実力の把握や、技術の体得もある程度できるかと思う。他の書体と比較することで、その書体の設計をより深く知ることにもなるだろう。

制作する書体は、前述のとおりオリジナルの明朝体かな書体。「まず作ってみる」ことが目的なのでコンセプトのようなものは特に考えていないが、普通の縦組み本文に使えるようなごくオーソドックスなかな書体を想定している。自分としてはクラシックなかなの方が好きだが、何も考えずに書いてみたところそれほどクラシッククラシックな感じにはならなかった。

全体の大雑把な手順はこんな感じだろうか。

  1. 方眼紙に下書き
  2. 下書きを基にして清書
  3. スキャンしてアウトライン化
  4. フォント化

これの各所に調整の作業が入ることになるだろう。まずは早めに全体像や作業の感覚を摑みたいので、清音(+ん)のひらがな48文字だけで作っていきたい。

進捗

というわけで、1月24日から下書きの作業を開始した。100均で買ってきたB5の方眼紙に骨骼を書き、肉付けをしていく。大きさは5cm角で、1枚の方眼紙に12個の文字が入る。書けば書くほどうまくはなるだろうが、とりあえず1つの文字につき3回程度書くことにした。

基本的に一日一枚のペースで書き、Twitter#かな書いてみるタグでつぶやいていた。そして昨日、ようやく「ん」まで書き終わり、ひらがな48文字の下書きができあがった。相対的な字面の大きさや太さ、寄り引きなどはバラついていてまだまだ調整が必要だが、各文字の字形はこれである程度固まったと思う。

先は長いが、ぼちぼちとやっていきたい。

和文書体の分類方法いろいろ ―後篇

あいだが空いてしまったが、前篇のつづき。

IPSJ-TS 0013:2011 の分類方法

2011年11月14日に、情報処理学会の試行標準である IPSJ-TS 0013:2011「フォントリソース参照方式」が公表された。

この中の「5.3 書体分類および分類ノード」において、書体の分類方法が以下のように定められている。

  1. 伝統書体(漢字のあるもの)
    1. 明朝体
      1. クラシック
      2. モダン
      3. 新聞明朝
    2. 角ゴシック体
      1. クラシック
      2. モダン
      3. 新聞ゴシック
    3. 丸ゴシック体
      1. クラシック
      2. モダン
    4. 筆書体
      1. 楷書体
      2. 教科書体
      3. 行書体
      4. 草書体
      5. 隷書体
      6. 篆書体
      7. 硬筆・手書き
    5. 宋朝体
    6. 古印体
  2. ディスプレイ書体(漢字のあるもの)
    1. 江戸文字
    2. 等線
      1. セリフPOP
      2. ゴシック体系
      3. サンセリフPOP
      4. 硬筆
    3. 非等線
      1. 明朝体
      2. 硬筆・手書き
    4. 字幕書体
  3. かな書体(独立)
    1. 伝統書体
      1. 筆字体クラシック
      2. 筆字体モダン
      3. 明朝体クラシック
      4. 明朝体モダン
      5. ゴシック体クラシック
      6. ゴシック体モダン
    2. 等線
      1. セリフ
      2. サンセリフ
      3. 硬筆
    3. 非等線

詳しい内容や分類例については試行標準の本文を参照のこと。

欧文書体の分類と PANOSE 1.0

ちょっと横道にそれて、欧文書体の分類方法を見てみよう。

Vox-ATypI classification

欧文書体にも分類方法はいろいろとあるようで、例えば有名なものに Vox-ATypI classification がある。Wikipedia によれば、現在は以下のような分類になっている。

続きを読む

和文書体の分類方法いろいろ ―前篇

書体を分類する

書体を分類(=整理、体系化、ラベルづけ)すると、いろいろなメリットが生まれてくる*1。カテゴリから書体を検索したり、雰囲気の似た書体を探したり。もちろん、研究や分析もしやすくなる。ちょっと考えてみればわかるが、「明朝体」というカテゴリ名称がなかっただけでも一大事だ。

書体の分類方法にはいろいろな種類があるが、例えばモリサワのサイトの書体分類では以下のようになっている。

  1. 和文書体
    1. 明朝体
    2. ゴシック体
    3. 丸ゴシック体
    4. デザイン書体
    5. 装飾書体
    6. 筆書体
    7. 新聞書体
  2. かな書体
    1. かな明朝体
    2. かなゴシック体
    3. かな丸ゴシック体
    4. かなデザイン書体
    5. かな筆書体
  3. UD書体
    1. UD書体
  4. 学参・筆順
    1. 参書
    2. 学参かな
    3. 筆順書体

このように、各ベンダーのサイトやカタログといった書体の総数が少ない場においては、そこまで大規模な分類は必要にならない。

大規模な分類方法

これに対し、例えば全ベンダーの書体を網羅した見本帳など、多数の書体を扱う必要がある場合には分類も大規模なものになってくる。近年のデジタルフォントの充実によって大型の見本帳がいくつか発行されているが、そこで採用されている大規模分類を以下に紹介する。

小宮山分類

基本日本語活字見本集成 OpenType版*2(2007年)において、小宮山博史は「デジタル書体の分類試案」として次のような分類方法を提唱した。

*1:もっとも、うまく分類しなければデメリットになるが…。

*2:イデア別冊。書籍版は『基本日本語活字集成 OpenType版』。

続きを読む

「Unicodeの基礎知識と異体字について」に行ってきた

IVS技術促進協議会のセミナー「Unicodeの基礎知識と異体字について」があったので、ちょっと聴きに行ってみた。

Unicodeの基礎知識と異体字について
主催:IVS技術促進協議会 後援:日本電子出版協会電子出版制作・流通協議会

内容
(1)Unicodeに関わる用語や基礎知識、IVSについてご説明します。
講師:Unicode Consortium Director 小林 龍生 氏 
(2)外字・異体字に関するプロジェクト等についてご説明します。
講師:凸版印刷株式会社 情報コミュニケーション事業本部 田原 恭二 氏、総合研究所 秋元 良仁 氏

セミナー情報|IVS技術促進協議会

以下、ざっとレポート。スライドのPDFとあわせてどうぞ。

(1) IVS時代の文字コード入門

charater glyph model

最初に character(「文字」)と glyph(「抽象字形」)の関係(charater glyph model)について、ISO/IEC TR 15285 というTRでの定義をもとに簡単な説明があった。

character は文字というよりも、ただのビット列と考えた方が往々にして意味が摑みやすいとのこと。glyph については、抽象的な字形(デザイン差は吸収される)を指す場合と具体的な字形(実際に表示・印刷される形)を指す場合とがあるが、このTRをはじめ、文字コードに関する精しい議論などでは前者の意味で使われている。この定義を採る場合、具体字形は glyph image と呼ばれる。イメージとしてはこんな感じだろうか。

抽象←  character > glyph > glyph image  →具体

一方、フォント技術関係では具体字形を glyph と呼ぶ場合も多いので注意。このブログでは、こちらの用法の方が多い。

日本の文字コードと漢字政策

次に日本の文字コードや漢字政策の変遷について、要点を搔い摘んでの説明があった。このあたりはよく知られている通り。改定常用漢字表と同日付で「改定常用漢字表に対するJIS漢字コード規格の対応状況について」が公表されたように、近年は文字コード規格と国語施策の連係がとれるようになってきた。

Windows Vista では JIS X 0213 の改正への対応が話題になったが(JIS2004問題)、マイクロソフトとしては「常に最新の規格に合わせるという方針」を採っているとのこと。

外字・異体字・IVS/IVD

その後は外字・異体字のさまざまな例が紹介された。かの有名なカナダ漢字の話もちょろっと。肝心のIVS/IVDの解説が時間不足でざっくり省略されてしまったのは残念。

なお、今回の内容は以下の論文の中でだいたい述べられている。

(2) 「字形共通基盤」プロトタイプによる実証実験のご紹介

字形共通基盤の概要

最初に、字形共通基盤はどういったものなのか、何を目的としたプロジェクトなのかといったことについて説明があった。現在の出版界では、外字・異体字については各社それぞれが独自のワークフローで処理をしている。それらのグリフを整理・収集して共通インフラ(字形共通基盤)を構築すれば、外字・異体字への対応コストが軽減され、データの互換性も高まるのではないか、というアイデア。ちなみに、行政向けの「文字情報基盤」とは(名前が紛らわしいが)無関係。

既存の多グリフ環境としては文字鏡・GT明朝・グリフウィキなどいろいろなものがあるが、これらは学術向けのものが多い。そのため、そのままでは出版用途には向いていないと判断された。そこで、文字情報基盤ではそれらの成果を取り入れつつも、独自のインフラを整備することになる。

仕組みとしては、各グリフにはgi番号(例:gi001125 [=亜])という背番号を割り当て、これで管理することになる。これに対して、代表的な明朝体での glyph image、各種文字コードや内部コード、読み・部首・画数、異体字関係など、さまざまな情報が紐づけられている。

課題としては、収録基準の制定や運用組織・運用ルールの整備などがあるようだ。

なお、今年の3月に「平成22年度 コンテンツ配信型・ハイブリッドビジネスモデル実証事業(デジタル・ネットワーク社会における出版物の利活用推進のための外字・異体字利用環境整備調査)」という報告書(PDF)が出ている。

プロトタイプの動作デモ

概要の説明の後に、デモとして実際にプロトタイプでの実演があった。

字形検索では web ブラウザがクライアントとなり、読み・画数・部首・部品・文字コードなどをキーとした検索ができるようになっている。検索結果の詳細画面では、上に挙げたようなさまざまな属性が表示される。

入力方法としては、字形共通基盤との通信機能が実装された、専用のATOKが用意されている。また同様に字形共通基盤と通信できるテキストエディタも用意されており、これらを使うことで実際の字形を見ながらの入力・編集ができるようになっている。字形共通基盤のグリフを入力した箇所は interlinear annotation を利用して表現されるようになっている。

雑感

IVS技術促進協議会のセミナーだったのでIVSについての話が中心になるのかと思ったら、そうでもなかった。でもその分、字形共通基盤の詳しい話を聴けたので満足。特に、実際にプロトタイプが動いているのを見ることができ、なかなかおもしろかった。自分は出版業界の中の人というわけでもないのでこれがどの程度活用されていくのかはよくわからないが、とりあえずあれば(個人的に)便利なことは確か。

あとひとつ、質疑応答の場面などで小林さんがちょっとぶっちゃけ話的なことをおっしゃっていたが、ああいうのは聞いていておもしろいと思った。「あー、この人はこういう風に考えてるんだ」とか「やっぱそうですよねー」というような感じで、規格票からでは読み取れないことがいろいろと見えてきて興味深いな、と。