しろもじメモランダム

文字についてあれこれと。

和文書体の分類方法いろいろ ―後篇

あいだが空いてしまったが、前篇のつづき。

IPSJ-TS 0013:2011 の分類方法

2011年11月14日に、情報処理学会の試行標準である IPSJ-TS 0013:2011「フォントリソース参照方式」が公表された。

この中の「5.3 書体分類および分類ノード」において、書体の分類方法が以下のように定められている。

  1. 伝統書体(漢字のあるもの)
    1. 明朝体
      1. クラシック
      2. モダン
      3. 新聞明朝
    2. 角ゴシック体
      1. クラシック
      2. モダン
      3. 新聞ゴシック
    3. 丸ゴシック体
      1. クラシック
      2. モダン
    4. 筆書体
      1. 楷書体
      2. 教科書体
      3. 行書体
      4. 草書体
      5. 隷書体
      6. 篆書体
      7. 硬筆・手書き
    5. 宋朝体
    6. 古印体
  2. ディスプレイ書体(漢字のあるもの)
    1. 江戸文字
    2. 等線
      1. セリフPOP
      2. ゴシック体系
      3. サンセリフPOP
      4. 硬筆
    3. 非等線
      1. 明朝体
      2. 硬筆・手書き
    4. 字幕書体
  3. かな書体(独立)
    1. 伝統書体
      1. 筆字体クラシック
      2. 筆字体モダン
      3. 明朝体クラシック
      4. 明朝体モダン
      5. ゴシック体クラシック
      6. ゴシック体モダン
    2. 等線
      1. セリフ
      2. サンセリフ
      3. 硬筆
    3. 非等線

詳しい内容や分類例については試行標準の本文を参照のこと。

欧文書体の分類と PANOSE 1.0

ちょっと横道にそれて、欧文書体の分類方法を見てみよう。

Vox-ATypI classification

欧文書体にも分類方法はいろいろとあるようで、例えば有名なものに Vox-ATypI classification がある。Wikipedia によれば、現在は以下のような分類になっている。

  1. Classicals
    1. Humanist
    2. Garald
    3. Transitional
  2. Moderns
    1. Didone
    2. Mechanistic
    3. Lineal
      1. Grotesque
      2. Neo-grotesque
      3. Geometric
      4. Humanist
  3. Calligraphics
    1. Glyphic
    2. Script
    3. Graphic
    4. Blackletter
    5. Gaelic
  4. Non-Latin

この Vox-ATypI classification は、上で紹介した和文書体の分類方法3つと同じく、エレメントの形態や書体の歴史的背景などに着目したものである。

PANOSE 1.0

一方、一風変わった分類の手法をとるものに PANOSE 1.0 がある。

PANOSE 1.0 は10個の整数で書体の特徴を表す。例えば、Windows 附属の Times New Roman では [2, 2, 6, 3, 5, 4, 5, 2, 3, 4] であり、次のような意味になっている。

特徴項目 Times New Roman での値
1. Family Kind 2. Latin Text
2. Serif Style 2. Cove
3. Weight 6. Medium
4. Proportion 3. Modern
5. Contrast 5. Medium Low
6. Stroke Variation 4. Gradual/Transitional
7. Arm Style 5. Straight Arms/Single Serif
8. Letterform 2. Normal/Contact
9. Midline 3. Standard/Pointed
10. X-height 4. Constant/Large

一番最初の Family Kind は基本書体/筆書体/装飾書体/シンボルフォントの大分類で、これはそのまま素直に分類できる。が、以降の2〜10の値の決め方が独特なものになっている。例として、3番目の Weight の値の決め方を見てみよう。

ここではまず、下図に示した CapHWStem という2つのパラメータを求める。CapH は大文字の高さ(キャップハイト)を表すが、大文字Hの左の縦ステムの中心線上における、Y座標の最大値と最小値の差と定義されている。同様に、WStem は縦ステムの幅を表し、大文字Eの上側2本のアームの間を等分した高さにおける、縦ステムの幅を測ることになっている。

そして、WeightRat = CapH / WStem で定義される WeightRat を求め、以下の表で最終的な分類値を決定する。

以上 未満
0. Any
1. No fit
2. Very Light 35
3. Light 18 35
4. Thin 10 18
5. Book 7.5 10
6. Medium 5.5 7.5
7. Demi 4.5 5.5
8. Bold 3.5 4.5
9. Heavy 2.5 3.5
10. Black 2.0 2.5
11. Extra Black 2.0

Times New Roman の場合は WeightRat = CapH / WStem = 132.3 / 18.6 = 7.11 であるから、Weight の項の値は6の Medium となる。このように、PANOSE 1.0 の値はグリフの様々な箇所を計測し、そのパラメータから計算で求めるようになっている。

ちなみに、この PANOSE 1.0 の値は TrueType フォントや OpenType フォントのOS/2テーブルに書き込まれており、OSやアプリケーションが解釈できるようになっている。またSVGなどの規格にも取り込まれているようである。これにより、指定されたフォントが利用できない場合にフォント置換を行ったり、あるフォントに似たフォントを類似度の順に抽出したり、といったことが可能になっている。

和文書体の特徴の数値化

欧文の話が長くなってしまったが、ここで和文書体の分類に話を戻す。

和文書体と PANOSE

上で紹介した PANOSE 1.0 は広く実装・利用されているものの、欧文専用の分類である。TrueType や OpenType の仕様の一部になっているため、一般に流通している和文フォントにも PANOSE 1.0 の情報が含まれているが、あまり役に立たない。和文フォントにおける PANOSE 1.0 の値については、AdobeKen Lunde は以下のように設定することを奨めている。

特徴項目 和文書体における推奨値
1. Family Kind 2. Latin Text
2. Serif Style 2. Cove(明朝の場合)
11. Normal Sans(角ゴシックの場合)
15. Rounded(丸ゴシックの場合)
3. Weight (欧文同様に計測値に応じて設定)
4. Proportion 0. Any
5. Contrast 0. Any
6. Stroke Variation 0. Any
7. Arm Style 0. Any
8. Letterform 0. Any
9. Midline 0. Any
10. X-height 0. Any

PANOSE 1.0 の拡張として欧文書体に限定されない PANOSE 2.0 があるようだが、未だにどこにも実装されていないらしい。

和文書体の特徴に対する数値化の試み

では、和文書体に対しても PANOSE 1.0 のような計測・分類方法を適用することができるだろうか。

これについては、古くは佐藤敬之輔が『文字のデザイン』シリーズ(1964〜1976年)で数値的な分析を行っており、矢作勝美も『明朝活字』(1976年)でふところの計測などをしている。最近では、山王丸榊『書体の研究 Vol.10』(2011年)における「仮名のアスペクト比」・「漢字と仮名の字面比」の調査が挙げられる。

また前述の IPSJ-TS 0013:2011 においても、附属書A 書体見本帳作成指針の中でふところや重心、外接矩形の計測方法が定義されている。これについては以下の報告に詳しい。

このようにいろいろな試みはあるものの、現在のところあまり広くは応用されていない。計測方法をどのように定義し、それをどのように解釈してどのように分類するかというのはなかなか難しそうな問題だ。

しかしながら、書体の特徴を数値的に表すことができれば、機械的でより客観的な分類が可能になり、書体同士の類似度を数値化するようなこともできるようになるだろう。個人的にはなんかロマンを感じたりもする。……え、みなさんもしますよね?


※この記事では敬称はすべて省略させていただいた。