やれユニコードがどうだとか、UTF-8がどうだとか言っている割には、自分は文字コードのことを全然わかっていないのではないかと思ったので、Amazonでも評価の高いこの3冊の本を手に取ってみた。
- 矢野啓介『プログラマのための文字コード技術入門
』
- 小林龍生『ユニコード戦記 ─文字符号の国際標準化バトル
』
- トニー・グラハム『Unicode標準入門
』
パラパラとそれぞれの本をめくってみて、一番面白そうな『戦記』を読みはじめたら、話が面白くてどんどん引き込まれそうだったが、専門用語の意味が分からないところがある。グラハム本を開くと、さらに頭がこんがらがりそうになった。矢野本を開いてみると、意外にも一番堅そうに見える割には、読みやすい。そこで、上の順番で読むことにした。
『プログラマのための文字コード技術入門』
この本には、読み物ではないのになぜかどんどん読み進めてしまう不思議な読みやすさがある。それは恐らく、抽象的な説明ではなく実践に則した説明に徹しているからだろう。
文字コードの歴史と変遷、どこがどのように変わったのか、何が問題となり、何が解消されたのか、されなかったのかということが、初心者にも分かりやすい言葉で書いてあり、文章構成も非常に洗練されている(近頃の文系の学生にも見習って欲しいよ)ので、まるで歴史教科書のように読み進めることができる。
加えて、誰しも経験したことのある、マック=ウィンドウズ間のデータ受け渡しでありがちな文字化け、添付ファイルの文字化けなどの事例が、なぜ起こるのか、防ぐためにはどうするのかという実践的な観点から説明されている。さすがに最後の方のプログラミングの話は門外漢には難しくてついていけないかもしれないが、言ってることはよく分かるので、これを読んだ後は文字コードについて何か分かった気になる。
『ユニコード戦記』
文字コードの変遷がだいだい掴めたところで、『ユニコード戦記』を読むと、その裏側で闘っていた人たちの存在が見えてくる。
勿論、これは仕様書でもレファレンスブックでもなく、物語である。一人称は「僕」だし、ときに英語の練習法の話になったりと、多分に「自分語り」的な性格があることは否めない。しかし、やることをやってきた人の語ることだけあって、嫌味な感じはしないし、ユニコードを巡るワーキンググループや会議のロジスティックな面についての話は新鮮だ。
『Unicode標準入門』
で、最後に
『Unicode標準入門』。まだ読んでいない。いや、これは読み物ではないから通して読むのは止めておく。上の2冊で大体のことが分かったら、あとは適宜この本をレファレンス的に使うのが良いだろう。