自炊の解像度はいくつにするべきか

2017/08/10

自炊・電子書籍

 〔約2100文字|読了の目安:4.2分〕

 本を裁断してスキャンし、自分で電子書籍化することを俗に「自炊」という。
 その本をスキャンする際、解像度はいくつにするべきだろうか。

 自炊技術Wiki には「自分が現在使っているディスプレイ及び将来使いそうなディスプレイの解像度よりも小さくしない」とあるが、これは適切ではない。ディスプレイの解像度なんて、時と状況によっていくらでも変わるからだ。Retinaディスプレイによってスマホとタブレットの解像度が一気に上がるなんて誰が予想しただろうか。

 印刷物の情報をなるべく減らさず、ファイルサイズがなるべく増えない辺りが望ましい。

印刷物の解像度

印刷物の種類解像度
モノクロ二値1200dpi
カラー/グレースケール300~350dpi
新聞の画像170~250dpi(モノクロ~カラー)

 印刷物の解像度は、ネットなどの情報を総合するとこうなっているようだ。

●モノクロ二値
 小説などの文字や、白黒の漫画のこと(スクリーントーンも含む)。
 「二値」というのは、中間色(グレーなど)がないということ。

●カラー/グレースケール
 中間色を扱うためにアミ点を使用している印刷物。
 これがモアレの原因になる。

 グレースケール* が使われるのは、白黒写真やライトノベルの挿し絵のような微妙な陰影のあるモノクロ画像。モアレ除去を使用しないといけないので、文字のみのページとは別にスキャンする必要がある。

 雑誌などで文字に色がついていることがある。これはモノクロ二値とカラーのどちらかというと、モノクロ二値だ。色がついていても単色であればモノクロになる。「モノクロ」とは白黒ではなく、単色(mono)という意味だ。

 複数の色を混ぜて使う場合はアミ点を使うことになり、そうするとカラーになる。

*: ネット上には「グレースケールは600dpi」という記述があるが、グレースケールのアミ点の間隔はカラーとほぼ同じか、むしろ広い。だから300dpi前後の筈だ

文字は300dpiを基準にする

 1200dpiである文字をそれぞれの解像度でスキャンするとこうなる



 最大でも600dpiあれば十分。拡大画像だと300dpiでガタつきが見えるが、実サイズだと150dpiでも読むことはできる。150dpiの文字は18pixelくらいだが、パソコンのフォントは大体16pixel前後だから、足りないということはない。

 150dpi程度でも良さそうだが、解像度があまり低いとOCR(文字認識)の認識率が落ちる。大体300dpiを超えると認識率に変化がなくなる *1 。また、文字がガタガタしていると目に負担がかかりそうな気もする *2

 なので300dpiで良いと思う。

*1: 「読取革命」は400dpi推奨だが、400dpiだとかえって認識率が落ちることがあった。
*2: 文字を読み取るのに余計な労力がかかりそうな気がする。

漫画は300dpiくらいは欲しい

 1200dpiである白黒漫画をそれぞれの解像度でスキャンするとこうなる。


稲井カオル『しらぬい奇譚録』白泉社

 拡大画像だと解像度が落ちると共に情報量が減っているのがわかるが、実寸画像だと300dpiでも十分に見える。

 市販の電子書籍の漫画の解像度はいくつになっているのかというと、少年ジャンプ(112×176mm)などは、844×1200~1125×1600pixelくらいらしい。これは約173~231dpiだ。300dpiだと1323×2079pixelになる。

 市販の電子書籍が300dpiよりも低いことを踏まえると、やはり300dpiあれば十分に思える。
 あとはその漫画の絵の緻密さ、自分にとっての重要度で300~600dpiの間で自由に決めればいいだろう(ドキュメントスキャナーは大抵、600dpiが上限)

 ちなみに600dpiは300dpiの4倍のファイルサイズになる(未圧縮時)。また解像度を上げるとスキャンに時間がかかる。

本の大きさによっても変える

 少年ジャンプのような小さい単行本は縮小率が高いから、その分高解像度でスキャンする必要があるし、大判の単行本は縮小率が低いのであまり解像度を上げる必要はない。
 特に文庫サイズで出ている漫画はそのままスキャンすると低解像度になってしまう。

 要は、何dpiでスキャンするかというよりも、スキャン後の画像が何×何pixelになるかが重要だということだ。

原稿のサイズでも変える

 大判で印刷されることを前提に大きな原稿で描かれた漫画と、小さいサイズで印刷されることを前提に小さな原稿で描かれた漫画もある。前者は漫画のコマが5段あったり、後者は2段だったりする。
 そういう場合は、前者は高解像度で、後者は低解像度にする。

カラー印刷も300dpiを基準にする

 300~350dpiといわれているカラー印刷は、スキャン時は300dpiと350dpiで大した違いは出ない。拡大してよく見ると、350dpiの方が細部のディティールが残っているかなあという程度。
 当然だが、元の印刷物が300dpi以下だと350dpiでスキャンしても意味はない。

 本の表紙などは300dpiで、重要な画集などは350dpiにすればいいと思う。
 もちろんモアレ除去を使用する。

小さい文字は400~450dpiにする

 一般の書籍の文字の大きさは3mm程度だが、例外的に2mm程度の印刷物がある(CDのライナーノートなど)。
 それを300dpiでスキャンすると文字が粗くなってしまうので、解像度を上げる。450dpiで文字のピクセル数が3mm×300dpiと同じになるが、文字があまり重要でない(OCRをかけない)場合はファイルサイズを考慮して400dpiでいいと思う。

 ちなみに小説の文庫は、ハードカバーに比べると文字を小さくしているわけではない。文字の大きさは変わらないが、文字の間隔を狭く詰めることで1ページに文字をたくさん入れている。

QooQ