JPEGの圧縮率はいくつにするべきか

2017/08/19

自炊・電子書籍

 〔約1400文字|読了の目安:2.8分〕

 書物をスキャンした画像はJPEG(追記:WebPの方が圧縮率は高い)で保存する。PDFで保存するスキャナーもあるが、内部はJPEGなので同じことだ。PNGだと可逆圧縮なので画像が劣化しないが、ファイルサイズが増えるし処理時間もかかる。

 JPEGの圧縮率はソフトによって指定方法が違うので、これだ、と明確に指定できない。また圧縮アルゴリズムも複数あるようで、ソフトが異なると、同じファイルサイズだからといって同じ画質になるとは限らない。

代表的なソフトでの圧縮率の指定方法

 画質:低~高
Photoshop0~12
GIMP0~100
XnConvert*0~100

*: 複数の画像を一度にレベル補正、トリミングなどの処理をするソフト。スキャン後に使用する。

Photoshopでの画質とファイルサイズの比較

↓画質の比較

↓ファイルサイズの比較(文章)*1

圧縮方法圧縮率
無圧縮100%
PNG14%
JPEG 画質1015%
JPEG 画質810%
JPEG 画質58%
JPEG 画質05%

↓ファイルサイズの比較(漫画)*2

圧縮方法圧縮率
無圧縮100%
PNG36%
JPEG 画質1029%
JPEG 画質821%
JPEG 画質515%
JPEG 画質09%

*1: 文章のみの1ページを圧縮して比較。無圧縮を100として比率を計算
*2: 漫画の1ページを圧縮して比較

 文章のみのページでPNGの圧縮率が高いが、これはPNGはベタ塗りの画像が得意なため。余白が多いので圧縮率が高くなっている。漫画は画像が複雑なので圧縮率が落ちる。
 文章のみの本ならPNGでもいいが、PNGは圧縮/展開に時間がかかる。文字の周囲に多少ノイズが出ても読むには支障ないので、JPEGでいいと思う。

 参考:画像形式による保存速度、圧縮率の比較

 とはいえ文字の周囲にあまりノイズが出るとOCRに支障が出る。ファイルサイズとノイズのちょうどいい点を探ると、通常は圧縮率8、画集など大事な画像は圧縮率10というところではないだろうか。

Photoshopと他のソフトの圧縮率の比較

 Photoshopと他のソフトで、ファイルサイズと画質が大体同じになる圧縮率の値はこの辺。

 通常高画質
Photoshop画質8画質10
GIMP85%93%
XnConvert80%95%

 ソフトによってJPEG圧縮のアルゴリズムが違い、XnConvertは、Photoshopに比べると少し画質が落ちる。

 JPEGの保存オプションにある「最適化」という項目をオンにすると、画質は変わらずファイルサイズが少し減る。それ以外のオプションは使う必要はないと思う。

本1冊のファイルサイズ

 解像度300dpi、圧縮率をPhotoshopの画質8相当で自炊した場合、本1冊のファイルサイズを平均すると、これくらいになる。

文庫本(小説)……約54MB
少年ジャンプ単行本……約130MB

 テラバイト級のハードディスクがある現状からすると、もっと画質を上げてサイズを増やすこともできる。
 だがタブレットのような携帯機器で読むことを考えると、ストレージ容量に限度があるのである程度抑えたい。サイズが大きいと携帯機器への転送にかかる時間も延びる。

 Kindleなどで販売されている少年ジャンプ単行本の電子書籍は、1冊30~50MBらしい(最近はもっと増えてるかも)。自炊した場合に比べて低画質なことが伺える。
 低画質な電子書籍を紙の本の8~9割程度の値段で売っているわけだが、消費者は解像度とJPEGノイズのことなんてわからないとタカをくくっているのだろう。一方で4Kとか8Kとか高解像度の商品が売りにされているのはおかしい気がするが。

QooQ