「元の画像」と「ぼかし画像」の情報量を比較し、鮮明さを定量化する手法
チャン氏ら研究チームは、画像の鮮明さを評価する手法を開発する上で、次のように述べています。
「『鮮明さ』をぼかしに対する抵抗力と定義しました。
絵師たちが、作品がどれだけはっきり見えるかを評価するために、キャンパスをズームアウトして全体像を確認する技法から着想を得ました。
数学的には、鮮明度は色のコントラストやその空間的分布で表現できます」
チャン氏が鮮明さを定量化するために用いた手法とは、「元の画像」と、「意図的にぼかした画像」を比較することで、元の画像がどれだけ鮮明だったかを測るというものです。
具体的には、用意された元の画像において、隣り合うピクセル(デジタル画像の最小単位)をランダムに入れ替えることで、その画像を段階的にぼかしていきます。
そしてそれらぼかした画像と、元の画像を比較し、「どれだけ類似性を保っていられるか」調べます。
実際、元の画像が鮮明であればあるほど、ぼかしに対する抵抗力が高く、ぼかしても元の画像に類似した構造が保たれます。
つまり、画像に描かれている構造を壊すにはより強いぼかしが必要です。
一方、元の画像があまり鮮明でない場合、少しのぼかしでも簡単に構造が壊れてしまいます。
つまりこの研究では、意図的なぼかし操作で「鮮明度さをぼかしに対する抵抗力」と定義することで、鮮明さを数値化することに成功したのです。
さらにこの研究では、色の多様性を示す「シャノンエントロピー」という物理学的な指標も併用し、画像の鮮明さと情報量を同時に分析できるようにしました。
つまり画像の鮮明さ(構造的安定性)を、物理学でよく使われる「エネルギー」や「エントロピー」と類似した概念で表現しているのです。
具体的には、画像のピクセルをランダムに入れ替える過程を「構造のエネルギーを増加させる操作」として捉えています。
物理学では、システムの安定性や変化をエネルギーの観点から解析することが一般的です。
今回の研究では、画像のぼかしを「物理的な構造が壊れていくプロセス」に見立て、エネルギーの変化を数値的に測定しています。
絵師の作成した絵画に物理学的なエントロピーとエネルギーの概念まで持ち込み、その分析から新発見に辿り着いた著者の熱意には驚くばかりです。
ちなみに、研究の題材に選ばれたのは、さくらみこ氏を描いた画像であり、今回の手法により、さくらみこ氏の画像の鮮明さを客観的に示すことが可能なりました。
これは35Pたちにとって嬉しいことでしょう。
チャン氏は、今回の研究が始まったきっかけを振り返り、「『押し事』への情熱を『お仕事』に注いだ結果、今回の論文が生まれました」と述べています。
(※推しへの熱意が学術的発見につながった貴重な例ともなるでしょう)
彼が開発した手法は、視覚的な特性を客観的かつ数値的に評価するための新たな可能性を開きます。
将来的には、映画やアニメの解析、デザインの最適化、AI生成画像の解析に至るまで、様々な分野の芸術作品を評価し、品質を向上させることに役立つかもしれません。
(※本記事には論文リンクが張られていますが、論文には多くのキャラクターたちの二次元画像が実際の分析資料として用いられています)
記事内容に一部誤りがあったため、修正して再送しております。
研究を紹介していただき、ありがとうございます!とても光栄です。ただ、一点だけ補足させてください:
記事では「元の画像が鮮明であれば、ぼかすと大きく異なる作品になる」とありましたが、実際には逆です。元の画像が鮮明であるほど、ぼかしに対する抵抗力が高く、ぼかしても元の画像に類似した構造が保たれます。画像に描かれている構造を壊すには、強いぼかしが必要です。
鮮明でない画像は構造が曖昧なので、少しのぼかしでも簡単に構造が壊れてしまいます。例えば、ノイズ画像はほんのわずかなぼかしで全構造が失われますし、単色画像ではそもそも構造がないので鮮明度はゼロです。
補足/修正していただけますとありがたいです…!
ほ、本人?!
話題性に富んだ研究で、みこちを全面に出して来るところも素晴らしいです!これからの研究も頑張って下さい!
イラストもそうなのですね。
私は音声合成『UTAU』で遊んでいますが、芯のある声ほど加工で劣化しにくいと感じました。
人気の秘密を数値化できるのは、科学の勝利ですね。
逆だったのか…
凄いですね。面白い。
ぼんやりとした文章。ぼんやりとした味。ぼんやりとした音質。
というように、ぼんやりって表現は、あらゆる物事にあります。
この話深くて、意味自体に対する鮮明さを数値化できるのかも。
これ、かなりいい研究だと思う。
今までいわゆるSNS映えする、色のジャンプ率の高いアイコンやイラストは何となくイラストレーターの中で映えるものとして認識されてたけど、
それがRGB値の離散値として明確にされたことで、いかに人気になる絵が色のジャンプ率が高いかというのが明確になったかわかる結果になった。
広告と一緒で、ちょっと色がチカチカするくらいが目を引くんだよね。なのでアイコンや人気絵は絵というよりもはや看板や広告デザインの領域。