■動物の顔を他の動物の顔と入れ替える画像間変換技術が開発された■「出力すべきもの」を事前に与えられることなく、少量のデータから画像変換を学習するアルゴリズム”FUNIT”を利用
■アルゴリズムに、あるものの見た目を他のサンプルを元に推測させることで、少ない訓練画像で「一般化」が可能に
これは試さずにはいられない。
米半導体メーカーNVIDIA社が、愛するペットの顔を他の動物の顔と入れ替えることができる画像間変換技術を開発した。
PetSwapと呼ばれるこの技術は、「出力すべきもの」をあらかじめ与えられることなく、少量のデータを用いて画像間変換を学習する”Few-shot UNsupervised Image-to-image Translation (FUNIT)”というアルゴリズムを利用したものだ。
FUNITは、敵対的生成ネットワーク (GANs) をもとに構築されたフレームワークを用いている。これは、NVIDIA社が架空の人物を作り出したり、現実には存在しない条件下で自動運転車を訓練したりすることにも利用してきたネットワークだ。
研究者たちは、PetSwapについての査読前の論文の中で、ヒトが「一般化」にいかに優れているかを説いている。
https://arxiv.org/abs/1905.01723
少ない訓練画像でも「一般化」が可能なアルゴリズムを開発
仮にあなたが、これまで目にしたことがない動物の写真を見たとしよう。あなたは、その動物が異なるポーズを取る姿を頭の中で鮮明に描くことができるだろう。
特に、過去にそれと似たような動物がそのポーズを取る姿を見たことがあれば、想像するのはなおさら簡単だ。これを「一般化」という。
ところが、機械学習のアルゴリズムにはそれができない。
そこでFUNITでは、その想像のギャップを埋めようと試みた。アルゴリズムに、あるものがどんな見た目をしているかを、他のサンプルに基づいて推測させることで、少ない訓練画像でも「一般化」を可能にしたのだ。
NVIDIAは、PetSwapをお試しできるデモ版を公開している。元記事の筆者サマンサ・コールさんが飼い猫の写真で試したのが、下の画像だ。1枚目の猫の写真を元に生まれたのが、2〜16枚目のこの世に存在しない生き物たちだ。
ちなみに、PetSwapは人間には対応していないが、サマンサさんは衝動を抑えられなかったようで…。
なかなかいい線いってる。特に16番の「マングース」がかわいくて、サマンサさん一番のお気に入りとのこと。