科学を好きな人を増やすメディア、ナゾロジー！世の中にある沢山の不思議を冒険しよう！

Love science , enjoy !

youtubeチャンネルナゾロジー

数式から自動生成した幾何画像のデータセットで画像認識AIが誕生 — 数式から自動生成した幾何画像のデータセットで画像認識AIが誕生 / Credit: FractalDB, ささはら千鶴

artificial-intelligence

画像認識AIの事前学習に写真がいらなくなる？新技術「FDSL」登場！

2022.08.29 18:00:43 Monday

画像認識AIというとどんなイメージが浮かぶでしょうか？

身近な例では、スマホの顔認証や、画像の文字をテキスト化する文字認識などに使われるAI技術が挙げられます。

画像認識AIが世に出されるには、開発における事前学習の段階で使用されるデータセットに大量の写真が必要です。

しかし、データセットの作成は、従来のやり方では人間の作業量が膨大になるほか、画像収集自体が困難な場合もあります。

そこで最新技術として、写真が含まれないデータセットを用いた高精度な画像認識AIモデルを構築する手法が開発されました。

なんと、写真の代わりに、数式によって生成された画像を使用したそうです。

この技術はFormula-driven Supervised Learning（FDSL）と称され、2022年6月に産業技術総合研究所の片岡主任研究員のグループにより発表されました。

大量の実画像データの収集が不要なAIを開発（産業技術総合研究所） https://www.aist.go.jp/aist_j/press_release/pr2022/pr20220613/pr20220613.html 産業技術総合研究所（産総研）公式Twitter https://twitter.com/AIST_JP/status/1537391220867346432?s=20&t=kFtHKgDB9WRikwMh-fH7-g Pre-training without Natural Images（cvpaper.challenge） https://hirokatsukataoka16.github.io/Pretraining-without-Natural-Images/ 【メタサーベイ】数式ドリブン教師あり学習 https://www.slideshare.net/cvpaperchallenge/ss-251948753

Pre-Training Without Natural Images https://hirokatsukataoka16.github.io/Pretraining-without-Natural-Images/ Can Vision Transformers Learn without Natural Images? https://arxiv.org/abs/2103.13023 Replacing Labeled Real-image Datasets with Auto-generated Contours https://arxiv.org/abs/2206.09132

youtubeチャンネルナゾロジー

なぜ雪の結晶はすべて「六角形」なの？身近な疑問を解説

なぜ雪の結晶はすべて「六角形」なの？身近な疑問を解説

『消滅したはずの人間の遺伝子を持つ赤ちゃんが生まれる』この世に存在しない兄弟の子どもを産んだ夫婦

『消滅したはずの人間の遺伝子を持つ赤ちゃんが生まれる』この世に存在しない兄弟の子どもを産んだ夫婦

NASAが宇宙空間で「鉛筆」を使おうとしなかった理由とは？宇宙で文字が書ける「フィッシャー・スペースペン」の凄さ

NASAが宇宙空間で「鉛筆」を使おうとしなかった理由とは？宇宙で文字が書ける「フィッシャー・スペースペン」の凄さ

【恐怖】動物を石化させる「ナトロン湖」人間が落ちたら？

【恐怖】動物を石化させる「ナトロン湖」人間が落ちたら？

目次

FDSL(Formula-Driven Supervised Learning)とは？

Fractal Database — Fractal Database / Credit: Pre-training without Natural Images (IJCV / ACCV 2020 Best Paper Honorable Mention Award)

今まで画像認識AIの開発には、大量の写真によるデータセットが不可欠でした。

しかし本研究では、数式から幾何画像によるデータセットの自動生成が可能になり、事前学習を行ったところ、従来のデータセットと同等以上の精度が実現できたということです。

この技術をFDSL(Formula-Driven Supervised Learning)といいます。

いったいなぜ、数式から画像データセットを作るというユニークな手法が必要だったのでしょうか。

少なくとも、人の手で数千枚、数万枚といった大量の写真を準備する大変さはイメージできると思います。

その労力が大幅に軽減されるだけでも大きな成果なのですが、それと同時に、従来の画像認識AI開発では生じやすい問題を回避できる技術としても期待されています。

従来の方法による問題点とは具体的にどのようなものがあり、FDSLにするとどのようなメリットがあるのでしょうか。

膨大な作業コストを超削減！

大規模なモデルを用いた画像認識AIには、あらかじめ大量の画像をインプットし、画像認識を学習させることで機能しているものがあります。

その開発過程では、人間がAIにやってほしい特定の画像認識をAIができるようにするため、初めに「事前学習」、次に「ファインチューニング」と二段階経ることがあります。

画像を見たことがない開発段階のAIは、まず大量の写真を読み込み「なるほど、画像の識別ってこうやるのか」と理解します。これが事前学習です。

それから、ファインチューニングといって、具体的にやってほしいタスクの例題をAIにたくさん解かせ、使用目的に合った判別が十分にできるよう調整がなされます。

本研究では、最初の工程の事前学習で「大量の写真」が不要となる新たな手法が開発されました。

これについて、まずは「事前学習」のプロセスから詳しくみていきましょう。

事前学習を例えるなら、人間の試験勉強のイメージです。

英語の試験なら「単語の暗記」や「文法問題を解く」といった勉強を経て、私たちは最終的に試験で高い点数を取ることができます。

それと同様で、画像認識AIも事前学習では、様々な写真を大量にインプットし、何が写っているのかを答えるという訓練を繰り返します。

なお、そのAIの答えが合っているかどうかは、予め人間がその写真に付けている「教師ラベル」によって判別されます。この学習の手法を「教師あり学習」といいます。

この教師あり学習を行うには、データセットに使用する写真を大量に収集するばかりでなく、収集したすべての写真に対し、人間が一枚ずつラベリングする作業を行わなければなりません。

100万枚以上ある写真の一枚一枚に対し「犬」「猫」など写っているもののカテゴリを人が判断し、付与する作業を想像してみてください。

ラベル付けイメージ — ラベル付けイメージ / Credit: ささはら千鶴

実際のラベリング作業は、もちろん少数で行うわけではありません。

例えば、現在よく使われる1400万枚以上の写真によるデータセット「ImageNet」の作成時には、クラウドソーシングから結果的に5万人ほどが作業に参加しましたが、それでも完成までに3年かかりました。

そして、仮に数万人がラベリング作業に参加できたとして、全員が正しい知識をもってカテゴライズできているとも限りません。

そのため、誤ったラベル付けを修正するためのダブルチェックや、段階に応じたデータの管理などが必要となり、時間がかかるうえに、人件費がかさみます。

そして、データセットは完璧な状態には至らず、数％は次のようなラベルの付け間違いが起こっているのも事実です。

ImageNetに含まれる誤りラベルの例 — ImageNetに含まれる誤りラベルの例 / Credit: ImageNet, ささはら千鶴

このような明らかなミスがありえるのか？と言いたくなるのもわかります。

ですが実際、ウォーリーを探せのごとく、大量のデータに目を通して間違い探しを行うため、見逃しも起こり得るのでしょう。

大量の写真に対して人間が一枚ずつ手を加えるという条件では、正確性の面でも限界があるようです。

大規模な研究をしたいという気持ちがあっても、以上のような障壁があるとわかれば、研究者も簡単に手を出しづらいでしょう。

そこで、数式から画像データセットを自動生成できるFDSLの出番です。

本研究では、主に次のようなフラクタル幾何の画像が使われました。

数式から生成されるフラクタル幾何画像の例 — 数式から生成されるフラクタル幾何画像の例 / Credit: FractalDB, ささはら千鶴

片岡研究員は、植物などフラクタルの特徴をもつ本物の自然物から着想を得たそうです。

また、幾何学的構造のなかでも、フラクタル幾何は比較的単純な数式で作れるということでした。

そして、FDSLは画像の自動生成だけでなく、同時に教師ラベルを付ける作業も自動で行ってくれます。

教師ラベルは「124」「258」などの数字として、図形のカテゴリごと自動で割り当てられます。

こうして、人間の作業コストは大幅に削減され、ラベルの誤りについても心配無用となりました。

人工の幾何学的な画像が、現実世界の画像認識に役立つなんて不思議ですよね。

なぜ、実際の写真でなくてもよい可能性があるという考えに至ったのでしょうか。

産業技術総合研究所の公式Twitterで、片岡主任研究員は次のようにコメントしています（一部抜粋）。

初見でイヌとネコを識別するのは難しいので、まずはイヌネコに限らず「あらゆるモノを見分けるコツ」を教え込むわけです。
モノの見方を教えるだけなら、実物ではなくモノの特徴をもった図形でもよさそうな気がしますよね？こうして研究がスタートしました。

奇想天外な発想にも思えますが、これを実行に移したのはすごいですよね。

さて、この技術によって、作業コストのほかにも、データセットにありがちな諸問題が防げるといいます。

いったい他にどういった問題があったのか、次に見ていきましょう。

次ページデータセットでありがちな問題も心配無用！

<

1

2

>

人気記事ランキング

Amazonお買い得品ランキング

日用品

1位

マモルームお部屋まるごと予防空間ダニ用 [2ヵ月用セット] ダニアレル物質の生成抑制・ダニを除去しやすくなるダニよけ加熱蒸散機ダニ対策 (アース製薬)

マモルームお部屋まるごと予防空間ダニ用 [2ヵ月用セット] ダニアレル物質の生成抑制・ダニを除去しやすくなるダニよけ加熱蒸散機ダニ対策 (アース製薬)

2位

レック激落ちくん重曹超厚ウエットシート 30枚入除菌 (20×30cm) / アルカリ電解水配合 / 24時間抗菌/フローリングシート/手垢皮脂食卓などのベトベト汚れに/日本製/ホワイト

レック激落ちくん重曹超厚ウエットシート 30枚入除菌 (20×30cm) / アルカリ電解水配合 / 24時間抗菌/フローリングシート/手垢皮脂食卓などのベトベト汚れに/日本製/ホワイト

3位

by Amazon ごみ袋半透明シャカシャカタイプ 45L 200枚(100枚×2箱)

by Amazon ごみ袋半透明シャカシャカタイプ 45L 200枚(100枚×2箱)

4位

アース渦巻香プロプレミアム蚊取り線香蚊駆除寄せ付けない侵入阻止屋内も屋外も 60巻函入

アース渦巻香プロプレミアム蚊取り線香蚊駆除寄せ付けない侵入阻止屋内も屋外も 60巻函入

5位

【マイク専用】除菌消臭済袋　1000枚入 (JUST)

【マイク専用】除菌消臭済袋　1000枚入 (JUST)

スマホ用品

1位

エレコム半固体電池モバイルバッテリー 10000mAh PD35W Type-C USB-A 燃えにくい安全設計長寿命 2000回サイクル 3台同時充電残量表示軽量220g PSE認証機内持ち込み可 iPhone対応ミッドナイト EC-C61MN

エレコム半固体電池モバイルバッテリー 10000mAh PD35W Type-C USB-A 燃えにくい安全設計長寿命 2000回サイクル 3台同時充電残量表示軽量220g PSE認証機内持ち込み可 iPhone対応ミッドナイト EC-C61MN

2位

CIO フラットスパイラルケーブル CtoC 1m (Type-C/USB-C) PD 急速充電平型磁石マグネット吸着まとまる充電ケーブル PD 240W データ転送 480Mbps (ブラック, 1m)

CIO フラットスパイラルケーブル CtoC 1m (Type-C/USB-C) PD 急速充電平型磁石マグネット吸着まとまる充電ケーブル PD 240W データ転送 480Mbps (ブラック, 1m)

3位

GuliKit TT Max コントローラー TMRテンション調節可能スティックワイヤレス/有線【競技レベルの速さ】 PC/Switch/Switch 2/Android/ios対応マクロループ Turbo連射 Switch1& 2スリープ解除背面ボタン付き 6軸ジャイロ HD振動/スーパー触覚/ローター振動マイクロトリガー RGBライトドリフト防止超低遅延無線ゲームパッドスイッチゲームコントローラー Bluetooth 950mAh大容量バッテリー日本語説明書付きブラック

GuliKit TT Max コントローラー TMRテンション調節可能スティックワイヤレス/有線【競技レベルの速さ】 PC/Switch/Switch 2/Android/ios対応マクロループ Turbo連射 Switch1& 2スリープ解除背面ボタン付き 6軸ジャイロ HD振動/スーパー触覚/ローター振動マイクロトリガー RGBライトドリフト防止超低遅延無線ゲームパッドスイッチゲームコントローラー Bluetooth 950mAh大容量バッテリー日本語説明書付きブラック

4位

エレコム USB Type C ケーブル 1m 60W PD対応やわらか高耐久シリコンメッシュケーブルバンド付き【 iPhone(15以降)/MacBook/iPad/Galaxy/Android など対応】ホワイト MPA-CCECSM10WH

エレコム USB Type C ケーブル 1m 60W PD対応やわらか高耐久シリコンメッシュケーブルバンド付き【 iPhone(15以降)/MacBook/iPad/Galaxy/Android など対応】ホワイト MPA-CCECSM10WH

5位

256GB マイクロメモリーカードマイクロカード超高速データ転送 Full HD & 4K UHD動画高耐久性交換アダプター付き耐温度防水 X線をサポートする耐磁性

256GB マイクロメモリーカードマイクロカード超高速データ転送 Full HD & 4K UHD動画高耐久性交換アダプター付き耐温度防水 X線をサポートする耐磁性

ゲーム

1位

Switch コントローラーワイヤレスホール効果スティック RGBライト背面ボタン付きスイッチコントローラー TURBO連射 4段階振動調整 6軸ジャイロセンサー 800mAhバッテリー Switch/Switch2/PC/Android/IOSに対応プロコン

Switch コントローラーワイヤレスホール効果スティック RGBライト背面ボタン付きスイッチコントローラー TURBO連射 4段階振動調整 6軸ジャイロセンサー 800mAhバッテリー Switch/Switch2/PC/Android/IOSに対応プロコン

2位

ドラゴンクエストトレジャーズ蒼き瞳と大空の羅針盤 -Switch

ドラゴンクエストトレジャーズ蒼き瞳と大空の羅針盤 -Switch

3位

Nintendo Switch(有機ELモデル) Joy-Con(L) ネオンブルー/(R) ネオンレッド

Nintendo Switch(有機ELモデル) Joy-Con(L) ネオンブルー/(R) ネオンレッド

4位

キングダム 68 (ヤングジャンプコミックス)

キングダム 68 (ヤングジャンプコミックス)

5位

Switch版サンセットヒルズ【メーカー特典あり】木製ジオラマスタンド&サウンドトラック&デジタルアートブックDLコード&特製スリーブ同梱

Switch版サンセットヒルズ【メーカー特典あり】木製ジオラマスタンド&サウンドトラック&デジタルアートブックDLコード&特製スリーブ同梱

小説

1位

夏帆―The Tale of KAHO―

夏帆―The Tale of KAHO―

2位

忌録: document X

3位

プロジェクト・ヘイル・メアリー　上 (ハヤカワ文庫SF)

プロジェクト・ヘイル・メアリー　上 (ハヤカワ文庫SF)

4位

【電子特典付特別版】『機動警察パトレイバー』寿司屋の後藤 (文春e-book)

【電子特典付特別版】『機動警察パトレイバー』寿司屋の後藤 (文春e-book)

5位

プロジェクト・ヘイル・メアリー　下 (ハヤカワ文庫SF)

プロジェクト・ヘイル・メアリー　下 (ハヤカワ文庫SF)

AI・人工知能のニュースartificial-intelligence news

もっと見る

役立つ科学情報

注目の科学ニュースpick up !!