AIはどうやって『怪しい雑誌』を見破った? - ナゾロジー

AIはどうやって『怪しい雑誌』を見破った?
AIはどうやって『怪しい雑誌』を見破った? スタート地点として、研究チームは「信頼できる雑誌(ホワイトリスト)」と「疑わしい雑誌(ブラックリスト)」の2つのデータセットを用意します。これらは、過去のDOAJ(オープンアクセス雑誌ディレクトリ)の判定をもとに分類されています。AIに学習させるために、この2つのグループからさまざまな特徴データを抽出します。 特徴データは主に3つのグループに分かれています。ひとつは「ウェブサイトの内容」――たとえば雑誌の「目的・範囲」「編集委員の情報」「公開ポリシー」や「倫理規定」など、読者や投稿者向けのテキスト情報です。ふたつめは「ウェブサイトのデザイン」で、これはトップページの画像やHTMLコードなど、その雑誌サイトの“見た目”や“つくり”のパターンです。みっつめは「ビブリオメトリクス」と呼ばれるもので、これは論文の引用関係や著者・機関のデータなど「どんな研究が集まり、どんなふうに引用ネットワークが広がっているか」を数値化した指標です。 このようにして集めた情報をAIに一括で学習させることで、「どの特徴が“怪しさ”につながりやすいか」をAI自身が見抜けるようにしています。図の中には「機械学習モデル」や「分類器(Classifier)」といった言葉が出てきますが、これはAIが“お手本データ”を見て自分でパターンを見つけ、最終的に未知の雑誌に対して「これは怪しいかも」「これは信頼できそう」と判定する仕組みです。全体としては「雑誌データの用意 →さまざまな特徴データの抽出 →AIへの学習・分類モデルの構築 →未知の雑誌データにAIを適用して判定」という流れになっています。Credit:Han Zhuang et al . Science Advances 2025

AI・人工知能のニュースartificial-intelligence news

もっと見る

役立つ科学情報

注目の科学ニュースpick up !!