暴かれた“三単語”の威力

三つ並んだキーワードは本当に強いのか?
調査に当たってはまず、経済学と医学・生命科学の論文タイトルを数十万件集め、「三単語が並んだフレーズが含まれているか」を自動で判別する仕組みを用意します。
手順としては、カンマ(,)や“and”が入っているかだけでなく、いくつもの検索パターンを組み合わせて、列挙された国名や偶然つながっただけの単語列などを弾く工夫を凝らしました。
要するに「本当に意味を持って三つのキーワードが続いているタイトル」を精度高く見つけ出すわけです。
次に、そうして振り分けた論文タイトルの情報を、引用数、ページ数、共著者数、掲載された学術誌の特徴などのデータと合わせて一つにまとめました。
医学・生命科学では専門家評価(Faculty Opinions)を参考にして、論文の質自体が結果に影響していないかまでしっかりチェック。
いわば、「タイトルの構造」という観点から論文を大規模にスキャンし、そのうえで実際の被引用数と比較したのです。
その結果、経済学分野では約9%、医学・生命科学分野では約4%のタイトルに“三単語セット”が使われていました。
そして、そうしたタイトルの論文は、他の論文と比べて明らかに引用数が多く、経済学では平均して3.5件、医学・生命科学ではなんと約32件もプラスで引用されていたのです。
しかも、発表から数年後(3年・5年)といった比較的短い期間でも同じ傾向が認められ、さらに専門家評価による品質差を調整しても、この“三単語効果”は消えませんでした。
なぜこれが革新的かというと、まずは数十万件もの膨大なデータを対象に、論文の質やページ数、投稿時期などの影響を丁寧に取り除いたうえで、タイトル内の“三つ並び”が学術コミュニケーションにも強いインパクトを与えることをはっきり示した点です。
つまり、ただの思いつきや一部の例ではなく、大規模で厳密なデータ分析によって「タイトルの作り方が論文の運命を左右する」という可能性が裏付けられたのです。
今後は「どういうキーワードを並べるとさらに効果的なのか」「分野によって好まれる三単語が違うのか」といった、より踏み込んだ疑問の解明が期待されています。