Proofigとの新たな提携を発表!詳細はこちら
先週議論したように、AIは特定の単語やフレーズを過剰に使用する傾向があります。例えば「~の証左として」から「掘り下げる」まで、いくつか思い浮かぶかもしれません。こうした表現を十分に目にするなら、扱っているテキストがAI生成である確かな指標となり得ますが、その数は膨大すぎて個人が把握しきれるものではありません。
この問題を解決するため、当社では最近「AIフレーズ」と呼ばれるツールを導入し、こうした表現を特に強調表示しています。このツール開発の一環として、最も頻繁に使用されるAIフレーズの大規模なデータセットを構築しました。本記事では、当社データセットに現れる代表的なAIフレーズをいくつか紹介し、AI生成テキストに対する自身の直感を研ぎ澄ますためにそれらをどう活用できるかについて解説します。
最も明白な点から始めましょう:AIが自らAIだと明かす場合があるのです!これは往々にして拒否の結果として発生します。ユーザーがAIに指示されていないことを要求した場合、AIは要求に応じられないことを伝えねばならず、その過程でモデルは自らAIであることを認めることが多いのです。 多くのAI拒否は「AI言語モデルとして…」というフレーズで始まる。したがって、この種の表現はAIテキストでは比較的頻繁に見られるが、人間のテキストでは極めて稀である。数値データもこれを裏付けている!AIで最も頻繁に用いられるフレーズの多くは自己言及的だ。
| フレーズ | より一般的な回数 |
|---|---|
| AI言語モデルとして、 | 294,000x |
| 私には個人的な | 67,000x |
| 残念ながら、私には十分な | 54,000x |
| 言語モデル、私はできません | 53,000x |
AIアーティファクトは「最も使い古された」AI表現の一つだが、結局のところかなり明白で、したがってあまり面白みがない。ここからが興味深い部分だ:AIテキストで確かに過剰に現れるが、「AIであること」とは無関係な表現である。いくつか例を挙げよう:
| フレーズ | より一般的な回数 |
|---|---|
| 痛切な | 49,000x |
| 強力なリマインダーとして | 43,000x |
| 永続性の思い出 | 31,000x |
| 数多くの課題に直面した | 30,000x |
| 我々の結果は、新たな知見を提供する。 | 22,000x |
| 複雑な相互作用の中に | 21,000x |
| 強力な役割を果たす | 10,000x |
| 貴重な知見を提供する | 5,000x |
| 証となる | 4,000x |
| 新たに得た目的意識 | 4,000x |
| 想像を絶する事態に直面してもなお | 3,000x |
| 可能性の思い出 | 3,000x |
AIが「AIとして…」と言うことがAIテキストでより一般的である理由は容易に理解できる。しかし、パート2の関連性のないように見えるフレーズがより頻繁に見られる原因は何か?まず第一に、「モード崩壊」と呼ばれる現象がある。これはAIの出力が、確率の高い単語の並びに依存することで過度に一般的または反復的になる現象だ。モード崩壊...
さらに、トレーニング後にはRLHF(人間からのフィードバックによる強化学習)を実施するのが標準的な手法です。このプロセスでは、人間のアノテーターがAI生成テキストを複数の属性に基づいて評価し、特定のパターンを促進したり抑制したりします。この過程で、特定回答や表現が人間アノテーターから評価されやすい場合、それらは次第に頻度を増していきます。
その結果、こうした使い古されたフレーズの一部は、単なるAIライティングの特徴というよりも、特定のモデルやアーキテクチャ、学習プロセスに特有のものと考えられる。メリーランド大学のジェナ・ラッセル、マルゼナ・カルピンスカ、モヒット・アイヤーによる論文は、異なるモデルが実際に異なる好ましいフレーズを持つことを示している:
使い古された
これは、異なるデータセットと最適化戦略で訓練された異なるモデルが、フレーズの反復においてそれぞれ固有の傾向を発達させ得ることを示唆している。
私たちの業務の一環として、チームはAI生成テキストの読解と分析に計り知れない時間を費やしてきました。当然ながら、こうしたフレーズの一部には親近感を抱くようになりました:
こちらが私たちのチームのお気に入りAIフレーズです:
マックス(CEO):「絶えず進化する中で」(11,000倍)
ブラッドリー(CTO):「重要な注意点」(3,000倍)
ルー(創設エンジニア):「複雑な性質」(6,000倍)
エリアス(創設エンジニア):「鮮やかなタペストリー」(17,000倍)