Proofigとの新たな提携を発表!詳細はこちら

パングラムのAIフレーズのご紹介

エリヤス・マスルール
2025年2月14日

注意深く観察すれば、テキスト内にAIによって書かれたことを示す手がかりをしばしば見つけられる。特定の文構造、語彙選択、または書式設定は、人間のテキストよりもAIテキストにおいてはるかに頻繁に現れる。

すでにいくつかのフレーズがAI生成テキストの特徴だと気づいているかもしれません。例は数多く存在します:「複雑なタペストリー」「~の証左」といった表現や、作家兼投資家のポール・グラハムが広く知らしめた「delve(掘り下げる)」という言葉さえも。

ポール・グラハムのツイート

さて、Pangramダッシュボードを日常的にご利用の方なら、以下のAIエッセイにある「複雑なタペストリー」のような、AIが過剰に使用する表現を強調表示し始めたことにもお気づきかもしれません。

これがパングラムの新しいAIフレーズツールです!仕組みは次の通りです:

文書をスキャンした際、PangramがAI生成と判定した場合、AI特有のフレーズを検出するための二次スキャンを実行します。

モデルの高精度化のため、数千万件に及ぶ人間とAIが生成した文書からなる内部データセットを活用しています。さらに、これらのデータセットを分析し、人間とAIの文章に共通する語句の連なりを抽出。統計データを比較することで、AIが特定のフレーズを過剰に使用している実態を検証しました。N-Gram分析(パングラムと発音が似ているのは偶然ではないかもしれません😊)という手法を用いた結果、驚くべき事実が明らかになりました。 AIが人間よりもはるかに頻繁に使用していると思われる無数のフレーズが明確に確認できました。その数があまりにも多いため、これらのフレーズをPangramダッシュボード上に直接表示するツールを構築することに決定しました。

なぜこれが重要なのでしょうか?

パングラムでは、人間の声を保存することに取り組んでいます。当社の中核となる検出モデルは、テキストに関する数十万もの詳細情報を処理し、それがAI生成かどうかを判断することが可能です。

ただし、説明可能性にも関心があります。特定のフレーズがAIテキストで過度に頻繁に現れることを知れば、なぜそのテキストがAIと判定されたのか(あるいは判定されなかったのか)をより深く理解し(他者に説明できるようになります!)。ある文章に、人間が書いたテキストよりもAIテキストで数百倍、数千倍も頻繁に現れるフレーズが複数含まれていると分かれば、当社の判断を裏付ける定量的な証拠がさらに得られることになります。

ユーザーの皆様には、テキストがAI生成であるかどうかだけでなく、その見分け方についても情報を提供し続けたいと考えています。AIフレーズはこの使命、そして解釈可能性に向けた私たちの取り組み全体において重要な役割を担っています。

今後のブログ記事では、AI分野で最も使い古されたフレーズをいくつか取り上げますので、お楽しみに!パングラムや当社の解釈可能性機能について詳しく知りたい方は、info@pangram.comまでお気軽にお問い合わせください

ニュースレターを購読する
AI検出研究に関する月次更新情報を共有しています。