AIヒューマナイザーとは、AI検出システムを回避するためにテキストを改変するツールです。AIヒューマナイザーは、人間らしい表現を取り入れることを主眼としておらず、あらゆる手段を用いて検出を回避するように作られています。その結果、テキストの質は低下します。なぜなら、ヒューマナイザーはAIが生成した粗雑なテキストを、より人間らしくなく、より理解しにくく、より不正確なものにしてしまうからです。これが、我々が「(粗雑さ)²問題」と呼ぶ事態を招くのです。
ヒューマナイザーが用いる戦略は、AI検出に対する根本的な誤解を露呈している。AI生成テキストは、堅苦しい言葉遣いや構造化された書式といった特徴を用い、「delve」や「tapestry」といった単語を多用することが知られている。ヒューマナイザーは、テキストを言い換えたり、句読点を操作したり、場違いな文字を挿入したりすることで、「100%人間によるもの」という判定結果をもたらす可能性のあるテキストを生成する。以前の記事で、文言を変更したりテキストにランダムな文字を挿入したりすることは、優れたAI検出を回避する上で効果的ではないことを示しました。
ほとんどの人間化ツールには独自のAI検出機能が搭載されており、テキストがもはやAI生成ではないことを示すことで、その処理の有効性をアピールしています。しかし、効果的なAI検出は人間化ツールや言い換えに対しても頑強であるため、これを鵜呑みにすべきではありません。
Humanizer_1は、ハイフンを頻繁にコンマに置き換えます。これは明らかに意図的なものです。ハイフンが164個含まれる194件のテキストのサンプルにおいて、Humanizer_1の出力にはハイフンが1つも含まれていません。これは文章の理解や文脈に影響を与える可能性があります。例えば、 多民族が混在する都心の通り 次のように人間味のある表現に置き換えられます: 多民族が混在する都心の通り. フランスによるメキシコへの第2次介入の時期は、 1861年~1867年 ~に 1861, 1867これは、範囲ではなく、2つの別々の年と解釈される可能性があります。
Humanizer_2 は、単語やフレーズを不必要に大文字に変換します:
ペントンビル刑務所で発生した刺傷事件という深刻な襲撃事件は、刑務所改革に関する新たな白書の発表に暗い影を落とし、英国の刑務所制度内で深刻化する安全上の危機を浮き彫りにした。
以下のHumanizer_5の出力では、ピリオドの後のスペースが削除され、ランダムにハイフンが挿入されています:
それは本当に興味深い質問ですね!ええ、実際にこれほど複雑な方法でコミュニケーションをとる動物もいますが、想像するほど一般的ではありません。つまり、かなり複雑な方法で会話をする生き物について話しているわけですね。ミツバチは、まさにその好例です。彼らの「ワグルダンス」は、単なる「食べ物を見つけた」というメッセージにとどまらず、実際にはもっと多くの情報を伝えています。- 太陽がどこから差しているか(その角度)。距離(ワグルの持続時間)。そのダンスには、かなりのエネルギーが込められていました。
引用文は、報道や調査の信頼性を高める役割を果たします。しかし、「ヒューマナイザー」に関しては、信頼性など微塵も考慮されていません。「ヒューマナイザー_1」は言い換えによって引用文を頻繁に削除しますが、「ヒューマナイザー_2」はさらに一歩進んで、元の引用文を改変し、提供された引用が正当なものだと読者に信じ込ませています。
人間化以前: 「ESMが完全に機能しないまま一日が過ぎるごとに、ユーロ圏にとってのリスクは高まる」と、匿名を条件に語ったEUの高官は述べた。「市場は断固たる行動と、我々の危機対応策のすべてが準備万端であることを確認する必要がある。ドイツによるこの遅延は、そのメッセージを損なっている。」
「ヒューマナイズ」の後: 「ESMが完全に機能しないまま一日が過ぎるごとに、ユーロ圏へのリスクは高まっている」と、匿名を条件に語ったEUの高官は述べた。「市場には断固たる措置が講じられていること、そして我々の危機対応手段がすべて活用可能であることを示さなければならない。ドイツによる遅延は、そのメッセージを損なうものだ」
Humanizer_1 は不適切な言い換えを行っています。このヒューマナイザーは、「若者」を指すのに非公式で口語的な「ヤングスター」という表現を用い、この不幸な状況の深刻な雰囲気を和らげてしまっています。
人間化以前: X氏は、ある若者とのもみ合いの末、重傷を負った状態で発見された。
「ヒューマナイズ」の後: ある少年との口論の後、X氏が重傷を負っているのが発見された。
Humanizer_3 は元のテキストを受け取ります: 生物学的システムは、多様なエンティティタイプが存在する不均一な情報ネットワーク(HIN)として捉えることが有効である。…… そして、次のように変更します: 生き物を、さまざまな種類のものが存在する多様な情報ネットワーク――HIN――として捉えると理解しやすくなります……その後、自然言語処理されたテキストは、その真の意味を言い換えた上で、略語「HIN」を使用します。
Humanizer_4は、変更を行うことで理解不足を露呈している チームの皆様へ ~に 関係各位.
Humanizer_1 より: 普段は幽玄な光の中に鮮やかな青色の輝きを放っていた彼の瞳は、今や暗く、苦痛に覆われており、そこには極めて人間らしい恐怖の痕跡が浮かんでいた。彼を取り巻いていた黄金色の輝きも、世界全体を震わせたその声の力も消え失せ、見物人たちの五感には血とオゾンの匂いが漂ってきた。
原文では作品全体を通して過去完了形が使用されていますが、Humanizer_1による改変の試みにおいて、動詞の時制の言い換えが不適切に行われています。単純過去形(「was」、「were」、「made」)と現在完了形(「has covered」、「has vanished」)、および単純現在形(「is」)が誤って混在しています。
Humanizer_4 は 量はたっぷりあったが、多すぎて食べきれないほどではなかった。 少し複雑だが、この文を次のように解釈すると 料理の量はたっぷりだったけど、全部食べきれないほどではなかった。.
Humanizer_5の出力は最初はまとまりがあるが、次第に支離滅裂なものへと変貌していく。
人間化以前: 健康行動の総合スコアは、高血圧および糖尿病の発症と逆相関を示した(1ポイント上昇あたりの調整後リスク比:0.87、95%信頼区間:0.84~0.90)。
「ヒューマナイズ」の後: 「健康行動スコアが低い人ほど、高血圧や糖尿病などの問題を抱える可能性が高くなることが分かった」87;(95%信頼区間:0)。「いやあ、とんでもない結果だよね?」90)。
テキストの自然化処理の最中、Humanizer_5は突如として奇妙な自己宣伝を始めますが、出力文が長すぎて句読点も不十分であるため、その意図を把握するのは困難です:
「ああ、やっぱりそうなると思ったよ。」ライラが窓から顔をのぞかせると、一瞬、いつもの悲しげな表情が消え、純粋な興奮に変わっていた。「騎士だ!」彼女は、まるで私がそれを見ていないかのように叫んだ。「私のために来てくれたの!」AIについては、世間でいろいろと話題になっているよね?本当の科学と作り話を見分けるのは難しいこともある。 私たちは、そうした雑音を切り捨てて、何が可能なのかをお見せしたいのです。なぜなら、それは本当にワクワクする話だからです。これは遠い未来の話ではなく、今日私たちにできることなのです。こう考えてみてください。理解しにくい複雑なモデルではなく、実際に変化をもたらす実用的な応用について話しているのです。 AIが自分の仕事にどのような変化をもたらすか心配されている方もいらっしゃるでしょう。それは当然の懸念です。しかし、私たちの取り組みの大きな目的は、実のところ、業務をより簡単かつ効率的にし、人々が創造的な部分に集中できるようにすることです。AIやそれがビジネスにどのような意味を持つのかに興味をお持ちの方へ、私たちは現実的で実践的な知見を提供します。 私たちは、単なる流行語ではなく、分かりやすい説明と実用的な解決策を重視しています。さあ、これらすべてを一緒に解き明かしていきましょう。AIが実際にどのように役立つのか、余計な飾り気なしに明確に理解できるよう、私たちがサポートします。私は低く、警告するような唸り声を上げた。騎士に対してではない。彼女に対してだ。彼女は先走っていた。
Humanizer_2 は次のように述べています: ジャスティン・ジュウコはウガンダ生まれのプロボクサーで、30年以上にわたる輝かしいキャリアを築きました。彼は2度の世界王者になるという夢を叶えることができました。 原文にはそのような記述は一切なく、簡単に調べれば、ジュウコが2度の世界チャンピオンになったことは一度もないことが確認できる。これは妄想であり、原文では決して使われていない二人称代名詞が唐突に挿入されていることで、さらに不自然さを増している。
Humanizer_4 は重要な文脈を削除します カンポメリック異形成は、根治的な治療法がない希少な遺伝性骨格疾患であるため、治療は症状や合併症の管理に重点が置かれます。主な治療法は以下の通りです:.
新しい読みやすい文章では: 現在、カンポメリック異形成症の根治的な治療法は存在しないため、治療はこの疾患に伴う症状や合併症の緩和に重点が置かれている。主な治療法には以下のものがある:……にもかかわらず、カンポメリック異形成の定義については、まだよく分かっていません。
ヒューマナイザーは、AIが生成したテキストに多用される不自然な表現をより際立たせ、場違いなものとして浮き彫りにする。Cabanacらは、不自然な表現を「『人工知能』の代わりに『偽の意識』といったように、定まった表現の代わりに用いられる、予想外で奇妙な表現」と定義している。これらの研究者らは、AIが生成した科学論文において、この書き方が広く見られることを明らかにした。
言葉遣いがぎこちない文章の中で、AIが生成したレビューには次のように書かれていた: 料理に対する先入観が打ち砕かれた. これはあるレストランを称賛するために書かれたものですが、ヒューマナイザー・ツールは次のように表示しています: 私の食に関する誤解は解けた.
説明する 男性中心の航空業界, Humanizer_2は次のように表現した かつては男性が支配的だった航空業界. 不必要な言い換えに加え、これは航空業界がもはや男性中心ではないことを示唆しているが、それは単に事実ではない。
おそらく、より分かりやすい例としては、Humanizer_2が研究論文の要約を再解釈する際、数式記号を文字で書き換えるという手法が挙げられるだろう:
人間化以前: いずれの場合も、温度に依存するが体積には依存しない定数を持つサブガウス分布の集中が得られ、T ≤ T0 において Var u_x ≤ C T および P(|u_x| ≥ r) ≤ exp(−c r^2/T) が成立し、さらに共分散の最適な減衰も得られる。
「ヒューマナイズ」の後: 上記の2つのケースについて、温度の関数として体積に依存しない定数を用いたサブガウス型集中境界を提供する。十分に低い温度の場合、粒子変位の分散は C T 以下となり、ゼロ粒子位置からの変位が r 以上となる確率は、r² と T の比において指数関数的に小さくなる(T ≤ T0 の場合)。また、共分散境界は最適に減衰する。
AIによる文章の自然化ツールを使用する際、文章は長くなるものの、質は向上しないという現象がいくつか確認されました。こうしたツールは、文章の質を高めることなく、文脈や意味の重要な要素を削ぎ落としてしまうのです。
AI文章の「人間味」を加えるツールは有料(月額10~50ドル)ですが、そこで疑問が生じます。なぜわざわざお金を払って、自分の文章の質を落とすのでしょうか?特に、検出を回避するという主な目的が保証されていないのであればなおさらです。
ヒューマナイザーは、増え続ける「スロープコンテンツ」の問題の一因となっているが、スロープをさらに次元の高いレベルへと引き上げている:(スロープ)²。