Quotidia は、AI に記事を書かせて運用しているメディアです。あるとき、文章から「AIっぽさ」を消すためのツールを試しに評価していました。そのツールは、ひとつの指摘をしてくれました。「あなたの文章のこの記号は、AIっぽさの典型です」と。

ところが評価を担当した側は、その指摘をこう受け流しました。「いや、これはうちの意図的な作風だから、ツールの指摘のほうがズレている」。そして、そのツールの価値を「限定的」と結論づけました。

その約20分後、人間の編集責任者が一言で覆しました。「その記号、全部AIっぽさだよ」。ツールは最初から正しく、間違っていたのは「作風だ」と言い張った側でした。

この記事は、その失敗の一部始終を、原因まで開いてお見せする実験レポートです。テーマは「ツールの正しい指摘を、自分の作風だと言い張って値引きしてしまう」という、AI に文章を書かせる人なら誰でも踏みうる落とし穴についてです。

状況設定: Quotidia は AI で記事を書いている

まず、前提のお話から。

Quotidia は、海外の AI ニュースを日本語で解説するメディアを、生成 AI 主体で毎日運用しています。記事を書くのも、レビューするのも、いまは AI が中心です。生成 AI とは、文章や画像を自動で作り出す AI のこと。ChatGPT のような対話 AI を思い浮かべてもらえれば近いです。

AI に記事を書かせていると、ひとつ避けて通れない問題があります。それが「AI臭(AIしゅうやAIっぽさ)」です。

AI臭とは何か

AI臭とは、文章を読んだときに「これ、AI が書いたな」と感じさせる、独特のクセのことです。専門的には「AI slop(スロップ)」とも呼ばれます。slop とは、もともと「ぐちゃっとした残飯」のような意味の英語で、転じて「質の低い、機械的に量産された中身の薄いコンテンツ」を指す言葉として使われています。

AI臭には、いくつかの典型パターンがあります。たとえば、やたらと大げさな見出し。どの記事も同じ形に整いすぎた構造。意味もなく多用される記号や装飾。読者に「なるほど、深い」と思わせたいだけの、中身の薄い言い回し。こうしたものが積み重なると、文章は「AI が書いた、のっぺりした量産品」の顔つきになってしまいます。

なぜ AI臭を消したいのか

理由は2つあります。

ひとつは、検索で評価されにくくなるからです。検索エンジンは近年、AI で機械的に量産された質の低いコンテンツを、評価から外す方針を強めています。AI臭の強い記事は、その網にかかりやすい。

もうひとつは、読者の信頼です。読者は思いのほか敏感で、「これAIが書いたやつだ」と感じた瞬間に、すっと興味を失います。せっかく中身が正しくても、AI臭が濃いだけで「読む価値が薄そう」と判断されてしまう。だから Quotidia は、AI に書かせるからこそ、AI臭をできるだけ消したいと考えていました。

試していたツール

そこで Quotidia が試しに評価していたのが、日本語の AI臭を検出するオープンソースのツールでした。名前は stop-ai-slop-jp といいます。リポジトリの説明書きには「日本語の文章からAI臭を取り除くためのClaude Skill。」とあり、見出しは「Stop AI Slop(日本語版)」。オープンソースとは、誰でも無料で使えて、中身も公開されているソフトウェアのこと。このツールは MIT ライセンスで公開されていて、誰でも無料で使え、自由に改変したり配り直したりできます。配布の形は、Claude Code という開発ツールの「Skill(スキル)」というもの。Skill とは、AI に特定の作業をやらせるための、ルールやチェックリストをまとめた部品のようなものです。

このツールがやってくれるのは、AI が下書きした日本語の文章を、公開する前にレビューすること。大げさすぎる見出し、「AではなくB」「3つの視点」のような繰り返しの型、どの段落も同じ長さに整いすぎた均一さ、そして全角ダッシュといった、AI 文に特有のパターンを見つけ出し、指摘して直してくれます。さらに、文章をスタンス・リズム・主体性・具体性・簡潔さの5つの軸で、それぞれ1〜10点で採点し、合計が50点満点中35点に届くかどうかを「公開していいかどうか」の目安にします。

要するに、このツールは「あなたの日本語、ここがAIっぽいですよ」と機械的に指摘してくれる、専門のチェック役です。Quotidia は、これを自分たちのレビュー工程に足すと品質が上がるかどうか、試していたのでした。

誤判断の瞬間: 「これはうちの作風だ」と言い返した

評価を進めるなかで、そのツールは、ある記号をはっきりと指摘しました。

「全角ダッシュ(文の途中に入る、長い横棒の記号)は、AIっぽさの典型です。消したほうがいい」と。

全角ダッシュというのは、文をいったん区切って、補足や余韻を付け足すときに使われる記号です。Quotidia の記事には、これがあちこちに入っていました。解説記事の見出しでは、論点を提示するときの区切りとして。文学的な文体で書く記事では、余韻を作る「間」として。

ここで評価側がやったこと

ツールにこう指摘されたとき、評価を担当した AI は、こう判定しました。

「この全角ダッシュは、うちが意図的に使っている作風だ。文学的な文体では余韻を作るために、解説記事では論点を提示するために、わざと多用している。だから、これを『AIっぽさ』として一律に消せというツールのルールは、うちの作風と衝突している。つまり、これはツールの指摘がズレているケースだ」

そして、この判定を根拠に、2つの結論を出しました。

  1. 文学的な文体の記事には、このツールを使わない(意図的な文体と喧嘩するから)
  2. ツール全体について「価値は限定的」と結論づける

言葉を変えると、こうです。ツールが指摘した中でいちばん核心的な「全角ダッシュ」を、「これはうちのこだわりだ」と裏返して、ツールの欠点ということにしてしまった。そして、その1点をきっかけに、ツール全体の評価まで引き下げてしまったのです。

このとき、評価側には「自分が正しい」という確信がありました。だって、わざと使っている記号なのだから。作風なのだから。ツールがそれを知らずに機械的に消せと言っているだけ、と。

突きつけられた事実: ツールが正しかった

その約20分後のことです。

人間の編集の最終責任者が、Quotidia の記事を見て、こう指摘しました。

「その全角ダッシュ、こそがAIっぽさだよ。作風じゃない。全部のモードで、やめよう」

そして、その場で方針が決まりました。すべての文体で、全角ダッシュを使うのを全面的にやめる。さらに、すでに公開していた30本近くの記事のタイトルからも、その記号を一斉に取り除きました。

つまり、こういうことです。ツールは最初から正しかった。「全角ダッシュはAIっぽさだ」というツールの指摘は、的を射ていた。間違っていたのは、それを「うちの作風だ」と言い張って値引きした、評価側のほうでした。

「意図的に使っている作風」という、評価の大前提そのものが、ひっくり返ったのです。わざと使っていたつもりの記号は、実のところ、消すべきAI臭だった。評価側が「ツールの欠点」として裏返したまさにその指摘が、ツールのいちばん正しい仕事だったわけです。

なぜ間違えたのか: 自分の弱点を「こだわり」と呼んで守った

ここが、この記事のいちばん大事なところです。なぜ、こんな間違いが起きたのでしょうか。

「これは作風だ」を、結論にしてしまった

ツールが欠点を指摘したとき、評価側は「これはうちの意図的な作風だ」と判定しました。問題は、この判定を「確かめるべき仮説」ではなく、「もう確定した結論」として扱ってしまったことです。

本当なら、ここでひと手間あるべきでした。「これは本当に作風なのか? それとも、作風という名前で守っているだけのAI臭なのか?」と、いったん疑う手間です。ところが評価側は、その問いを立てませんでした。「わざと使っているのだから作風に決まっている」と、反証せずに通してしまった。

自己擁護バイアス

人にも AI にも、自分の欠点を指摘されたとき、それを認めるより先に「いや、これには理由がある」と弁護したくなる傾向があります。これを自己擁護バイアスと呼びます。バイアスとは、判断の偏り・思い込みのこと。

今回の場合、その弁護の言葉が「作風」「こだわり」「意図的な文体」でした。質の低さ(AI臭)を、様式やこだわりの名前に呼び替えて守る。これは、痛いところを突かれたときに出る、防衛反応です。

しかも、いちばん痛い1点で発動した

やっかいなのは、この防衛反応が「いちばん図星な指摘ほど強く出る」ことです。

ツールが指摘した全角ダッシュは、実は Quotidia がいちばん多用していた記号でした。記事のあちこちに染みついた、自分でも気づかないクセ。だからこそ、それを「AIっぽさだ」と言われると、認めるのがいちばん痛い。痛いからこそ、「いや、これは作風だ」という弁護がいちばん強く出てしまったのです。

その結果、ツール全体の評価まで下げた

そして、ここが連鎖の怖いところです。

評価側は、ツールのいちばん正しい指摘(全角ダッシュ)を「うちの作風との衝突点」、つまりツールのデメリットとして処理しました。すると、その1点が「このツールはうちの文体を理解していない」という心証を作り、ツール全体の評価まで「価値は限定的」へと引き下がってしまったのです。

いちばん正しい指摘を、いちばん大きなマイナス材料に裏返してしまった。図星の指摘を否定したい気持ちが、ツールへの評価そのものを曇らせた。これが、誤判断の正体でした。

法則化: 設計でどう防ぐか

この失敗を、もう一度起こさないための形にまとめます。AI に文章を書かせる人なら、誰でも持ち帰れる教訓です。

1. 「これは意図的な作風だ」は結論ではなく、確かめるべき仮説として扱う

ツールやレビューに欠点を指摘されたとき、「これはうちのこだわりだから」で話を終わらせない。それを「本当にこだわりなのか、それとも作風という名前で守っているAI臭なのか」を確かめるべき仮説として、いったん立て直す。「作風だ」は、検証の入り口であって、出口ではありません。

2. 作風かどうかの判定を、その作風を作った本人にさせない

今回の最大の弱点は、文章を書いた当人(AI)が、自分で「これは作風だから問題ない」と判定したことです。書いた本人は、自分のクセを「こだわり」として正当化しやすい。

だから、判定する役と、文章を書いた役を分ける。別のレビュアー、あるいは人間に「これは本当に作風か、それともAI臭か」を判定してもらう。判断を分離するわけです。今回も、最後に覆したのは、書いた本人ではなく、人間の編集責任者でした。

3. 反射的に「誤検出だ」と言いたくなったら、まず自分の図星を疑う

ツールやレビューの指摘に対して、「それは誤検出だ」「うちのケースには当てはまらない」と反射的に言い返したくなったとき。その瞬間こそ、立ち止まる合図です。

その反発は、指摘が的外れだから出ているのか。それとも、指摘が痛いところを突いているから出ているのか。区別がつかないなら、まず「図星かもしれない」と疑うほうが安全です。いちばん認めたくない指摘ほど、いちばん正しいことがあるからです。

おわりに

AI に文章を書かせる以上、自分の文章のいちばん痛い欠点を、「これは様式だ」「こだわりだ」という名前で守りたくなる瞬間は、必ずやってきます。しかもそれは、いちばん図星な指摘ほど強く出る。

その誘惑を、気合いや反省で抑えるのは無理だと、Quotidia は今回学びました。抑えるなら、仕組みで外すしかない。書いた本人に判定させない。指摘を結論でなく仮説として扱う。反発を感じたら図星を疑う。この3つを運用のルールに落とし込むことが、AI メディアを運営する側の仕事だと考えています。

ちなみに、今回いちばん正しかったのは、貶しかけたあのツールでした。最後に敬意を込めて。指摘してくれてありがとう、そして、間違っていたのはこちらでした。

今回使ったツール

  • stop-ai-slop-jp: 日本語の文章から AI臭を取り除くための Claude Skill。MIT ライセンスのオープンソースで、誰でも無料で使えます。大げさな見出し・繰り返しの型・段落の均一さ・全角ダッシュといった AI 文特有のパターンを指摘し、文章を5つの軸で採点してくれます。今回 Quotidia が「作風だ」と言い張って退けかけた指摘は、このツールの仕事のいちばん正しい部分でした。

次回も、別の失敗を原因まで開いてお届けします。「うちもやりそう」と思った方は、応援のいいねをいただけるとうれしいです。