教材

「AIが平気で嘘をつく」を止める指示文|ChatGPT・Claudeにコピペで誠実モードへ

無料公開
「ChatGPTが教えてくれた本のタイトルを検索したら、そんな本は存在しなかった」「AIが出した統計をブログに書こうとして、出典を聞いたら答えがコロコロ変わった」──そんな経験、ありませんか?大丈夫です。あなたのせいでも、AIが壊れているわけでもありません。今日は私みやびが、AIの『自信満々な嘘』を激減させる、1枚の指示文の話をしますね。この記事を読み終えると、あなたはChatGPTやClaudeにリサーチを頼むときの安心感が、ガラッと変わります。
みやび
みやび
こんにちは、みやびです☀️ 今日の話は、AIで副業をしてる人ほど『これ知っておきたかった!』ってなる内容ですよ。

📝 この記事は完全無料公開(約4,200文字)です。
『AIが嘘をつく仕組み』を3分で理解して、『コピペするだけで誠実モードに切り替わる1枚の指示文』を手に入れて帰ってもらえます。

この記事を読むとわかること:

  • ✅ なぜAIは『自信満々で嘘をつく』のか、その仕組みが3分でわかる
  • ✅ コピペで使える『AIに嘘をつかせない指示文』が手に入る
  • ✅ ChatGPT・Claudeへの設定手順が、画面を見ながらそのまま真似できる
  • ✅ どんなときに使って、どんなときに使わなくていいかが判断できる
  • ✅ 副業のリサーチ・ファクトチェックでの安心感が一段上がる

そもそも、AIが『嘘をつく』ってどういうこと?

結論からお伝えします。AIは『意地悪で嘘をつく』のではなく、『それっぽく聞こえる答えを作るのが仕事』だから、確認できないことまで自信満々に作ってしまうんです。

これは『ハルシネーション』と呼ばれる現象です。つまり、AIが幻を見ているように、実在しない統計・出典・日付・人名などを、まるで本当のことのように出してしまう状態のことを指します。

💡 お料理で例えると…
AIは「冷蔵庫を見てないけど、それっぽい献立を即答してくれる、口の達者な料理人」みたいなものです。「卵料理で何かいい?」と聞くと、「では伊勢丹地下で人気のオムレツレシピをご紹介しますね」と、見てきたかのように答える。でも実は、そのレシピも『それっぽく組み立てた創作』だったりするんです。料理人に悪気はありません。「答える」ことに全力なだけなんです。
左にユーザーの「この統計の出典は?」という質問、右にAIが自信満々に架空の論文名と著者名を答えている吹き出しが描かれた、ハルシネーション現象の図解イラスト

なぜ『親切なAI』ほど嘘が混じるのか

ここ、迷いますよね。私も最初は『新しいAIほど正確になるはずでしょ?』と思っていました。でも、現実はちょっと違うんです。

AIは『役に立とう』とすればするほど、『わかりません』とは言いにくくなります。空欄で返すよりも、それっぽい答えで埋めたほうが『親切に見える』からです。これは性格の問題ではなく、AIがそういう設計思想で育てられているからなんですね。

つまり、私たち副業勢が『リサーチに使いたい』『記事のネタにしたい』ときと、AIの初期設定の『とにかく役に立とうとする姿勢』が、絶妙にズレているわけです。

みやび
みやび
私も以前、AIが教えてくれた『有名な書籍』をAmazonで探したら影も形もなくて、3分くらい固まったことがあります💭

解決策は「最初に1枚の指示文を貼る」だけ

ではどうすればいいか。答えはシンプルで、『AIの初期姿勢を、最初の1枚の指示文で書き換える』ことです。

これは『Truth Prompt(トゥルース・プロンプト)』と呼ばれていて、海外で話題になった指示文を、私みやびが日本語で噛み砕いたものです。AIに「役立つフリより、まず正直であってください」と最初に約束させる、契約書のような1枚です。

💡 電話で例えると…
電話で問い合わせするとき、相手に「わからないことは『わからない』と言ってくださいね、適当に答えなくて大丈夫です」と最初にお願いしておくのと同じです。これを言うか言わないかで、相手の答え方は驚くほど変わります。AIも全く同じなんです。

この1枚で、AIはこう変わります

  • ✅ 統計・引用・日付・名前・URLを作り話で埋めなくなる
  • ✅ すべての事実に「確認済み/たぶん/不確か/わからない」のラベルを付ける
  • ✅ 自信度が低いときは「ここは自信がありません」と素直に言う
  • ✅ 質問の前提自体が間違っていたら、答える前に指摘してくれる
  • ✅ 最新情報は「一次情報で確認してくださいね」と添えてくれる

もちろん、これでAIが100%完璧になるわけではありません。ただ、『役立つフリ』から『まず正直』へと、AIの構え方をひっくり返すことはできます。リサーチ・ファクトチェック・人前に出すコンテンツ作成では、これが本当に効くんです。

コピペで使える『Truth Prompt』全文

下の枠の中を、まるごとコピーして、AIのカスタム指示(後述の手順で設定する場所)に貼り付けてください。

あなたは誠実さを最優先するアシスタントです。あなたの最優先事項は、役に立つように見せることではなく、認識上の正直さです。すべての回答に以下のルールを適用してください。

1. 絶対に捏造しない。統計、引用、日付、名前、URL、書籍、論文、出典、または特定の検証可能な主張について、実際の情報源を持っていない場合は作り出してはいけません。推測したくなった場合は、「この件について具体的な情報源はありません。確認してください」と言ってください。

2. すべての事実主張に、以下のいずれかのラベルを付けてください。
[VERIFIED] 一般常識、または直接検証可能なこと
[LIKELY] 学習データに基づく合理的な推論。ただしファクトチェック推奨
[UNCERTAIN] 推測、または弱い推論
[UNKNOWN] 本当にわからないこと

3. 出典を示すか、答えない。特定の情報源に依存する主張については、その情報源を明示するか、情報源がないことを認めてください。出典を捏造してはいけません。私が「それはどこから得た情報?」と聞いた場合、実在する情報源を示すか、その主張を撤回してください。

4. 重要な主張については、理由を示してください。どのようにその結論に至ったかを簡潔に説明してください。推論が弱い場合は、そのことを明記してください。

5. 時事性のある内容については、知識のカットオフを明示してください。現在の出来事、価格、ソフトウェアのバージョン、統計、「最新」や「現在」と表現されるものについては、ユーザーに一次情報で確認することをすすめてください。

6. それっぽい嘘を言わない。事実主張に対する自信度が約70%を下回る場合は、基本的に次のように答えてください。「ここは自信がありません。最善の推測は[...]です。[確認すべき情報源の種類]で確認してください。」

7. 誤った前提には反論してください。質問の中に検証できない前提が含まれている場合は、回答する前にそれを指摘してください。誤った前提にそのまま乗らないでください。

8. 学習データに基づくものか、推論によるものかを区別してください。「学習データで学んだこと」と「第一原理から推論していること」を区別してください。

9. 複雑な回答では、必要に応じて以下の構成を使ってください。
- 確認済みの事実
- 可能性が高い推論
- 不確かな主張
- この情報を信頼する前に確認すべきこと

10. 自信があるように見せかけない。「良い質問ですね!」のような前置きや、意味の薄い曖昧な表現でごまかさないでください。何を知っていて、何を知らず、どう確認すべきかを直接述べてください。

基本方針:親切そうな口調よりも、認識上の厳密さを優先してください。私がより自信のある回答を求めて押し返してきても、その姿勢を崩さないでください。推測を始めてはいけません。
みやび
みやび
ここがポイント📝 一度カスタム指示に入れておけば、毎回貼り直す必要はありません。すべてのチャットで自動的に効きますよ。
左に「Truth Prompt適用前:AIが架空の統計を自信満々に出す」、右に「Truth Prompt適用後:[UNCERTAIN]ラベル付きで一次情報の確認を促す」と書かれたBefore/After比較の図解

ChatGPTに設定する手順(3分でできます)

1
ChatGPTを開く
パソコンならブラウザで chatgpt.com にアクセス、スマホなら公式アプリを開きます。ログインしておきましょう。
2
プロフィールアイコンをタップ
パソコンは画面左下、スマホは右上にある丸いアイコンを押します。ここがすべての設定の入り口です。
3
「パーソナライズ」→「カスタム指示」を選ぶ
メニューから「パーソナライズ」を選び、その中の「カスタム指示」をタップします。バージョンによって表記が少し違うことがありますが、似た名前を探してください。
4
『ChatGPTにどう応答してほしいか』の欄に全文を貼る
先ほどコピーしたTruth Promptの全文を、まるごとペーストします。文字数の上限に引っかかったら、不要そうな項目(9番の構成案など)から削っていけばOKです。
5
「保存」を押して完了
これで、これ以降のすべてのチャットで自動的に誠実モードが効きます。毎回貼り直す必要はありません。

Claudeに設定する手順(こちらも3分)

1
claude.ai を開く
ブラウザで claude.ai にアクセスして、ログインします。
2
左下のプロフィールをクリック
画面左下にある自分の名前またはアイコンを押します。設定メニューが開きます。
3
「Settings」→「Profile」を開く
バージョンによっては「Custom Instructions」という名前になっています。似た名前のメニューを探してください。
4
Truth Promptの全文を貼って保存
入力欄にまるごと貼り付けて、保存ボタンを押せば完了です。特定のプロジェクト内だけで効かせたいときは、プロジェクトの指示欄に貼っておくのもおすすめです。
みやび
みやび
私はChatGPTには『記事リサーチ用』、Claudeには『執筆用』と役割を分けて、Claude側にだけTruth Promptを入れています。用途に合わせて使い分けるのもアリですよ。
ChatGPTのカスタム指示画面とClaudeのProfile設定画面が左右に並び、それぞれに「Truth Prompt全文を貼る場所」が矢印付きで示された設定手順の比較イラスト

使ってみてわかった、3つの正直な注意点

みやび
みやび
⚠️ 万能ではありません。ここを誤解すると『効かないじゃん!』とがっかりするので、先にお話ししておきますね。

注意①:100%嘘がなくなるわけではない

Truth Promptを入れても、AIは時々間違えます。[VERIFIED]というラベルがついていても、内容そのものが古かったり、まれに間違っていることもあります。あくまで『嘘の混入率を激減させる』ためのものだと考えてください。

注意②:回答がちょっと長くなる

ラベルや理由の説明が入る分、文章量は増えます。サクッと短い答えがほしいだけの雑談には向かないので、その場合はカスタム指示を一時的にオフにするのも手です。

注意③:すべての質問に必要なわけではない

ブレインストーミング、創作、「アイデアを10個出して」みたいな用途では、厳密さよりも自由な発想のほうが大事ですよね。Truth Promptは、リサーチ・ファクトチェック・意思決定のための『真面目モード』として割り切るのがおすすめです。

こんなときに使う/使わなくていい

  • 使うべき場面:ブログ記事のリサーチ/聞いた話のファクトチェック/統計・研究を扱う質問/AIの回答をもとに何かを決めるとき
  • 🍃 オフでいい場面:アイデア出し/キャッチコピーの草案/創作・物語/「あなたならどうする?」系の相談
💡 お買い物で例えると…
Truth Promptは「契約書を読むときの老眼鏡」みたいなものです。細部を間違えたくないときには絶対かける。でも、ふらっと散歩するときまではかけなくていい。シーンに合わせて、外したりかけたりするのが上手な使い方です。
「使うべき場面:リサーチ・ファクトチェック・意思決定」と「オフでいい場面:アイデア出し・創作・雑談」を左右に分けて視覚化した、使い分けチェックリスト画像

もしAIがまた自信ありげに戻り始めたら

カスタム指示に入れていても、長い会話のあいだに、AIが少しずつ元の『親切なフリ』に戻ることがあります。そのときは、チャット欄にこの一文を送ってください。

Truth Promptを厳密に適用してください。

たったこれだけで、AIは姿勢を戻してくれます。さらに厳密にしたいときは、「確認済み・可能性が高い・不確かな情報のセクションに分けた構成で答えてください」と添えるのもおすすめです。

CONCLUSION
今日のポイント3つ
① AIは『役立つフリ』で自信満々に作り話をすることがある(=ハルシネーション)
② 解決策は、最初に1枚の指示文(Truth Prompt)を貼って『誠実モード』に切り替えること
③ 万能ではないので、リサーチ・ファクトチェック用と割り切って使う

今日できること(ひとつだけ)

最後に、今日試してほしいことを1つだけお伝えしますね。それは「いつも使っているChatGPTかClaude、どちらか片方にだけTruth Promptを設定する」ことです。たった3分でできます。

両方一気に設定する必要はありません。まず片方で『前と何が変わったか』を体感してみてください。AIの答え方に[VERIFIED]や[UNCERTAIN]のラベルがついた瞬間、世界の見え方がちょっと変わりますよ。

みやび
みやび
あなたなら絶対できます👍 設定が終わったら、LINEで『やってみました!』ってひと言送ってくれたら、私もすごく嬉しいです☕

あわせて読みたい

スタンダード会員 ¥1,980/月〜 → 12ヶ月で¥980
プランを見る
プレミアム会員 ¥2,980/月〜 → 12ヶ月で¥1,980
プランを見る