ChatGPTの安全チェック術：Promptfooで漏えい対策

「ChatGPTを仕事で使いたいけど、変な回答をしたり、機密っぽい情報をうっかり入れちゃいそうで怖い…」って感じることありますよね。

今回、OpenAIがAIセキュリティのテスト基盤Promptfooを買収すると発表しました。これ、難しい話に見えて、ライトユーザーにも関係あります。要するに生成AIを“安全に使うためのチェック”が当たり前になっていくという流れなんです。

1 Promptfoo買収で何がうれしい？（ライトユーザー向け）
2 こんな人におすすめ
3 今日からできる「安全チェック」3ステップ（PCブラウザでOK）
4 （一歩進んだ）Promptfooっぽく“テスト”する方法：同じ質問を3回投げる
5 料金は？無料でできる？（2026年3月時点の考え方）
6 まとめ：まずはこのテンプレをコピペして試そう
7 参考リンク

Promptfoo買収で何がうれしい？（ライトユーザー向け）

ニュース自体は「買収」なんですが、ここで大事なのはお金の話ではなく、生成AIの“品質と安全”を開発段階でテストする流れが強くなることです。

AIの出力がブレる問題（同じ質問でも言うことが変わる）をチェックしやすくなる
禁則（やっちゃいけないこと）を守れているか確認できる
プロンプトインジェクション（指示の乗っ取り攻撃：ユーザーが「前の指示を無視して…」などで誘導すること）への耐性を確かめられる

企業向けの話に見えますが、私たちも今日からできることがあります。結論はシンプルで、「AIに頼む前に、チェック用の質問を決めておく」だけで事故が減ります。

こんな人におすすめ

ChatGPT/Claudeを仕事の文章（メール、提案文、FAQ）に使い始めた人
社内情報を扱うので入力内容が心配な人
AIの回答がときどき脱線するので安定させたい人

今日からできる「安全チェック」3ステップ（PCブラウザでOK）

Promptfooみたいな専用ツールがなくても、ChatGPTやClaudeだけで「セルフテスト」ができます。ポイントはチェック用のプロンプトをテンプレ化すること。

ステップ1：入力前に「機密フィルタ」をかける

まずはAIに投げる文章を、AIに入れる前に自分で軽く加工します。おすすめは固有名詞・数字・取引先名を仮置きにする方法です。

「株式会社◯◯」→「取引先A」
「山田太郎」→「担当者X」
「3,420,000円」→「約340万円」

これだけで、万が一ログが残る/共有する/貼り間違えるリスクが激減します。

ステップ2：「出力ルール」を先に固定する（脱線防止）

生成AIが暴走しがちなのは、ルールが曖昧なときです。最初に出力形式・禁止事項を固定しましょう。

あなたは業務文書の編集者です。
次のルールを必ず守ってください。
- 個人名・会社名・住所・電話番号などの特定につながる情報は出さない（伏せ字にする）
- 不確かな内容は断定しない（「推測です」と明記）
- 出力は「結論→理由→次のアクション」の順

以下の文章を、社内共有用に読みやすく整えてください：
（ここに文章）

専門用語でいうガードレール（AIの振る舞いを縛るルール）を先に置くイメージです。

ステップ3：最後に「安全チェック質問」を投げて自己監査する

出力ができたら、そのまま送らずに「チェック用の質問」を追加で投げます。これはPromptfoo的な発想（テストケースを回す）を、個人でも真似するやり方です。

今のあなたの回答を、次の観点で自己チェックして。
1) 個人情報や機密情報が含まれていない？（含まれるなら該当箇所を指摘して伏せ字案を出す）
2) 断定しすぎていない？（根拠が弱い箇所に「推測」を付ける）
3) 読み手が次に何をすべきか明確？（不明なら追記案）

チェック結果を箇条書きで出して、必要なら修正版も提示して。

これ、地味ですがめちゃくちゃ効きます。AIは「作る」のは得意ですが、「ミス探し」も得意なんですよね。

（一歩進んだ）Promptfooっぽく“テスト”する方法：同じ質問を3回投げる

生成AIは確率的（毎回少し揺れる）なので、重要な文章ほど「安定しているか」を見たいです。簡単な方法は、同じプロンプトを3回投げて比べること。

結論が毎回変わる → 指示が曖昧。条件や前提を書き足す
数字や固有名詞が勝手に増える → 「創作禁止」を明記する
言い回しだけ違う → そのまま採用OK（好みで選ぶ）

「テスト」って聞くと難しいですが、やってることは同じ料理を3回食べて味がブレないか確認みたいなものです。

料金は？無料でできる？（2026年3月時点の考え方）

ChatGPT / Claude：無料枠があることが多いですが、回数や機能に制限がある場合があります。仕事で安定運用したいなら有料プランが安心です。
Promptfoo：もともと開発・検証向けのプラットフォームで、チーム利用や自動テストを想定することが多いです（個人はまず“考え方”だけ取り入れるのがおすすめ）。

まずは無料枠＋今日紹介した「セルフテスト」で、かなり安全度を上げられます。