ChatGPTの安全チェック術:Promptfooで漏えい対策

a computer screen with a text description on it AI

「ChatGPTを仕事で使いたいけど、変な回答をしたり、機密っぽい情報をうっかり入れちゃいそうで怖い…」って感じることありますよね。

今回、OpenAIがAIセキュリティのテスト基盤Promptfooを買収すると発表しました。これ、難しい話に見えて、ライトユーザーにも関係あります。要するに生成AIを“安全に使うためのチェック”が当たり前になっていくという流れなんです。

Promptfoo買収で何がうれしい?(ライトユーザー向け)

ニュース自体は「買収」なんですが、ここで大事なのはお金の話ではなく、生成AIの“品質と安全”を開発段階でテストする流れが強くなることです。

  • AIの出力がブレる問題(同じ質問でも言うことが変わる)をチェックしやすくなる
  • 禁則(やっちゃいけないこと)を守れているか確認できる
  • プロンプトインジェクション(指示の乗っ取り攻撃:ユーザーが「前の指示を無視して…」などで誘導すること)への耐性を確かめられる

企業向けの話に見えますが、私たちも今日からできることがあります。結論はシンプルで、「AIに頼む前に、チェック用の質問を決めておく」だけで事故が減ります。

こんな人におすすめ

  • ChatGPT/Claudeを仕事の文章(メール、提案文、FAQ)に使い始めた人
  • 社内情報を扱うので入力内容が心配な人
  • AIの回答がときどき脱線するので安定させたい

今日からできる「安全チェック」3ステップ(PCブラウザでOK)

Promptfooみたいな専用ツールがなくても、ChatGPTやClaudeだけで「セルフテスト」ができます。ポイントはチェック用のプロンプトをテンプレ化すること。

ステップ1:入力前に「機密フィルタ」をかける

まずはAIに投げる文章を、AIに入れる前に自分で軽く加工します。おすすめは固有名詞・数字・取引先名を仮置きにする方法です。

  • 「株式会社◯◯」→「取引先A」
  • 「山田太郎」→「担当者X」
  • 「3,420,000円」→「約340万円」

これだけで、万が一ログが残る/共有する/貼り間違えるリスクが激減します。

ステップ2:「出力ルール」を先に固定する(脱線防止)

生成AIが暴走しがちなのは、ルールが曖昧なときです。最初に出力形式・禁止事項を固定しましょう。

あなたは業務文書の編集者です。
次のルールを必ず守ってください。
- 個人名・会社名・住所・電話番号などの特定につながる情報は出さない(伏せ字にする)
- 不確かな内容は断定しない(「推測です」と明記)
- 出力は「結論→理由→次のアクション」の順

以下の文章を、社内共有用に読みやすく整えてください:
(ここに文章)

専門用語でいうガードレール(AIの振る舞いを縛るルール)を先に置くイメージです。

ステップ3:最後に「安全チェック質問」を投げて自己監査する

出力ができたら、そのまま送らずに「チェック用の質問」を追加で投げます。これはPromptfoo的な発想(テストケースを回す)を、個人でも真似するやり方です。

今のあなたの回答を、次の観点で自己チェックして。
1) 個人情報や機密情報が含まれていない?(含まれるなら該当箇所を指摘して伏せ字案を出す)
2) 断定しすぎていない?(根拠が弱い箇所に「推測」を付ける)
3) 読み手が次に何をすべきか明確?(不明なら追記案)

チェック結果を箇条書きで出して、必要なら修正版も提示して。

これ、地味ですがめちゃくちゃ効きます。AIは「作る」のは得意ですが、「ミス探し」も得意なんですよね。

(一歩進んだ)Promptfooっぽく“テスト”する方法:同じ質問を3回投げる

生成AIは確率的(毎回少し揺れる)なので、重要な文章ほど「安定しているか」を見たいです。簡単な方法は、同じプロンプトを3回投げて比べること。

  • 結論が毎回変わる → 指示が曖昧。条件や前提を書き足す
  • 数字や固有名詞が勝手に増える → 「創作禁止」を明記する
  • 言い回しだけ違う → そのまま採用OK(好みで選ぶ)

「テスト」って聞くと難しいですが、やってることは同じ料理を3回食べて味がブレないか確認みたいなものです。

料金は?無料でできる?(2026年3月時点の考え方)

  • ChatGPT / Claude:無料枠があることが多いですが、回数や機能に制限がある場合があります。仕事で安定運用したいなら有料プランが安心です。
  • Promptfoo:もともと開発・検証向けのプラットフォームで、チーム利用や自動テストを想定することが多いです(個人はまず“考え方”だけ取り入れるのがおすすめ)。

まずは無料枠+今日紹介した「セルフテスト」で、かなり安全度を上げられます。

まとめ:まずはこのテンプレをコピペして試そう

OpenAIのPromptfoo買収ニュースは、「生成AIは便利だけど、ちゃんとテストして使う時代だよね」というサインでもあります。

  • 入力前:固有名詞と数字をざっくり匿名化
  • 生成時:出力ルール(ガードレール)を先に書く
  • 生成後:自己チェック質問で監査してから使う

まずはこの記事のプロンプトをそのままコピペして、普段のメールや議事録の整形で試してみてください。1回やると、「AIってこうやって安全に使えばいいのか」が体感できますよ。

参考リンク

Photo by Jonathan Kemper on Unsplash