
Claude 3.5 Sonnetのアイデンティティを検証しモデルの汚染を確認するスクリプト
所要時間: 約30分 | 難易度: ★★★☆☆ この記事で作るもの Claude 3.5 Sonnetに対して特定の言語やプロンプトを用いて「アイデンティティの混乱」を引き起こし、モデルの学習データに他社モデル(DeepSeek-V3等)の回答が混入していないかを自動判定する検証スクリプトを作成します。 PythonからAnthropic APIを叩き、システムプロンプトの制約をすり抜けて「モデルの素性」を告白させるための自動化コードを実装します。 前提知識として、Pythonの基本的な文法と、環境変数の設定方法を理解している必要があります。 必要なものは、Anthropic APIキー(クレジットが残っているもの)と、Python 3.10以上の実行環境です。 📦 この記事に関連する商品 ...