AI generated thumbnail

Claude APIの性能制限を自動検証して「AIのサボり」を検知する方法

所要時間: 約40分 | 難易度: ★★★☆☆ この記事で作るもの Claude APIを使用して、モデルが「競合他社の技術開発」に対して意図的に手を抜いているかを数値化する評価スクリプト 特定のトピック(他社LLMの最適化など)で回答の質が落ちる「性能劣化(Nerfing)」を客観的に検知するツール Pythonの基礎(環境構築、APIの呼び出し)がわかるエンジニア向け 📦 この記事に関連する商品(楽天メインで価格確認) ...

2026年6月10日 · 9 分 · 4433 文字 · Negi AI Lab
AI generated thumbnail

Claude 3.5 Sonnetのアイデンティティを検証しモデルの汚染を確認するスクリプト

所要時間: 約30分 | 難易度: ★★★☆☆ この記事で作るもの Claude 3.5 Sonnetに対して特定の言語やプロンプトを用いて「アイデンティティの混乱」を引き起こし、モデルの学習データに他社モデル(DeepSeek-V3等)の回答が混入していないかを自動判定する検証スクリプトを作成します。 PythonからAnthropic APIを叩き、システムプロンプトの制約をすり抜けて「モデルの素性」を告白させるための自動化コードを実装します。 前提知識として、Pythonの基本的な文法と、環境変数の設定方法を理解している必要があります。 必要なものは、Anthropic APIキー(クレジットが残っているもの)と、Python 3.10以上の実行環境です。 📦 この記事に関連する商品 ...

2026年2月24日 · 8 分 · 3852 文字 · Negi AI Lab