Python AI 評価

所要時間: 約45分 | 難易度: ★★★☆☆ この記事で作るもの自分のPCで動かしているローカルLLMの性能を、MMLU（大規模多目的言語理解）などの標準的な指標で測定し、さらに自分自身も同じテストを受けて「AIと自分の差」を可視化するベンチマーク・ダッシュボードを作成します。 ...