Llama.cpp 構築

本記事の手順に従えば、最新の修正（PR #21534）を反映した状態で、ズレのない対話が可能なローカルAI環境が完成します。 VRAM 24GBクラスのGPU（RTX 3090/4090）があれば、量子化モデルを用いて実用的な速度で動作させることが可能です。 ...