AI generated thumbnail

Qwen 3.7 使い方と最強ローカルLLM環境の作り方

所要時間: 約45分 | 難易度: ★★★☆☆ この記事で作るもの 次世代モデル「Qwen 3.7」をリリース当日に最高速で動かすための、DockerベースのローカルLLM実行基盤 前提知識:Linuxコマンドの基本操作、Dockerの概念を理解していること 必要なもの:NVIDIA GPU(VRAM 12GB以上推奨)、Docker環境、Python 3.10以降 📦 この記事に関連する商品(楽天メインで価格確認) ...

2026年5月19日 · 8 分 · 3747 文字 · Negi AI Lab
AI generated thumbnail

Qwen2.5-Coder 使い方 | ローカルでコード生成AIを動かす

所要時間: 約40分 | 難易度: ★★★☆☆ この記事で作るもの Qwen2.5-Coder 32Bをローカル環境に構築し、指定したディレクトリ内の全Pythonコードに対して「型ヒントの追加」と「バグチェック」を自動で行うリファクタリングツールを作成します。 既存のコードベースを読み込ませ、AIが修正案を提示し、必要に応じてファイルを上書きする実用的なスクリプトを完成させます。 ...

2026年5月19日 · 9 分 · 4379 文字 · Negi AI Lab
AI generated thumbnail

LocalLLMハードウェア選定ツールの作り方と最適な環境構築

所要時間: 約40分 | 難易度: ★★☆☆☆ この記事で作るもの 入力したモデル規模(Llama-3-70B等)に対し、M5、Strix Halo、RTX 6000 Adaなどの次世代・現行ハードウェアで「動くのか」「速度(Token/s)はどの程度か」を算出するシミュレーターを作成します 前提知識: Pythonの基本的な文法、ローカルLLMにおける「量子化(4bit/8bit)」の意味がわかること 必要なもの: Python 3.10以降が動作するPC 📦 この記事に関連する商品(楽天メインで価格確認) ...

2026年5月18日 · 8 分 · 3581 文字 · Negi AI Lab
AI generated thumbnail

RTX 3090/4090でQwen 3.6 27Bを爆速で動かす方法

所要時間: 約45分 | 難易度: ★★★★☆ この記事で作るもの RTX 3090/4090(VRAM 24GB)1枚で、Qwen 3.6 27Bを秒間70トークン以上の速度で動かす推論環境 15万トークン超えのロングコンテキストを処理できる実用的なAPIサーバー ik_llama.cppとMTP(Multi-Token Prediction)を組み合わせた、2024年末時点での最強構成 📦 この記事に関連する商品(楽天メインで価格確認) ...

2026年5月18日 · 7 分 · 3339 文字 · Negi AI Lab
AI generated thumbnail

llama.cppのMTPサポートを使いRTX 5090でQwen 3.6を爆速で動かす方法

所要時間: 約45分 | 難易度: ★★★★☆ この記事で作るもの RTX 5090の圧倒的な演算性能をフルに活用し、llama.cppの最新機能であるMTP(Multi-Token Prediction)を有効化することで、Qwen 3.6モデルから1秒間に150トークンを超える超高速なレスポンスを引き出すローカル推論環境を構築します。 ...

2026年5月17日 · 9 分 · 4349 文字 · Negi AI Lab
AI generated thumbnail

ローカルLLM Qwen 2.5 Coder 使い方

所要時間: 約40分 | 難易度: ★★★☆☆ この記事で作るもの Qwen 2.5 Coder 32Bをローカル環境で動かし、物理演算を含むHTML Canvasアニメーションを1発で生成します ブラウザだけで動作し、パーティクルの衝突や重力シミュレーションを実装したシングルファイルHTMLを完成させます 前提知識:ターミナルでのコマンド入力に抵抗がなく、HTML/JavaScriptの基礎(タグや変数の意味)がわかること 必要なもの:VRAM 12GB以上のNVIDIA製GPU、またはメモリ24GB以上のApple Silicon搭載Mac 📦 この記事に関連する商品(楽天メインで価格確認) ...

2026年5月17日 · 9 分 · 4329 文字 · Negi AI Lab
AI generated thumbnail

Jetson OrinとGemmaでオフラインLLMロボットを作る方法

所要時間: 約60分 | 難易度: ★★★★☆ この記事で作るもの Jetson Orin NX 16GB上で、Googleの軽量LLM「Gemma」を完全オフライン動作させる制御システム。 センサー入力を模したデータに対し、LLMがリアルタイム(TTFT約200ms)で判断を下し、行動プロンプトを生成するPythonスクリプト。 前提知識:Pythonの基本的な読み書きができ、Linuxコマンド(Ubuntu)の操作に抵抗がないこと。 必要なもの:Jetson Orin NX 16GB開発者キット、NVMe SSD(128GB以上推奨)、DC電源。 📦 この記事に関連する商品(楽天メインで価格確認) ...

2026年5月16日 · 9 分 · 4027 文字 · Negi AI Lab
AI generated thumbnail

ローカルLLMで自律型エージェントを作る方法 OpenCodeInterpreter 構築ガイド

所要時間: 約45分 | 難易度: ★★★★☆ この記事で作るもの ユーザーが投げた曖昧な指示に対し、自らPythonコードを生成・実行・修正し、最終的な結果を出す自律型AIエージェント。 OpenCodeInterpreter(DS-6.7Bまたは33B)を「頭脳(オーケストレーター)」として活用し、ローカル環境(Ollama)で完結するシステム。 Pythonの基礎知識と、Dockerを少し触ったことがあれば完遂できるレベルの構成。 📦 この記事に関連する商品(楽天メインで価格確認) ...

2026年5月16日 · 10 分 · 4597 文字 · Negi AI Lab
AI generated thumbnail

RTX 4090 48GB改造版の実態と大容量VRAMをフル活用する環境構築ガイド

所要時間: 約45分(ハードウェア準備を除く) | 難易度: ★★★★☆ この記事で作るもの 中国で流通する「RTX 4090 48GB」等の改造GPU、あるいは多段GPU環境で、Llama-3-70Bクラスの巨大モデルを高速に動かすための推論サーバー。 Pythonとllama-cpp-pythonを使用し、VRAMを1MB単位で使い切るための最適化設定。 外部アプリケーションから呼び出し可能なOpenAI互換APIエンドポイント。 📦 この記事に関連する商品(楽天メインで価格確認) ...

2026年5月15日 · 9 分 · 4044 文字 · Negi AI Lab
AI generated thumbnail

RTX 5090高騰に備える!VRAMを限界まで使い切るローカルLLM環境構築

所要時間: 約45分 | 難易度: ★★★★☆ この記事で作るもの RTX 5090の32GB VRAM(予定)や現行のRTX 4090を最大限に活用し、大規模言語モデル(Llama-3-70B等)を高速に動かすPythonスクリプトを作ります。 お使いのGPUメモリ量に合わせて、モデルのロード範囲(GPUレイヤー数)を自動最適化する仕組みを構築します。 実行環境はUbuntu 22.04またはWindows 11(WSL2)を想定しています。 📦 この記事に関連する商品(楽天メインで価格確認) ...

2026年5月15日 · 9 分 · 4186 文字 · Negi AI Lab