AI generated thumbnail

Apple Siliconの性能を限界まで引き出すMLXでローカルLLMを動かす方法

所要時間: 約30分 | 難易度: ★★☆☆☆ この記事で作るもの Apple公式の機械学習フレームワーク「MLX」を利用して、Mac上でLlama 3などの最新LLMと対話できるPythonスクリプト 外部APIに依存せず、オフラインかつ高速(毎秒15〜20トークン以上)に動作する推論環境 前提知識: Pythonの基本的な読み書きができること、ターミナルでコマンド操作ができること 必要なもの: Apple Silicon(M1/M2/M3チップ)搭載のMac 📦 この記事に関連する商品(楽天メインで価格確認) ...

2026年6月16日 · 8 分 · 3945 文字 · Negi AI Lab
AI generated thumbnail

DeepSeek V4 Flash 使い方!llama.cppで最新モデルをローカル構築する手順

所要時間: 約45分 | 難易度: ★★★★☆ この記事で作るもの DeepSeek V4 Flashをllama.cppの最新プルリクエスト(PR #24162)を適用してビルドし、自分のPCローカル環境で対話ができる「専用CLIチャット環境」を作ります。 公式リリース前の開発途上版を動かすため、最新技術の内部構造を理解しながら、誰よりも早く次世代モデルの挙動を確認できる状態を目指します。 ...

2026年6月6日 · 9 分 · 4508 文字 · Negi AI Lab
AI generated thumbnail

Qwen3.5 35B A3B 使い方と環境構築ガイド

所要時間: 約40分 | 難易度: ★★★★☆ この記事で作るもの Qwen3.5 35B A3B(MTP保持版)をローカル環境で立ち上げ、PythonからAPI経由で高速に推論を行うシステム。 35Bという中規模モデルながら、MTP(Multi-Token Prediction)の恩恵で40B〜70Bクラスに匹敵する論理性能を体感できる環境を構築します。 PythonからOpenAI互換APIサーバーとして呼び出し、実際の業務(コードレビューや長文要約)に即投入できる状態を目指します。 📦 この記事に関連する商品(楽天メインで価格確認) ...

2026年5月27日 · 9 分 · 4251 文字 · Negi AI Lab
AI generated thumbnail

OllamaとPythonでGPUリソースをフル活用するLLM最適化ガイド

所要時間: 約35分 | 難易度: ★★★☆☆ この記事で作るもの ローカルマシンのGPUリソース(VRAM使用量やモデル名)を自動取得し、LLMに「自分の限界性能」を認識させた上でタスクを解かせるPythonスクリプト Pythonの基礎(pip操作と関数定義)がわかること、およびNVIDIA製GPUを搭載したPCを所有していること 必要なもの: Python 3.10以降、NVIDIA Driver、Ollama(ローカルLLM実行環境) 📦 この記事に関連する商品(楽天メインで価格確認) ...

2026年5月22日 · 8 分 · 3678 文字 · Negi AI Lab
AI generated thumbnail

Qwen 27Bクラスをローカル環境で爆速動作させる方法

所要時間: 約40分 | 難易度: ★★★☆☆ この記事で作るもの Qwen-2.5シリーズ(噂の27Bを含む)をローカルPCで動かし、フォルダ内の全ドキュメントを自動解析・構造化するPythonスクリプトを作ります。 前提知識:Pythonの基本的な文法(pipインストールや関数の実行)がわかること。 必要なもの:NVIDIA製GPU(VRAM 12GB以上推奨)またはApple Silicon搭載Mac(メモリ24GB以上推奨)、Ollama。 📦 この記事に関連する商品(楽天メインで価格確認) ...

2026年5月21日 · 8 分 · 4006 文字 · Negi AI Lab
AI generated thumbnail

Qwen2.5-Coder 使い方 | ローカルでコード生成AIを動かす

所要時間: 約40分 | 難易度: ★★★☆☆ この記事で作るもの Qwen2.5-Coder 32Bをローカル環境に構築し、指定したディレクトリ内の全Pythonコードに対して「型ヒントの追加」と「バグチェック」を自動で行うリファクタリングツールを作成します。 既存のコードベースを読み込ませ、AIが修正案を提示し、必要に応じてファイルを上書きする実用的なスクリプトを完成させます。 ...

2026年5月19日 · 9 分 · 4379 文字 · Negi AI Lab
AI generated thumbnail

Qwen3.6 35B Uncensored 使い方:MTPを維持した最強の検閲なしローカルLLM環境構築

所要時間: 約40分 | 難易度: ★★★★☆ この記事で作るもの 35Bという「家庭用ハイエンドGPU1枚」で動く最大級のモデルを使い、論理性能と創造性を両立した検閲なし対話環境を構築します。 量子化されたGGUF版をLlama.cppまたはLM Studioで動作させ、MTP(Multi-Token Prediction)の恩恵を最大限に受ける設定を完了させます。 前提知識として、基本的なコマンドライン操作とPython環境の理解があることを想定しています。 📦 この記事に関連する商品(楽天メインで価格確認) ...

2026年5月9日 · 8 分 · 3849 文字 · Negi AI Lab
AI generated thumbnail

Qwen3.6-27BとOllamaで高精度なローカル検索AIを作る方法

所要時間: 約40分 | 難易度: ★★★☆☆ この記事で作るもの Qwen3.6-27Bを中核とし、外部検索結果を統合して回答する「Agentic Search(自律型検索)」スクリプト。 RTX 3090/4090(24GB VRAM)1枚で、SimpleQA精度95.7%という商用モデル級の性能をローカルで実現します。 前提知識:Pythonの基礎、コマンドライン操作、Dockerまたは環境構築の基礎。 必要なもの:NVIDIA製GPU(VRAM 24GB推奨)、Ollama、Python 3.10以上。 📦 この記事に関連する商品 ...

2026年5月3日 · 8 分 · 3544 文字 · Negi AI Lab
AI generated thumbnail

Qwen3.6-35B-A3B 使い方 入門:MoEモデルをローカル環境で爆速動作させる方法

所要時間: 約40分 | 難易度: ★★★☆☆ この記事で作るもの この記事では、最新のSparse MoE(混合エキスパート)モデル「Qwen3.6-35B-A3B」をローカルPCに導入し、ソースコードの修正案を自動生成する「AIコーディングレビュー・スクリプト」を作成します。 PythonからLlama-cpp-pythonを経由してモデルを制御し、35Bクラスの知能を3Bクラスの速度で引き出す実装を目指します。 ...

2026年4月16日 · 10 分 · 4772 文字 · Negi AI Lab
AI generated thumbnail

MiniMax M2.7 使い方 入門:オープンソース版をローカル環境で動かす手順

所要時間: 約30分 | 難易度: ★★★☆☆ この記事で作るもの MiniMax M2.7のオープンウェイト版を、PythonとHugging Faceのライブラリを用いてローカルPC上で実行し、日本語のプロンプトに対して高速にレスポンスを返す推論スクリプトを作成します。 前提知識: Python 3.10以上の基本的な操作ができること pipによるライブラリのインストール経験があること NVIDIA製GPU(VRAM 12GB以上推奨)の環境があること 必要なもの: ...

2026年3月23日 · 8 分 · 3717 文字 · Negi AI Lab