AI Guide

Apple SiliconでローカルLLMを高速化するMLX入門

所要時間: 約30分 | 難易度: ★★☆☆☆ この記事で作るもの Apple Silicon（M1/M2/M3/M4）に最適化されたフレームワーク「MLX」を使用し、Llama 3やGemma 2といった最新のLLMを爆速で動かすPythonスクリプト専門知識がなくても、指定したモデルをダウンロードし、ストリーミング形式（文字が流れるように表示される形式）でチャットができる環境 Web API経由ではなく、Macのハードウェア性能を直接叩いて推論させる、完全オフライン・プライバシー重視の実行環境 📦 この記事に関連する商品（楽天メインで価格確認） ...

MLX 使い方入門：Apple SiliconでLLMを爆速動作させる

所要時間: 約25分 | 難易度: ★★☆☆☆ この記事で作るもの Apple公式の機械学習フレームワーク「MLX」を利用して、最新のLLM（Llama 3.1やQwen2.5など）と対話できるストリーミング形式のチャットスクリプトを作成します。 Python環境の構築から、モデルの自動ダウンロード、メモリ効率を最大化する推論実行までを、外部APIを一切使わない完全ローカル環境で実現します。 ...

llama.cppとGGUFでローカルLLM環境を高速に構築する方法

所要時間: 約40分 | 難易度: ★★☆☆☆ この記事で作るもの Llama 3などの最新LLMを、自分のPCのGPUをフル活用して高速に動かすPythonサーバーを作ります。前提知識：ターミナルでの基本的なコマンド操作、Pythonの基礎（仮想環境の構築ができる程度）。必要なもの：NVIDIA製GPU（VRAM 8GB以上推奨）を搭載したWindows PC、またはApple Silicon搭載のMac。 📦 この記事に関連する商品（楽天メインで価格確認） ...

OllamaとOpen WebUIで自分専用のChatGPTをローカル構築する方法

所要時間: 約20分 | 難易度: ★★☆☆☆ この記事で作るもの外部APIを一切使わず、手元のPCだけでChatGPTと同等のUIを備えた生成AI環境を構築します。ネット環境がなくても動作し、入力データが外部に漏れない「完全プライベートなLLM」が手に入ります。前提知識：Dockerの基本的なコマンド（コピペでOK）が叩けること。 📦 この記事に関連する商品（楽天メインで価格確認） ...

OllamaとOpen WebUIで自分専用のプライベートChatGPTを構築する方法

所要時間: 約30分 | 難易度: ★★☆☆☆ この記事で作るもの外部APIを一切使わず、自分のPC内で完結するWeb UI付きの生成AI環境 ChatGPTに近い操作感で、Llama 3やGemma 2などの最新モデルと会話できるシステム前提知識：ターミナル（コマンドプロンプト）でコマンドをコピペできること。Dockerの概念をなんとなく知っていること 📦 この記事に関連する商品（楽天メインで価格確認） ...

OllamaとOpen WebUIを連携させ、完全にオフラインで動作する「プライベートChatGPT環境」を構築します。

この記事を読み終える頃には、社外秘の資料を読み込ませても情報漏洩の心配がない、あなた専用の高機能なAIアシスタントが手元のPCで動いているはずです。所要時間: 約30分 | 難易度: ★★☆☆☆ この記事で作るもの Webブラウザから操作でき、PDF等のドキュメント解析（RAG）も可能なローカルLLM環境 LLM実行エンジンとして「Ollama」、UIとして「Open WebUI」を組み合わせたスタック前提知識：ターミナル（コマンドプロンプト）でのコピペ操作、Dockerの基本的な概念 📦 この記事に関連する商品（楽天メインで価格確認） ...

llama.cpp 使い方入門 (GGUF量子化でローカルLLMを動かす方法)

所要時間: 約45分 | 難易度: ★★★☆☆ この記事で作るもの結論から言うと、この記事を読むだけで「自分のPC内でChatGPTと同等の性能を持つAIを、一切の通信なし・完全無料で動かす環境」が手に入ります。具体的には、llama.cppをソースからビルドし、Llama 3.1などの最新モデルをGGUF形式で動かすPython連携サーバーを構築します。「AIを動かすには最強のGPUが必要」という固定観念を捨て、手元のPCの性能を限界まで引き出す実践的な手法を伝えます。 ...

MLX入門！Apple Silicon MacでLLMを最速動作させる方法

所要時間: 約30分 | 難易度: ★★☆☆☆ この記事で作るもの Apple Silicon（M1/M2/M3/M4チップ）の性能をフルに引き出し、Llama 3やGemma 2といった最新のLLMを高速に動作させるPython推論スクリプトを作成します。一般的なllama.cppやOllamaよりもさらにAppleのハードウェアに最適化された「MLX」というフレームワークを使い、ストリーミング出力（文字が順次表示される形式）を実装します。 ...

Claude CodeとCursorを併用してAI開発を完全自動化する方法

所要時間: 約40分 | 難易度: ★★★☆☆ この記事で作るものターミナルから直接コードを生成・実行・修正する「Claude Code」と、視覚的なコード編集に優れた「Cursor」を組み合わせ、FastAPIを用いたタスク管理APIをわずか数分で完成させます。 Claude Codeでプロジェクトの雛形作成とライブラリ選定、テスト実行を自動化 Cursorで生成されたコードの微調整とレビュー、ディレクトリ構造の把握を効率化人間が1行もコードを書かずに、仕様定義から動作確認までを完結させるフロー前提知識として、ターミナルの基本操作とPythonの基礎（仮想環境の作り方など）が必要です。 ...

llama.cpp 使い方入門 | GGUF量子化モデルをローカルPCで高速に動かす方法

所要時間: 約40分 | 難易度: ★★☆☆☆ この記事で作るもの最新のLlama 3などの大規模言語モデル（LLM）を、手元のPCで高速に動作させる環境を構築します。具体的には、llama.cppをビルドし、量子化されたGGUFモデルを使ってPythonからチャットAIを呼び出すスクリプトを完成させます。 ...