AI generated thumbnail

DeepSeek Thinking-with-Visual-Primitives 使い方:視覚的思考でVLMの精度を極限まで高める実装ガイド

所要時間: 約45分 | 難易度: ★★★★☆ この記事で作るもの DeepSeekが発表した最新フレームワーク「Thinking-with-Visual-Primitives(TwVP)」を使い、画像内の物体位置を正確に把握し、その配置関係から複雑な推論を行うPythonスクリプトを作成します。 一般的なVLM(Vision-Language Model)が苦手とする「正確な座標特定」と「空間認識」を、モデルに「視覚的な下書き(Primitive)」を書かせることで解決する手法を実装します。 この記事を読み終える頃には、単なる画像説明ではなく、ミリ単位の空間把握が必要な業務(検品、棚卸、図面解析など)に応用可能なコードが手元に残ります。 ...

2026年5月1日 · 8 分 · 3618 文字 · Negi AI Lab
AI generated thumbnail

eBay詐欺GPUを画像解析AIで自動検知する方法

所要時間: 約45分 | 難易度: ★★★☆☆ この記事で作るもの eBayの商品URLを入力すると、画像と価格の整合性をAIが分析し、詐欺の可能性を「0〜100%」で判定するPythonスクリプト Google Gemini APIのマルチモーダル機能を活用し、画像内の型番ミスや基板の形状、市場価格との乖離を特定するロジック 前提知識:Pythonの基礎(requestsの使い方など)、環境変数の設定ができること 必要なもの:Google AI StudioのAPIキー(無料枠でOK)、Python 3.10以上 📦 この記事に関連する商品 ...

2026年4月19日 · 8 分 · 3574 文字 · Negi AI Lab