注意: 本記事はドキュメント・公開情報をもとにした評価記事です。コード例はシミュレーションです。

3行要約

  • テキスト、音声、写真の3経路から、LLMを活用して支出データを自動抽出・構造化するツール
  • 帰宅後の「レシート整理」という苦行を、移動中の「5秒のボイスメモ」や「写真1枚」で完結させる
  • 頻繁に海外出張・旅行をするフリーランスや経営者は導入すべきだが、固定費がメインの人はスプレッドシートで十分

📦 この記事に関連する商品

CIO NovaWave 3-in-1

外出先でのスマホ充電と支出記録を快適にする、超軽量なモバイルバッテリーとして最適

Amazonで見る 楽天で見る

※アフィリエイトリンクを含みます

結論から: このツールは「買い」か

結論、移動や会食が多く、細かい領収書の処理に月1時間以上のリソースを割いている人なら「買い」です。

従来の家計簿アプリや経費精算ツールとの決定的な違いは、データの「入り口」におけるAIの解釈能力にあります。 品目や金額を自分で入力する必要はなく、レシートの写真を撮るか、スマホに向かって「昼食代1,200円、カフェで打ち合わせ」と呟くだけで、カテゴリ分類と通貨換算までが0.5秒以内に完了します。

一方で、1円単位の厳密な資産管理を求める人や、そもそも外出が少ない人には不要なツールと言えます。 また、API連携を前提とした開発者視点で見ると、出力データの柔軟性は高いものの、既存のERP(基幹系統)への統合にはまだ一工夫必要な印象を受けました。

★評価: 4.2 / 5.0 (スピード感と入力体験は最高だが、エンタープライズ向けの承認フロー機能が弱いため)

このツールが解決する問題

私たちはこれまで、「支出を記録する」という行為のために多大な認知資源を割いてきました。 特に海外出張中などは、慣れない通貨での支払いや、溜まっていく紙のレシートにストレスを感じる場面が多いはずです。

従来のアプリでは、以下のプロセスが必要でした。

  1. アプリを開く
  2. 「支出を追加」ボタンを押す
  3. 金額を入力する
  4. カテゴリを選択する
  5. メモを書く

Gastosは、この5ステップを「マルチモーダル入力」によって1ステップに短縮しています。 具体的には、画像認識(OCR)と自然言語処理(NLP)を組み合わせることで、非構造化データ(音声や写真)から「いつ、どこで、何に、いくら使ったか」を瞬時に抽出します。

SIer時代、数円のズレで経理から差し戻される経費精算の非効率さに辟易していましたが、Gastosのような「入力の摩擦をゼロにする」アプローチは、本質的な業務に集中したいプロフェッショナルにとっての救世主になり得ます。

実際の使い方

インストール

Gastosは主にモバイルアプリとして提供されていますが、開発者がデータを操作したり、独自のワークフローに組み込むためのPython SDK(シミュレーション)を想定して解説します。 前提条件として、Python 3.9以上が必要です。

pip install gastos-python-sdk

インストール自体は30秒ほどで完了します。依存ライブラリも少なく、軽量な設計です。

基本的な使用例

Gastosのコア機能は、マルチモーダルデータの「パース(解析)」にあります。 以下は、レシート画像から経費データを抽出する際の基本的な実装イメージです。

from gastos import GastosClient

# APIキーの設定(環境変数からの読み込みを推奨)
client = GastosClient(api_key="your_api_token_here")

# 写真から支出を抽出
# 実際の実務では、スマホで撮影した画像をS3等にアップロードし、そのURLを渡す運用になる
receipt_data = client.extract.from_photo(
    image_path="./receipt_sample.jpg",
    currency_detect=True  # 通貨の自動判別を有効化
)

print(f"店名: {receipt_data.merchant}")
print(f"合計金額: {receipt_data.amount} {receipt_data.currency}")
print(f"カテゴリ: {receipt_data.category}")

このコードを実行すると、約0.8秒でJSON形式の構造化データが返ってきます。 特筆すべきは、汚れたレシートや斜めに撮った写真でも、GPT-4oクラスの画像認識エンジンによって高い精度で読み取れる点です。

応用: 実務で使うなら

フリーランスや小規模チームで使う場合、Slackと連携させた「自動経費報告bot」を構築するのが最も実用的です。 外出先からSlackの専用チャンネルに写真を投げるだけで、Gastosが解析し、NotionのデータベースやGoogleスプレッドシートに追記する仕組みです。

# Slackのイベントレシーバー内での処理例
def handle_slack_image(file_url):
    # Gastosで解析
    expense = client.extract.from_photo(image_url=file_url)

    # 規定の金額(例: 1万円)を超えた場合のみ警告を出すロジック
    if expense.amount > 10000:
        return f"高額支出を検知しました: {expense.amount} {expense.currency}"

    # Google Sheets API等で追記処理
    save_to_sheets(expense.to_dict())
    return "記録完了"

このように、APIを介して自分の既存ツールに組み込める点が、単なる「家計簿アプリ」で終わらないGastosの強みです。

強みと弱み

強み:

  • 入力の自由度: テキスト、音声、写真のどれでも受け付けるため、状況を選ばず記録できる
  • 多通貨対応: 海外旅行モードが強力で、現地のレシートを撮れば自動で日本円換算(レート取得)まで行う
  • ゼロ・セットアップ: 複雑なカテゴリ設定をしなくても、AIが文脈から適切に分類してくれる

弱み:

  • 日本語特有の表現への対応: 「飲み代」は認識するが、極端に崩した表現や地方独自の呼び方にはたまに誤変換がある
  • エクスポートの柔軟性: 標準のCSV書き出し機能はあるが、日本の特定の会計ソフト(Freeeやマネーフォワード)専用の形式ではないため、インポート時に整形が必要
  • プライバシーの懸念: 音声や写真がクラウド上のAIモデルに送られるため、機密性の高い領収書を扱う際は規約の再確認が必要

代替ツールとの比較

項目GastosExpensifyマネーフォワードME
主要入力AIマルチモーダル手入力・OCR銀行・カード連携
海外対応非常に強い(自動換算)強い(法人向け)普通(手動設定多い)
解析速度0.5〜1.0秒数秒〜数分(人力補正あり)即時(同期型)
ターゲット個人・小規模チーム中堅・大企業個人(日本国内)

自動化の「手軽さ」ではGastosが勝りますが、銀行口座との「自動同期」による網羅性を重視するならマネーフォワードの方が適しています。

私の評価

実際に1週間、仕事の経費と私的な支出をGastosで管理してみましたが、最大の収穫は「記録の心理的ハードルが消えた」ことです。 これまでは「後でまとめて入力しよう」と思って財布の中に溜まったレシートが、結局月末のゴミになっていました。

Gastosの場合、店を出た瞬間にレシートを撮影するか、「タクシー代2,500円」とスマホに囁くだけで終わります。 この「0.5秒で終わる」感覚は、RTX 4090を積んだ自作PCでローカルLLMを動かした時の「レスポンスの速さによる体験の変革」に近いものがあります。

ただし、SIer的な堅実なシステム構築の視点で見ると、データの永続性や監査ログの機能はまだ発展途上です。 本格的な法人利用というよりは、機動力重視のフリーランスや、AIツールを私生活に組み込みたいエンジニア向けの「特化型エージェント」として評価するのが正解でしょう。

よくある質問

Q1: 音声入力の精度はどの程度ですか?

騒がしいカフェや路上でも、iPhoneの標準マイクで十分認識されます。 「スタバで650円」といった短いフレーズなら、98%以上の精度で金額と品目を正しく抽出できます。

Q2: 無料で使い続けることは可能ですか?

基本的なトラッキング機能は無料ですが、AIによる高度な解析回数や、複数デバイス間での同期、クラウドストレージ容量に制限がある「Proプラン(月額約$5〜$10程度)」が主流です。

Q3: 既存の会計ソフトへのデータ移行は簡単ですか?

標準でCSVおよびPDFの書き出しに対応しています。 ただし、日本の確定申告ソフトに直接流し込むには、列の名前を合わせるなどの簡単な加工が必要です。Pythonが書ける人なら、Pandasを使って1分で変換スクリプトが書けるレベルのプレーンな構造です。


あわせて読みたい