Skip to main content

rzkmak's notes

ℹ️ このページはAI/LLMによって翻訳されました

2026 AI Dev Log: パワー、価格、生産性のバランスを取る開発ワークフロー - パート1

現在の個人セットアップ 2026/03

現在の個人セットアップ 2026/03

2026年の第1四半期を締めくくるにあたり、AI開発の状況は「実験的」から「ミッションクリティカル」へと移行しました。もうLLMと単におしゃべりしているだけではありません。エージェント型ワークフローをオーケストレーションしています。過去3ヶ月間、最新のフロンティアモデルとそれらを活用するツールに深く潜り込み、企業レベルの展開から個人的な小規模プロジェクトまであらゆるものをテストしてきました。

この急速に変化する時代におけるAI開発フローについて学んだことをまとめます。

# モデルの現状:2026年第1四半期

「フロンティア」の基準は大幅に引き上げられました。長期的推論とエージェント自律性を優先するモデルへと、古いベンチマークを超えて移行しました。

Claude 4.6(Sonnet & Opus): Anthropicの最新モデルは間違いなくコーディングのゴールドスタンダードです。Sonnet 4.6はスピード重視の毎日の相棒で、Opus 4.6は重いアーキテクチャ作業を担当します。

GPT-5.3 Codex: OpenAIの専門コーディングモデルは信じられないほどバランスが取れています。チャットインターフェースというよりも、深いリファクタリング専用に設計されたロジックエンジンのような感じです。

Kimi K2.5とGLM 5は、特に財布を守りながら巨大なコンテキストを扱う際に、私のローテーションで不可欠になっています(笑)。

いくつかのモデルを、企業環境と個人のラボの両方で使用する機会がありました。「個人」と「プロフェッショナル」の使用の違いは、通常、一つのことに帰結します:価格 😂

# 開発キット:適切なハーネスの見つけ方

モデルは、それと対話するために使用するインターフェースと同じくらい良いものです。この四半期に使用したツールについての私の考えを紹介します。

## 1. Claude Code

これは高度なCLIベースのワークフローでお気に入りになりました。

プロフェッショナルな環境では、Amazon Bedrock経由でこれを実行しています。

個人の課題: Bedrockは素晴らしいですが、ソロプロジェクトでは課金が高くなる可能性があります。標準の$20/月のProサブスクリプションでは、トークン制限が重い開発セッションには非常に制限的に感じます。

解決策: モデルロックとトークンの問題を解決するために、claude-switchを構築しました。CLI体験を維持しながらモデル(GLMなど)を切り替えられる小さなツールですが、Claude以外のモデルがClaude Code環境の特定のエージェントフックで苦労することがあることに気づきました。

## 2. OpenCode

OpenCodeは、主にモデルホッピング用のOpenRouter経由とOpenCode Goサブスクリプションの両方で使用しています。

「Go」サブスクリプション: 個人使用では、OpenCode Goサブスクリプションに頼っています。月額$10で、非常に競争力のある価格でGLM-5、Kimi K2.5、Minimax M2.5という3つの強力なフロンティアモデルへの信頼できるアクセスを提供し、全く新しいゲームチェンジャーです。

欠けている部分: CLIは素晴らしいですが、複雑なコードプランを実行前に確認するためのよりビジュアルなインターフェースが必要だと感じています。実行には優れていますが、高レベルの計画での確認には少し難があります。

## 3. Cursor

Cursorは、私のプロフェッショナルな仕事の「メインドライバー」であり続けています。現在、モデルの知性、ハーネスの安定性、そしてごちゃごちゃしていないレビューUIの間で最良のバランスを提供しています。

難点: 個人使用の価格は、多くの独立した開発者にとって少し高く、私にとっては主に「企業資金」カテゴリに留まっています。

## 4. Anti-gravity

Anti-gravityには大きな期待を寄せていました。2026年初頭には、フィードバックループが比類のないものでした。本当に最初の「エージェントネイティブ」IDEのように感じられました。

現在の雰囲気: 最近では、使いにくくなってきています。トークン消費が激しく、Sonnetでもすぐに制限に達します。少しバグがあることもありますが、ループはまだトップクラスです。「Bring Your Own Key」(BYOK)のアップデートや、より良い最適化を本当に期待しています。

## 5. Zed(新しいお気に入り)

3月初旬現在、Zedは私の個人的な作業で先頭に立っています。信じられないほど軽快で軽量です。OpenCode CLIとの統合により、非常にモダンで高速なセットアップが実現します。

トレードオフ: エクステンションエコシステムはまだ成長途上です。IntelliJやVS Codeの巨大なライブラリに慣れていると、少し物足りなく感じることがありますが、パフォーマンスの向上が通常それを補ってくれます。

# Spec-Driven Development(SDD):「Vibe Coding」を超えて

私たちは「vibe coding」フェーズを超えました。信頼性には今や計画が必要です。

今年はGitHubのSpec Kitで実験を始めました。結果は技術的に堅実でしたが、個人開発者にとっては「儀式」が少し圧倒的でした。/specify、/plan、/tasksなど、大量のドキュメントとチェックリストを生成します。これはチームの整合性には素晴らしいですが、個人のトークンが予想よりもはるかに速く枯渇する原因となりました。

信頼性と使いやすさの間でより良いバランスを探しています。SDDの主な焦点は企業のコンプライアンスではありません。重いオーバーヘッドなしに、プロトタイピングと新しい技術のシミュレーションのための、繰り返し可能で軽量なハーネスを作成することです。

## 「Plan Mode」の問題

CursorやAnti-gravityなどのツールの「Plan Mode」は強力ですが、IDEから離れるとタスクの追跡が難しいと感じました。大きなオーバーヘッドなしに、どのモデルでも追従できるシンプルで永続的な計画を維持する方法が必要でした。

それが私がmspecを作成した理由です。「Ceremony」なしに「Plan」を中心的に保つように設計された、軽量なツーリングアプローチです。まだ初期段階ですが、個人のプロトタイピングをはるかに予測可能にしています。

# 自動化カタログ:実際に出荷されているもの

最も多い質問の一つは:「実際に何を自動化しているのですか?」ツールに迷い込むのは簡単ですが、2026年第1四半期にAIに移行した実用的な作業を紹介します。

## 現在自動化しているもの:

プロトタイピングと運用エンドポイント: 「Day 0」の機能的プロトタイプを数分で立ち上げることができます。これには、ダミーデータだけでなく実際にロジックを処理する運用エンドポイントの設定が含まれます。

テストパイプライン: これが私の最大の勝利です。現在のワークフローは:

  • コードベースから包括的なテストプランを生成する。
  • AIに、そのプランに基づいてユニット、機能、APIテストを構築するように指示する。

ドキュメンテーションとモック: AIを使用して既存のコードからAPIドキュメントを生成し、「モックシステム」を構築します。これは、さまざまなシナリオのエッジケースをシミュレートするのに最適です。

個人プロジェクト: AIは実質的に「空白のページ」問題を解消しました。小さなユーティリティであろうと複雑な個人プロジェクトであろうと、実行速度は昨年のx倍です。

## 自動化していないもの:

問い合わせ/サポートの対応: ここではまだ厳しい線を引いています。技術的な背景を持たずにエラーを発見できない人々に答える場合、幻覚の可能性が危険すぎます。AIが「自信を持って」間違ったアドバイスをユーザーに与えた場合、評判コストは効率の向上をはるかに上回ります。

# 今後の展望

2026年の最初の3ヶ月間は、開発の未来が最大のモデルを持つ人だけでなく、最も効率的なワークフローを持つ人にあることを示しました。3ヶ月後に、これらのツール(そして私自身のツール)がどのように進化したかを確認するために、これを再訪問します。

それでは、ハッピーコーディング(そしてプロンプティング)!