2026 AI Dev Log: Menyeimbangkan Kekuatan, Harga, dan Produktivitas dalam Alur Kerja Pengembangan - Bagian 1

2026-03-07

/id/posts/2026-ai-dev-log-part-1/ map[avatar:https://github.com/rzkmak.png bio:A software engineer passionate about building great software and sharing knowledge. email:rzkmak@outlook.com location:Tokyo, JP name:Rizki Maulana Akbar professionaltitle:Software Engineer]

Saat kita menutup kuartal pertama 2026, lanskap pengembangan AI telah berubah dari “eksperimental” menjadi “mission-critical.” Kita tidak lagi sekadar mengobrol dengan LLM; kita mengorkestrasikan alur kerja agenik. Selama tiga bulan terakhir, saya telah mendalami model frontier terbaru dan alat yang menggunakannya, menguji segalanya dari deployment kelas korporasi hingga proyek pribadi yang sederhana.

Berikut adalah rincian dari apa yang telah saya pelajari tentang alur pengembangan AI di era yang bergerak cepat ini.

# Kondisi Model: Q1 2026

Batas “Frontier” telah dinaikkan secara signifikan. Kita telah melampaui tolok ukur lama ke dalam model yang memprioritaskan penalaran jangka panjang dan otonomi agenik.

Claude 4.6 (Sonnet & Opus): Terbaru dari Anthropic bisa dibilang adalah standar emas untuk coding. Sonnet 4.6 adalah pengemudi harian saya untuk kecepatan, sementara Opus 4.6 menangani beban arsitektur yang berat.

GPT-5.3 Codex: Model coding khusus dari OpenAI sangat seimbang. Rasanya kurang seperti antarmuka chat dan lebih seperti mesin logika yang dirancang khusus untuk refactoring mendalam.

Kimi K2.5 dan GLM 5 telah menjadi vital dalam rotasi saya, terutama untuk penanganan konteks masif sambil menjaga dompet saya tetap aman lol.

Saya memiliki kesempatan untuk bekerja dengan beberapa model, baik di lingkungan korporasi maupun lab pribadi saya sendiri. Kesenjangan antara penggunaan “pribadi” dan “profesional” biasanya bermuara pada satu hal: Harga 😂

# Development Kit: Menemukan Harness yang Tepat

Model hanya sebagus antarmuka yang Anda gunakan untuk berkomunikasi dengannya. Berikut adalah pendapat saya tentang alat yang telah saya gunakan di kuartal ini.

## 1. Claude Code

Ini telah menjadi favorit untuk alur kerja CLI tingkat lanjut.

Di setup profesional, saya menjalankan ini via Amazon Bedrock.

Tantangan Pribadi: Bedrock bagus, tetapi penagihannya bisa mahal untuk proyek solo. Pada langganan Pro standar $20/bulan, batas token terasa sangat membatasi untuk sesi dev yang berat.

Solusinya: Untuk menyelesaikan masalah model-lock dan token, saya akhirnya membangun claude-switch. Ini adalah alat kecil yang memungkinkan saya menukar model (seperti GLM) sambil menjaga pengalaman CLI, meskipun saya menemukan bahwa model non-Claude terkadang kesulitan dengan hook agenik spesifik lingkungan Claude Code.

## 2. OpenCode

Saya menggunakan OpenCode baik via OpenRouter terutama untuk model-hopping dan langganan OpenCode Go.

Langganan “Go”: Untuk penggunaan pribadi, saya mengandalkan langganan OpenCode Go. Dengan harga $10/bulan, ini adalah game-changer total, menyediakan akses andal ke tiga model frontier andal: GLM-5, Kimi K2.5, dan Minimax M2.5 dengan harga yang sangat kompetitif.

Bagian yang Kurang: Meskipun CLI bagus, saya masih merasa perlu antarmuka visual yang lebih baik untuk meninjau rencana kode kompleks sebelum dieksekusi. Ini bagus untuk eksekusi, tetapi masih agak sulit untuk ditinjau dalam perencanaan tingkat tinggi.

## 3. Cursor

Cursor tetap menjadi “pengemudi utama” untuk pekerjaan profesional saya. Saat ini menawarkan keseimbangan terbaik antara kecerdasan model, stabilitas harness, dan UI peninjauan yang tidak terasa berantakan.

Masalahnya: Harga untuk penggunaan pribadi agak tinggi untuk banyak developer independen, menjadikannya terutama dalam kategori “berbasis korporasi” bagi saya.

## 4. Anti-gravity

Saya memiliki harapan tinggi untuk Anti-gravity. Di awal 2026, loop umpan baliknya tak terkalahkan–benar-benar terasa seperti IDE “agen-native” pertama.

Vibe Saat Ini: Saat ini, semakin sulit untuk digunakan. Konsumsi token agresif, dan bahkan Sonnet cepat mencapai batas. Ini bisa sedikit buggy, tetapi loopnya masih top-tier. Saya sangat berharap ada pembaruan “Bring Your Own Key” (BYOK) atau optimalisasi yang lebih baik segera.

## 5. Zed (Favorit Baru)

Per awal Maret, Zed telah memimpin untuk pekerjaan pribadi saya. Ini sangat cepat dan ringan. Mengintegrasikannya dengan OpenCode CLI memberi saya setup yang sangat modern dan cepat.

Pertukarannya: Ekosistem ekstensi masih berkembang. Jika Anda terbiasa dengan pustaka besar IntelliJ atau VS Code, ini bisa terasa agak sepi, tetapi peningkatan performa biasanya mengimbanginya.

# Spec-Driven Development (SDD): Melampaui “Vibe Coding”

Kita telah melampaui fase “vibe coding”. Keandalan sekarang membutuhkan rencana.

Saya memulai tahun ini bereksperimen dengan GitHub’s Spec Kit. Hasilnya secara teknis solid, tetapi untuk developer solo, “ceremonynya” agak membebani. Ini menghasilkan volume dokumentasi dan daftar periksa yang tinggi–/specify, /plan, /tasks–yang fantastis untuk keselarasan tim tetapi menyebabkan token pribadi saya habis lebih cepat dari yang diharapkan.

Saya telah mencari keseimbangan yang lebih baik antara keandalan dan kemudahan penggunaan. Fokus utama saya untuk SDD bukan kepatuhan korporasi; ini tentang menciptakan harness yang dapat diulang dan ringan untuk prototyping dan mensimulasikan teknologi baru tanpa overhead yang berat.

## Masalah “Plan Mode”

“Plan Mode” di alat seperti Cursor dan Anti-gravity sangat kuat, tetapi saya merasa sulit melacak tugas setelah saya keluar dari IDE. Saya membutuhkan cara untuk menjaga rencana sederhana yang persisten yang dapat diikuti model apa pun tanpa overhead yang besar.

Itu mengarahkan saya untuk membuat mspec. Ini adalah pendekatan tooling ringan yang dirancang untuk menjaga “Plan” tetap sentral tanpa “Ceremony.” Ini masih awal, tetapi membuat prototyping pribadi saya jauh lebih dapat diprediksi.

# Katalog Otomasi: Apa yang Benar-Benar Dikirim

Salah satu pertanyaan terbesar yang saya terima adalah: “Apa yang sebenarnya Anda otomatisasi?” Mudah untuk tersesat dalam alat, tetapi berikut adalah pekerjaan praktis yang telah saya alihkan ke AI di Q1 2026.

## Apa yang Saya Otomatisasi Saat Ini:

Prototyping & Endpoint Operasional: Saya dapat membuat prototipe fungsional “Day 0” dalam hitungan menit. Ini mencakup pengaturan endpoint operasional yang benar-benar menangani logika, bukan hanya data dummy.

Pipeline Pengujian: Ini adalah kemenangan terbesar saya. Alur kerja saya sekarang adalah:

Hasilkan Test Plan komprehensif dari basis kode.
Minta AI untuk membangun unit, fungsional, dan API test berdasarkan rencana tersebut secara spesifik.

Dokumentasi & Mock: Saya menggunakan AI untuk menghasilkan dokumentasi API dari kode yang ada dan membangun “Mock Systems.” Ini sempurna untuk mensimulasikan edge cases untuk berbagai skenario.

Proyek Pribadi: AI secara efektif telah menghilangkan masalah “halaman kosong”. Baik itu utilitas kecil atau proyek pribadi yang kompleks, kecepatan eksekusi adalah x kali lipat dari tahun lalu.

## Apa yang TIDAK Saya Otomatisasi:

Menangani Inquiry/Dukungan: Saya masih menarik garis keras di sini. Kemungkinan halusinasi terlalu berbahaya ketika menjawab orang yang tidak memiliki latar belakang teknis untuk menemukan kesalahan. Jika AI dengan “percaya diri” memberikan saran yang salah kepada pengguna, biaya reputasi jauh melebihi keuntungan efisiensi.

# Melihat ke Depan

Tiga bulan pertama 2026 telah menunjukkan bahwa masa depan dev bukan hanya tentang siapa yang memiliki model terbesar–ini tentang siapa yang memiliki alur kerja paling efisien. Saya akan mengunjungi kembali ini dalam tiga bulan lagi untuk melihat bagaimana alat-alat ini (dan milik saya sendiri) telah berevolusi.

Sampai jumpa lagi, selamat coding (dan prompting)!