Menganalisis Efisiensi Biaya Model LLM: Studi Kasus Prompt Caching dan Simulasi Lintas Model

Studi ini membandingkan biaya penggunaan model LLM seperti Claude Sonnet 4, GPT-4o, dan Kimi K2 berdasarkan log penggunaan nyata dari Databricks dan menyimulasikan efisiensi caching terhadap total biaya.

July 18, 2025 Jam 15