Menganalisis Efisiensi Biaya Model LLM: Studi Kasus Prompt Caching dan Simulasi Lintas Model
Studi ini membandingkan biaya penggunaan model LLM seperti Claude Sonnet 4, GPT-4o, dan Kimi K2 berdasarkan log penggunaan nyata dari Databricks dan menyimulasikan efisiensi caching terhadap total biaya.