Default to gemini 2.0 flash instead of 1.5 flash on Gemini setup

Add price of gemini 2.0 flash for cost calculations
2026-03-06 05:39:12 +00:00 · 2025-02-12 21:42:23 +05:30
parent 701a7be291
commit b4183c7333
6 changed files with 11 additions and 10 deletions
--- a/src/khoj/processor/conversation/google/gemini_chat.py
+++ b/src/khoj/processor/conversation/google/gemini_chat.py
@@ -31,7 +31,7 @@ logger = logging.getLogger(__name__)

 def extract_questions_gemini(
    text,
-    model: Optional[str] = "gemini-1.5-flash",
+    model: Optional[str] = "gemini-2.0-flash",
    conversation_log={},
    api_key=None,
    temperature=0,
@@ -132,9 +132,9 @@ def gemini_send_message_to_model(

    model_kwargs = {}

-    # Sometimes, this causes unwanted behavior and terminates response early. Disable for now while it's flaky.
-    # if response_type == "json_object":
-    #     model_kwargs["response_mime_type"] = "application/json"
+    # This caused unwanted behavior and terminates response early for gemini 1.5 series. Monitor for flakiness with 2.0 series.
+    if response_type == "json_object" and model in ["gemini-2.0-flash"]:
+        model_kwargs["response_mime_type"] = "application/json"

    # Get Response from Gemini
    return gemini_completion_with_backoff(
@@ -154,7 +154,7 @@ def converse_gemini(
    online_results: Optional[Dict[str, Dict]] = None,
    code_results: Optional[Dict[str, Dict]] = None,
    conversation_log={},
-    model: Optional[str] = "gemini-1.5-flash",
+    model: Optional[str] = "gemini-2.0-flash",
    api_key: Optional[str] = None,
    temperature: float = 0.2,
    completion_func=None,
--- a/src/khoj/utils/constants.py
+++ b/src/khoj/utils/constants.py
@@ -18,7 +18,7 @@ default_offline_chat_models = [
    "bartowski/Qwen2.5-14B-Instruct-GGUF",
 ]
 default_openai_chat_models = ["gpt-4o-mini", "gpt-4o"]
-default_gemini_chat_models = ["gemini-1.5-flash", "gemini-1.5-pro"]
+default_gemini_chat_models = ["gemini-2.0-flash", "gemini-1.5-pro"]
 default_anthropic_chat_models = ["claude-3-5-sonnet-20241022", "claude-3-5-haiku-20241022"]

 empty_config = {
@@ -46,6 +46,7 @@ model_to_cost: Dict[str, Dict[str, float]] = {
    "gemini-1.5-flash-002": {"input": 0.075, "output": 0.30},
    "gemini-1.5-pro": {"input": 1.25, "output": 5.00},
    "gemini-1.5-pro-002": {"input": 1.25, "output": 5.00},
+    "gemini-2.0-flash": {"input": 0.10, "output": 0.40},
    # Anthropic Pricing: https://www.anthropic.com/pricing#anthropic-api_
    "claude-3-5-sonnet-20241022": {"input": 3.0, "output": 15.0},
    "claude-3-5-haiku-20241022": {"input": 1.0, "output": 5.0},