Drop old pre 1.0 khoj config migration scripts

These were used when khoj was configured using khoj.yml file
2026-04-19 17:14:35 +00:00 · 2025-07-03 15:04:55 -07:00
parent 9096f628d0
commit 3f8cc71aca
9 changed files with 0 additions and 492 deletions
--- a/src/khoj/migrations/init.py
+++ b/src/khoj/migrations/init.py
--- a/src/khoj/migrations/migrate_offline_chat_default_model.py
+++ b/src/khoj/migrations/migrate_offline_chat_default_model.py
@@ -1,69 +0,0 @@
-"""
-Current format of khoj.yml
---
-app:
-    ...
-content-type:
-    ...
-processor:
-  conversation:
-    offline-chat:
-        enable-offline-chat: false
-        chat-model: llama-2-7b-chat.ggmlv3.q4_0.bin
-    ...
-search-type:
-    ...
-
-New format of khoj.yml
---
-app:
-    ...
-content-type:
-    ...
-processor:
-  conversation:
-    offline-chat:
-        enable-offline-chat: false
-        chat-model: mistral-7b-instruct-v0.1.Q4_0.gguf
-    ...
-search-type:
-    ...
-"""
-import logging
-
-from packaging import version
-
-from khoj.utils.yaml import load_config_from_file, save_config_to_file
-
-logger = logging.getLogger(__name__)
-
-
-def migrate_offline_chat_default_model(args):
-    schema_version = "0.12.4"
-    raw_config = load_config_from_file(args.config_file)
-    previous_version = raw_config.get("version")
-
-    if "processor" not in raw_config:
-        return args
-    if raw_config["processor"] is None:
-        return args
-    if "conversation" not in raw_config["processor"]:
-        return args
-    if "offline-chat" not in raw_config["processor"]["conversation"]:
-        return args
-    if "chat-model" not in raw_config["processor"]["conversation"]["offline-chat"]:
-        return args
-
-    if previous_version is None or version.parse(previous_version) < version.parse("0.12.4"):
-        logger.info(
-            f"Upgrading config schema to {schema_version} from {previous_version} to change default (offline) chat model to mistral GGUF"
-        )
-        raw_config["version"] = schema_version
-
-        # Update offline chat model to mistral in GGUF format to use latest GPT4All
-        offline_chat_model = raw_config["processor"]["conversation"]["offline-chat"]["chat-model"]
-        if offline_chat_model.endswith(".bin"):
-            raw_config["processor"]["conversation"]["offline-chat"]["chat-model"] = "mistral-7b-instruct-v0.1.Q4_0.gguf"
-
-        save_config_to_file(raw_config, args.config_file)
-    return args
--- a/src/khoj/migrations/migrate_offline_chat_default_model_2.py
+++ b/src/khoj/migrations/migrate_offline_chat_default_model_2.py
@@ -1,71 +0,0 @@
-"""
-Current format of khoj.yml
---
-app:
-    ...
-content-type:
-    ...
-processor:
-  conversation:
-    offline-chat:
-        enable-offline-chat: false
-        chat-model: mistral-7b-instruct-v0.1.Q4_0.gguf
-    ...
-search-type:
-    ...
-
-New format of khoj.yml
---
-app:
-    ...
-content-type:
-    ...
-processor:
-  conversation:
-    offline-chat:
-        enable-offline-chat: false
-        chat-model: NousResearch/Hermes-2-Pro-Mistral-7B-GGUF
-    ...
-search-type:
-    ...
-"""
-import logging
-
-from packaging import version
-
-from khoj.utils.yaml import load_config_from_file, save_config_to_file
-
-logger = logging.getLogger(__name__)
-
-
-def migrate_offline_chat_default_model(args):
-    schema_version = "1.7.0"
-    raw_config = load_config_from_file(args.config_file)
-    previous_version = raw_config.get("version")
-
-    if "processor" not in raw_config:
-        return args
-    if raw_config["processor"] is None:
-        return args
-    if "conversation" not in raw_config["processor"]:
-        return args
-    if "offline-chat" not in raw_config["processor"]["conversation"]:
-        return args
-    if "chat-model" not in raw_config["processor"]["conversation"]["offline-chat"]:
-        return args
-
-    if previous_version is None or version.parse(previous_version) < version.parse(schema_version):
-        logger.info(
-            f"Upgrading config schema to {schema_version} from {previous_version} to change default (offline) chat model to mistral GGUF"
-        )
-        raw_config["version"] = schema_version
-
-        # Update offline chat model to use Nous Research's Hermes-2-Pro GGUF in path format suitable for llama-cpp
-        offline_chat_model = raw_config["processor"]["conversation"]["offline-chat"]["chat-model"]
-        if offline_chat_model == "mistral-7b-instruct-v0.1.Q4_0.gguf":
-            raw_config["processor"]["conversation"]["offline-chat"][
-                "chat-model"
-            ] = "NousResearch/Hermes-2-Pro-Mistral-7B-GGUF"
-
-        save_config_to_file(raw_config, args.config_file)
-    return args
--- a/src/khoj/migrations/migrate_offline_chat_schema.py
+++ b/src/khoj/migrations/migrate_offline_chat_schema.py
@@ -1,83 +0,0 @@
-"""
-Current format of khoj.yml
---
-app:
-    ...
-content-type:
-    ...
-processor:
-  conversation:
-    enable-offline-chat: false
-    conversation-logfile: ~/.khoj/processor/conversation/conversation_logs.json
-    openai:
-        ...
-search-type:
-    ...
-
-New format of khoj.yml
---
-app:
-    ...
-content-type:
-    ...
-processor:
-  conversation:
-    offline-chat:
-        enable-offline-chat: false
-        chat-model: llama-2-7b-chat.ggmlv3.q4_0.bin
-    tokenizer: null
-    max_prompt_size: null
-    conversation-logfile: ~/.khoj/processor/conversation/conversation_logs.json
-    openai:
-        ...
-search-type:
-    ...
-"""
-import logging
-
-from packaging import version
-
-from khoj.utils.yaml import load_config_from_file, save_config_to_file
-
-logger = logging.getLogger(__name__)
-
-
-def migrate_offline_chat_schema(args):
-    schema_version = "0.12.3"
-    raw_config = load_config_from_file(args.config_file)
-    previous_version = raw_config.get("version")
-
-    if "processor" not in raw_config:
-        return args
-    if raw_config["processor"] is None:
-        return args
-    if "conversation" not in raw_config["processor"]:
-        return args
-
-    if previous_version is None or version.parse(previous_version) < version.parse("0.12.3"):
-        logger.info(
-            f"Upgrading config schema to {schema_version} from {previous_version} to make (offline) chat more configuration"
-        )
-        raw_config["version"] = schema_version
-
-        # Create max-prompt-size field in conversation processor schema
-        raw_config["processor"]["conversation"]["max-prompt-size"] = None
-        raw_config["processor"]["conversation"]["tokenizer"] = None
-
-        # Create offline chat schema based on existing enable_offline_chat field in khoj config schema
-        offline_chat_model = (
-            raw_config["processor"]["conversation"]
-            .get("offline-chat", {})
-            .get("chat-model", "llama-2-7b-chat.ggmlv3.q4_0.bin")
-        )
-        raw_config["processor"]["conversation"]["offline-chat"] = {
-            "enable-offline-chat": raw_config["processor"]["conversation"].get("enable-offline-chat", False),
-            "chat-model": offline_chat_model,
-        }
-
-        # Delete old enable-offline-chat field from conversation processor schema
-        if "enable-offline-chat" in raw_config["processor"]["conversation"]:
-            del raw_config["processor"]["conversation"]["enable-offline-chat"]
-
-        save_config_to_file(raw_config, args.config_file)
-    return args
--- a/src/khoj/migrations/migrate_offline_model.py
+++ b/src/khoj/migrations/migrate_offline_model.py
@@ -1,29 +0,0 @@
-import logging
-import os
-
-from packaging import version
-
-from khoj.utils.yaml import load_config_from_file, save_config_to_file
-
-logger = logging.getLogger(__name__)
-
-
-def migrate_offline_model(args):
-    schema_version = "0.10.1"
-    raw_config = load_config_from_file(args.config_file)
-    previous_version = raw_config.get("version")
-
-    if previous_version is None or version.parse(previous_version) < version.parse("0.10.1"):
-        logger.info(
-            f"Migrating offline model used for version {previous_version} to latest version for {args.version_no}"
-        )
-        raw_config["version"] = schema_version
-
-        # If the user has downloaded the offline model, remove it from the cache.
-        offline_model_path = os.path.expanduser("~/.cache/gpt4all/llama-2-7b-chat.ggmlv3.q4_K_S.bin")
-        if os.path.exists(offline_model_path):
-            os.remove(offline_model_path)
-
-        save_config_to_file(raw_config, args.config_file)
-
-    return args
--- a/src/khoj/migrations/migrate_processor_config_openai.py
+++ b/src/khoj/migrations/migrate_processor_config_openai.py
@@ -1,67 +0,0 @@
-"""
-Current format of khoj.yml
---
-app:
-  should-log-telemetry: true
-content-type:
-    ...
-processor:
-  conversation:
-    chat-model: gpt-3.5-turbo
-    conversation-logfile: ~/.khoj/processor/conversation/conversation_logs.json
-    model: text-davinci-003
-    openai-api-key: sk-secret-key
-search-type:
-    ...
-
-New format of khoj.yml
---
-app:
-  should-log-telemetry: true
-content-type:
-    ...
-processor:
-  conversation:
-    openai:
-        chat-model: gpt-3.5-turbo
-        openai-api-key: sk-secret-key
-    conversation-logfile: ~/.khoj/processor/conversation/conversation_logs.json
-    enable-offline-chat: false
-search-type:
-    ...
-"""
-from khoj.utils.yaml import load_config_from_file, save_config_to_file
-
-
-def migrate_processor_conversation_schema(args):
-    schema_version = "0.10.0"
-    raw_config = load_config_from_file(args.config_file)
-
-    if "processor" not in raw_config:
-        return args
-    if raw_config["processor"] is None:
-        return args
-    if "conversation" not in raw_config["processor"]:
-        return args
-
-    current_openai_api_key = raw_config["processor"]["conversation"].get("openai-api-key", None)
-    current_chat_model = raw_config["processor"]["conversation"].get("chat-model", None)
-    if current_openai_api_key is None and current_chat_model is None:
-        return args
-
-    raw_config["version"] = schema_version
-
-    # Add enable_offline_chat to khoj config schema
-    if "enable-offline-chat" not in raw_config["processor"]["conversation"]:
-        raw_config["processor"]["conversation"]["enable-offline-chat"] = False
-
-    # Update conversation processor schema
-    conversation_logfile = raw_config["processor"]["conversation"].get("conversation-logfile", None)
-    raw_config["processor"]["conversation"] = {
-        "openai": {"chat-model": current_chat_model, "api-key": current_openai_api_key},
-        "conversation-logfile": conversation_logfile,
-        "enable-offline-chat": False,
-    }
-
-    save_config_to_file(raw_config, args.config_file)
-    return args
--- a/src/khoj/migrations/migrate_server_pg.py
+++ b/src/khoj/migrations/migrate_server_pg.py
@@ -1,132 +0,0 @@
-"""
-The application config currently looks like this:
-app:
-  should-log-telemetry: true
-content-type:
-    ...
-processor:
-  conversation:
-    conversation-logfile: ~/.khoj/processor/conversation/conversation_logs.json
-    max-prompt-size: null
-    offline-chat:
-      chat-model: mistral-7b-instruct-v0.1.Q4_0.gguf
-      enable-offline-chat: false
-    openai:
-      api-key: sk-blah
-      chat-model: gpt-3.5-turbo
-    tokenizer: null
-search-type:
-  asymmetric:
-    cross-encoder: cross-encoder/ms-marco-MiniLM-L-6-v2
-    encoder: sentence-transformers/multi-qa-MiniLM-L6-cos-v1
-    encoder-type: null
-    model-directory: /Users/si/.khoj/search/asymmetric
-  image:
-    encoder: sentence-transformers/clip-ViT-B-32
-    encoder-type: null
-    model-directory: /Users/si/.khoj/search/image
-  symmetric:
-    cross-encoder: cross-encoder/ms-marco-MiniLM-L-6-v2
-    encoder: sentence-transformers/all-MiniLM-L6-v2
-    encoder-type: null
-    model-directory: ~/.khoj/search/symmetric
-version: 0.14.0
-
-
-The new version will looks like this:
-app:
-  should-log-telemetry: true
-processor:
-  conversation:
-    offline-chat:
-      enabled: false
-    openai:
-      api-key: sk-blah
-    chat-model-options:
-      - chat-model: gpt-3.5-turbo
-        tokenizer: null
-        type: openai
-      - chat-model: mistral-7b-instruct-v0.1.Q4_0.gguf
-        tokenizer: null
-        type: offline
-search-type:
-  asymmetric:
-    cross-encoder: cross-encoder/ms-marco-MiniLM-L-6-v2
-    encoder: sentence-transformers/multi-qa-MiniLM-L6-cos-v1
-version: 0.15.0
-"""
-
-import logging
-
-from packaging import version
-
-from khoj.database.models import AiModelApi, ChatModel, SearchModelConfig
-from khoj.utils.yaml import load_config_from_file, save_config_to_file
-
-logger = logging.getLogger(__name__)
-
-
-def migrate_server_pg(args):
-    schema_version = "0.15.0"
-    raw_config = load_config_from_file(args.config_file)
-    previous_version = raw_config.get("version")
-
-    if previous_version is None or version.parse(previous_version) < version.parse(schema_version):
-        logger.info(
-            f"Migrating configuration used for version {previous_version} to latest version for server with postgres in {args.version_no}"
-        )
-        raw_config["version"] = schema_version
-
-        if raw_config is None:
-            return args
-
-        if "search-type" in raw_config and raw_config["search-type"]:
-            if "asymmetric" in raw_config["search-type"]:
-                # Delete all existing search models
-                SearchModelConfig.objects.filter(model_type=SearchModelConfig.ModelType.TEXT).delete()
-                # Create new search model from existing Khoj YAML config
-                asymmetric_search = raw_config["search-type"]["asymmetric"]
-                SearchModelConfig.objects.create(
-                    name="default",
-                    model_type=SearchModelConfig.ModelType.TEXT,
-                    bi_encoder=asymmetric_search.get("encoder"),
-                    cross_encoder=asymmetric_search.get("cross-encoder"),
-                )
-
-        if "processor" in raw_config and raw_config["processor"] and "conversation" in raw_config["processor"]:
-            processor_conversation = raw_config["processor"]["conversation"]
-
-            if "offline-chat" in raw_config["processor"]["conversation"]:
-                offline_chat = raw_config["processor"]["conversation"]["offline-chat"]
-                ChatModel.objects.create(
-                    name=offline_chat.get("chat-model"),
-                    tokenizer=processor_conversation.get("tokenizer"),
-                    max_prompt_size=processor_conversation.get("max-prompt-size"),
-                    model_type=ChatModel.ModelType.OFFLINE,
-                )
-
-            if (
-                "openai" in raw_config["processor"]["conversation"]
-                and raw_config["processor"]["conversation"]["openai"]
-            ):
-                openai = raw_config["processor"]["conversation"]["openai"]
-
-                if openai.get("api-key") is None:
-                    logger.error("OpenAI API Key is not set. Will not be migrating OpenAI config.")
-                else:
-                    if openai.get("chat-model") is None:
-                        openai["chat-model"] = "gpt-3.5-turbo"
-
-                    openai_model_api = AiModelApi.objects.create(api_key=openai.get("api-key"), name="default")
-
-                    ChatModel.objects.create(
-                        name=openai.get("chat-model"),
-                        tokenizer=processor_conversation.get("tokenizer"),
-                        max_prompt_size=processor_conversation.get("max-prompt-size"),
-                        model_type=ChatModel.ModelType.OPENAI,
-                        ai_model_api=openai_model_api,
-                    )
-
-        save_config_to_file(raw_config, args.config_file)
-
-    return args
--- a/src/khoj/migrations/migrate_version.py
+++ b/src/khoj/migrations/migrate_version.py
@@ -1,17 +0,0 @@
-from khoj.utils.yaml import load_config_from_file, save_config_to_file
-
-
-def migrate_config_to_version(args):
-    schema_version = "0.9.0"
-    raw_config = load_config_from_file(args.config_file)
-
-    # Add version to khoj config schema
-    if "version" not in raw_config:
-        raw_config["version"] = schema_version
-        save_config_to_file(raw_config, args.config_file)
-
-        # regenerate khoj index on first start of this version
-        # this should refresh index and apply index corruption fixes from #325
-        args.regenerate = True
-
-    return args
--- a/src/khoj/utils/cli.py
+++ b/src/khoj/utils/cli.py
@@ -6,16 +6,6 @@ from importlib.metadata import version

 logger = logging.getLogger(__name__)

-from khoj.migrations.migrate_offline_chat_default_model import (
-    migrate_offline_chat_default_model,
-)
-from khoj.migrations.migrate_offline_chat_schema import migrate_offline_chat_schema
-from khoj.migrations.migrate_offline_model import migrate_offline_model
-from khoj.migrations.migrate_processor_config_openai import (
-    migrate_processor_conversation_schema,
-)
-from khoj.migrations.migrate_server_pg import migrate_server_pg
-from khoj.migrations.migrate_version import migrate_config_to_version
 from khoj.utils.helpers import is_env_var_true, resolve_absolute_path
 from khoj.utils.yaml import parse_config_from_file

@@ -85,17 +75,3 @@ def cli(args=None):
            args.config.app.should_log_telemetry = False

    return args
-
-
-def run_migrations(args):
-    migrations = [
-        migrate_config_to_version,
-        migrate_processor_conversation_schema,
-        migrate_offline_model,
-        migrate_offline_chat_schema,
-        migrate_offline_chat_default_model,
-        migrate_server_pg,
-    ]
-    for migration in migrations:
-        args = migration(args)
-    return args