Use XMP metadata in images to improve image search

- Details - The CLIP model can represent images, text in the same vector space - Enhance CLIP's image understanding by augmenting the plain image with it's text based metadata. Specifically with any subject, description XMP tags on the image - Improve results by combining plain image similarity score with metadata similarity scores for the highest ranked images - Minor Fixes - Convert verbose to integer from bool in image_search. It's already passed as integer from the main program entrypoint - Process images with ".jpeg" extensions too
2026-03-04 13:20:17 +00:00 · 2021-09-15 22:54:03 -07:00
parent 0e34c8f493
commit d8abbc0552
3 changed files with 405 additions and 33 deletions
--- a/src/main.py
+++ b/src/main.py
@@ -68,6 +68,7 @@ def search(q: str, n: Optional[int] = 5, t: Optional[str] = None):
        hits = image_search.query_images(
            user_query,
            image_embeddings,
+            image_metadata_embeddings,
            image_encoder,
            results_count,
            args.verbose)
@@ -124,8 +125,10 @@ def regenerate(t: Optional[str] = None):
    if (t == 'image' or t == None) and image_search_enabled:
        # Extract Images, Generate Embeddings
        global image_embeddings
+        global image_metadata_embeddings
        global image_names
-        image_names, image_embeddings, _ = image_search.setup(
+
+        image_names, image_embeddings, image_metadata_embeddings, _ = image_search.setup(
            pathlib.Path(image_config['input-directory']),
            pathlib.Path(image_config['embeddings-file']),
            regenerate=True,
@@ -181,7 +184,7 @@ if __name__ == '__main__':
    image_search_enabled = False
    if image_config and 'input-directory' in image_config:
        image_search_enabled = True
-        image_names, image_embeddings, image_encoder = image_search.setup(
+        image_names, image_embeddings, image_metadata_embeddings, image_encoder = image_search.setup(
            pathlib.Path(image_config['input-directory']),
            pathlib.Path(image_config['embeddings-file']),
            args.regenerate,