Merge pull request #2 from barnuri/copilot/sub-pr-1

barnuri · web-flow · commit 37ae83d6783a · 2025-11-20T10:22:39.000+02:00
Add tests for new index.py functionality
diff --git a/tests/test_index.py b/tests/test_index.py
@@ -8,15 +8,20 @@
 from pymongo.collection import Collection
 
 from pymongo_search_utils.index import (
+    create_fulltext_search_index,
     create_vector_search_index,
     drop_vector_search_index,
     is_index_ready,
     update_vector_search_index,
+    vector_search_index_definition,
+    wait_for_docs_in_index,
+    wait_for_predicate,
 )
 
 DB_NAME = "pymongo_search_utils_test"
 COLLECTION_NAME = "test_index"
 VECTOR_INDEX_NAME = "vector_index"
+FULLTEXT_INDEX_NAME = "fulltext_index"
 
 TIMEOUT = 120
 DIMENSIONS = 10
@@ -114,3 +119,186 @@ def test_search_index_update_vector_search_index(collection: Collection) -> None
     assert len(indexes) == 1
     assert indexes[0]["name"] == index_name
     assert indexes[0]["latestDefinition"]["fields"][0]["similarity"] == similarity_new
+
+
+def test_vector_search_index_definition() -> None:
+    """Test the vector_search_index_definition helper function."""
+    # Test basic definition without filters
+    definition = vector_search_index_definition(
+        dimensions=128, path="embedding", similarity="cosine"
+    )
+    assert "fields" in definition
+    assert len(definition["fields"]) == 1
+    assert definition["fields"][0]["numDimensions"] == 128
+    assert definition["fields"][0]["path"] == "embedding"
+    assert definition["fields"][0]["similarity"] == "cosine"
+    assert definition["fields"][0]["type"] == "vector"
+
+    # Test with filters
+    definition = vector_search_index_definition(
+        dimensions=256, path="vector", similarity="euclidean", filters=["category", "status"]
+    )
+    assert len(definition["fields"]) == 3
+    assert definition["fields"][0]["type"] == "vector"
+    assert definition["fields"][1]["type"] == "filter"
+    assert definition["fields"][1]["path"] == "category"
+    assert definition["fields"][2]["type"] == "filter"
+    assert definition["fields"][2]["path"] == "status"
+
+    # Test with vector_index_options
+    definition = vector_search_index_definition(
+        dimensions=512,
+        path="embed",
+        similarity="dotProduct",
+        vector_index_options={"quantization": {"type": "scalar"}},
+    )
+    assert definition["fields"][0]["quantization"] == {"type": "scalar"}
+
+    # Test with kwargs
+    definition = vector_search_index_definition(
+        dimensions=64, path="vec", similarity="cosine", storedSource=True
+    )
+    assert definition["storedSource"] is True
+
+
+def test_wait_for_predicate() -> None:
+    """Test the wait_for_predicate utility function."""
+    import time
+
+    # Test successful predicate
+    counter = {"value": 0}
+
+    def increment_predicate():
+        counter["value"] += 1
+        return counter["value"] >= 3
+
+    start = time.monotonic()
+    wait_for_predicate(increment_predicate, "Should not timeout", timeout=5, interval=0.1)
+    elapsed = time.monotonic() - start
+    assert counter["value"] >= 3
+    assert elapsed < 5
+
+    # Test timeout
+    def always_false():
+        return False
+
+    with pytest.raises(TimeoutError, match="Predicate failed"):
+        wait_for_predicate(always_false, "Predicate failed", timeout=0.5, interval=0.1)
+
+
+def test_create_fulltext_search_index_single_field(collection: Collection) -> None:
+    """Test creating a fulltext search index on a single field."""
+    index_name = FULLTEXT_INDEX_NAME
+    field = "description"
+    wait_until_complete = TIMEOUT
+
+    # Clean up existing indexes
+    for index_info in collection.list_search_indexes():
+        drop_vector_search_index(
+            collection, index_info["name"], wait_until_complete=wait_until_complete
+        )
+
+    # Create fulltext search index
+    create_fulltext_search_index(
+        collection=collection,
+        index_name=index_name,
+        field=field,
+        wait_until_complete=wait_until_complete,
+    )
+
+    # Verify index was created
+    assert is_index_ready(collection, index_name)
+    indexes = list(collection.list_search_indexes())
+    assert len(indexes) == 1
+    assert indexes[0]["name"] == index_name
+    assert indexes[0]["type"] == "search"
+    assert indexes[0]["latestDefinition"]["mappings"]["dynamic"] is False
+    assert field in indexes[0]["latestDefinition"]["mappings"]["fields"]
+
+    # Clean up
+    drop_vector_search_index(collection, index_name, wait_until_complete=wait_until_complete)
+
+
+def test_create_fulltext_search_index_multiple_fields(collection: Collection) -> None:
+    """Test creating a fulltext search index on multiple fields."""
+    index_name = "fulltext_multi_index"
+    fields = ["title", "description", "content"]
+    wait_until_complete = TIMEOUT
+
+    # Clean up existing indexes
+    for index_info in collection.list_search_indexes():
+        drop_vector_search_index(
+            collection, index_info["name"], wait_until_complete=wait_until_complete
+        )
+
+    # Create fulltext search index with multiple fields
+    create_fulltext_search_index(
+        collection=collection,
+        index_name=index_name,
+        field=fields,
+        wait_until_complete=wait_until_complete,
+    )
+
+    # Verify index was created
+    assert is_index_ready(collection, index_name)
+    indexes = list(collection.list_search_indexes())
+    assert len(indexes) == 1
+    assert indexes[0]["name"] == index_name
+    assert indexes[0]["type"] == "search"
+
+    # Verify all fields are in the index
+    index_fields = indexes[0]["latestDefinition"]["mappings"]["fields"]
+    for field in fields:
+        assert field in index_fields
+        assert index_fields[field] == [{"type": "string"}]
+
+    # Clean up
+    drop_vector_search_index(collection, index_name, wait_until_complete=wait_until_complete)
+
+
+def test_wait_for_docs_in_index(collection: Collection) -> None:
+    """Test waiting for documents to be indexed in a vector search index."""
+    index_name = "wait_docs_index"
+    dimensions = DIMENSIONS
+    path = "embedding"
+    similarity = "cosine"
+    wait_until_complete = TIMEOUT
+
+    # Clean up existing indexes
+    for index_info in collection.list_search_indexes():
+        drop_vector_search_index(
+            collection, index_info["name"], wait_until_complete=wait_until_complete
+        )
+
+    # Create vector search index
+    create_vector_search_index(
+        collection=collection,
+        index_name=index_name,
+        dimensions=dimensions,
+        path=path,
+        similarity=similarity,
+        wait_until_complete=wait_until_complete,
+    )
+
+    # Insert test documents with embeddings
+    n_docs = 5
+    docs = [{"_id": i, path: [0.1] * dimensions, "text": f"doc {i}"} for i in range(n_docs)]
+    collection.insert_many(docs)
+
+    # Wait for documents to be indexed
+    result = wait_for_docs_in_index(collection, index_name, n_docs)
+    assert result is True
+
+    # Clean up
+    drop_vector_search_index(collection, index_name, wait_until_complete=wait_until_complete)
+
+
+def test_wait_for_docs_in_index_nonexistent(collection: Collection) -> None:
+    """Test wait_for_docs_in_index raises error for non-existent index."""
+    # Ensure no indexes exist
+    for index_info in collection.list_search_indexes():
+        drop_vector_search_index(collection, index_info["name"], wait_until_complete=TIMEOUT)
+
+    # Should raise ValueError for non-existent index
+    with pytest.raises(ValueError, match="does not exist"):
+        wait_for_docs_in_index(collection, "nonexistent_index", 1)