Updating assertions in other tests for this PR's changes

Future-House · jamesbraza · Nov 4, 2025 · Nov 1, 2025 · Nov 1, 2025 · Nov 1, 2025
commit 7bfad1447316e559fc973fc586cf24fd397e921f
diff --git a/tests/test_agents.py b/tests/test_agents.py
@@ -91,11 +91,12 @@ async def test_get_directory_index(
         ], "Incorrect fields in index"
         assert not index.changed, "Expected index to not have changes at this point"
         # bates.txt + empty.txt + flag_day.html + gravity_hill.md + influence.pdf
-        # + obama.txt + paper.pdf + pasa.pdf + duplicate_media.pdf,
+        # + obama.txt + paper.pdf + pasa.pdf + duplicate_media.pdf
+        # + dummy.docx + dummy.pptx + dummy.xlsx,
         # but empty.txt fails to be added
         path_to_id = await index.index_files
         assert (
-            sum(id_ != FAILED_DOCUMENT_ADD_ID for id_ in path_to_id.values()) == 8
+            sum(id_ != FAILED_DOCUMENT_ADD_ID for id_ in path_to_id.values()) == 11
         ), "Incorrect number of parsed index files"
 
         with subtests.test(msg="check-txt-query"):
@@ -159,9 +160,9 @@ async def test_get_directory_index(
             ),
         ):
             index = await get_directory_index(settings=agent_test_settings)
-        # Subtract 1 for the removed obama.txt file,
+        # Subtract 4 for the removed obama.txt, dummy.docx, dummy.pptx, and dummy.xlsx files,
         # and another 1 for the filtered out flag_day.html
-        assert len(await index.index_files) == len(path_to_id) - 2
+        assert len(await index.index_files) == len(path_to_id) - 4 - 1
         mock_aadd.assert_not_awaited(), "Expected we didn't re-add files"
 
         # Note let's delete files.zip, and confirm we can't load the index
@@ -261,6 +262,9 @@ async def test_getting_manifest(
     "obama.txt",
     "paper.pdf",
     "pasa.pdf",
+    "dummy.docx",
+    "dummy.pptx",
+    "dummy.xlsx",
 }
 
 

diff --git a/tests/test_paperqa.py b/tests/test_paperqa.py
@@ -1385,7 +1385,7 @@ async def test_chunk_metadata_reader(
     assert "pdf" in metadata.name
     assert isinstance(metadata.chunk_metadata, ChunkMetadata)
     assert metadata.chunk_metadata.name
-    assert "overlap-pdf" in metadata.chunk_metadata.name
+    assert "overlap-document" in metadata.chunk_metadata.name
     assert metadata.chunk_metadata.overlap == 100
     assert metadata.chunk_metadata.size == 3000
     assert len(chunk_text) > 2, "Expected multiple chunks, for meaningful assertions"