vlm-run
diff --git a/‎tests/common/test_utils.py‎
Lines changed: 20 additions & 1 deletion b/‎tests/common/test_utils.py‎
Lines changed: 20 additions & 1 deletion
diff --git a/‎tests/conftest.py‎
Lines changed: 98 additions & 61 deletions b/‎tests/conftest.py‎
Lines changed: 98 additions & 61 deletions
diff --git a/‎tests/test_data/image_dataset/test1.jpg‎
106 KB b/‎tests/test_data/image_dataset/test1.jpg‎
106 KB
diff --git a/‎tests/test_data/image_dataset/test2.png‎
594 KB b/‎tests/test_data/image_dataset/test2.png‎
594 KB
diff --git a/‎tests/test_data/image_dataset/test3.jpg‎
93.7 KB b/‎tests/test_data/image_dataset/test3.jpg‎
93.7 KB
diff --git a/‎tests/test_dataset.py‎
Lines changed: 3 additions & 3 deletions b/‎tests/test_dataset.py‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎tests/test_feedback.py‎
Lines changed: 2 additions & 4 deletions b/‎tests/test_feedback.py‎
Lines changed: 2 additions & 4 deletions
diff --git a/‎tests/test_files.py‎
Lines changed: 2 additions & 10 deletions b/‎tests/test_files.py‎
Lines changed: 2 additions & 10 deletions
@@ -1,4 +1,6 @@
-from vlmrun.common.utils import download_artifact
+from pathlib import Path
+
+from vlmrun.common.utils import download_artifact, create_archive
 
 PDF_URL = "https://storage.googleapis.com/vlm-data-public-prod/hub/examples/document.bank-statement/lending_bankstatement.pdf"
 
@@ -7,3 +9,20 @@ def test_download_artifact():
     """Test that download_artifact can download a PDF."""
     pdf = download_artifact(PDF_URL, "file")
     assert pdf.exists()
+
+
+def test_create_archive():
+    """Test that create_archive can create a tar.gz file."""
+    import tarfile
+
+    archive_path: Path = create_archive(
+        Path(__file__).parent.parent / "test_data/image_dataset", "test_image_dataset"
+    )
+    assert archive_path.exists()
+    assert archive_path.name.endswith(".tar.gz")
+
+    # Unzip the archive and check if there is a folder with the same name as the stem
+    stem = archive_path.name.replace(".tar.gz", "")
+    with tarfile.open(archive_path, "r:gz") as tar:
+        assert len(tar.getmembers()) == 4  # basedir + 3 images
+        assert tar.getmembers()[0].name == stem
@@ -4,15 +4,17 @@
 from typer.testing import CliRunner
 
 from datetime import datetime
+from typing import List
 from vlmrun.client.types import (
     ModelInfoResponse,
-    DatasetResponse,
+    DatasetCreateResponse,
     HubInfoResponse,
     HubDomainsResponse,
     HubSchemaQueryResponse,
     FileResponse,
     PredictionResponse,
     FeedbackSubmitResponse,
+    CreditUsage,
 )
 
 
@@ -38,7 +40,7 @@ def generate(self, *args, **kwargs):
                     created_at="2024-01-01T00:00:00Z",
                     completed_at="2024-01-01T00:00:01Z",
                     response={"result": "test"},
-                    usage={"total_tokens": 100}
+                    usage={"total_tokens": 100},
                 )
 
         def __init__(self, api_key=None, base_url=None):
@@ -56,40 +58,6 @@ def __init__(self, api_key=None, base_url=None):
             self.audio = self.AudioPredictions(self)
             self.feedback = self.Feedback(self)
 
-        class Dataset:
-            def __init__(self, client):
-                self._client = client
-
-            def create(
-                self,
-                file_id: str,
-                domain: str,
-                dataset_name: str,
-                dataset_type: str = "images",
-            ) -> DatasetResponse:
-                if dataset_type not in ["images", "videos", "documents"]:
-                    raise ValueError(
-                        "dataset_type must be one of: images, videos, documents"
-                    )
-                return DatasetResponse(
-                    dataset_id="dataset1",
-                    dataset_uri="gs://vlmrun-test-bucket/dataset1.tar.gz",
-                    dataset_type=dataset_type,
-                    domain=domain,
-                    message="Dataset created successfully",
-                    created_at=datetime.fromisoformat("2024-01-01T00:00:00+00:00"),
-                )
-
-            def get(self, dataset_id: str) -> DatasetResponse:
-                return DatasetResponse(
-                    dataset_id="dataset1",
-                    dataset_uri="gs://vlmrun-test-bucket/dataset1.tar.gz",
-                    dataset_type="images",
-                    domain="test-domain",
-                    message="Dataset created successfully",
-                    created_at=datetime.fromisoformat("2024-01-01T00:00:00+00:00"),
-                )
-
         class FineTuning:
             def __init__(self, client):
                 self._client = client
@@ -124,18 +92,20 @@ def create(self, model, prompt, **kwargs):
                     created_at="2024-01-01T00:00:00Z",
                     completed_at=None,
                     response=None,
-                    usage={"total_tokens": 0}
+                    usage={"total_tokens": 0},
                 )
 
             def list(self):
-                return [PredictionResponse(
-                    id="prediction1",
-                    status="running",
-                    created_at="2024-01-01T00:00:00Z",
-                    completed_at=None,
-                    response=None,
-                    usage={"total_tokens": 0}
-                )]
+                return [
+                    PredictionResponse(
+                        id="prediction1",
+                        status="running",
+                        created_at="2024-01-01T00:00:00Z",
+                        completed_at=None,
+                        response=None,
+                        usage={"total_tokens": 0},
+                    )
+                ]
 
             def get(self, prediction_id):
                 return PredictionResponse(
@@ -144,17 +114,17 @@ def get(self, prediction_id):
                     created_at="2024-01-01T00:00:00Z",
                     completed_at=None,
                     response=None,
-                    usage={"total_tokens": 0}
+                    usage={"total_tokens": 0},
                 )
-                
+
             def wait(self, prediction_id, timeout=60, sleep=1):
                 return PredictionResponse(
                     id=prediction_id,
                     status="completed",
                     created_at="2024-01-01T00:00:00Z",
                     completed_at="2024-01-01T00:00:01Z",
                     response={"result": "test"},
-                    usage={"total_tokens": 100}
+                    usage={"total_tokens": 100},
                 )
 
         class Files:
@@ -166,28 +136,28 @@ def list(self):
                     FileResponse(
                         id="file1",
                         filename="test.txt",
-                        bytes=b"test content",
+                        bytes=10,
                         purpose="assistants",
-                        created_at="2024-01-01T00:00:00Z"
+                        created_at="2024-01-01T00:00:00Z",
                     )
                 ]
 
             def upload(self, file_path, purpose="fine-tune"):
                 return FileResponse(
                     id="file1",
                     filename=str(file_path),
-                    bytes=b"test content",
+                    bytes=10,
                     purpose=purpose,
-                    created_at="2024-01-01T00:00:00Z"
+                    created_at="2024-01-01T00:00:00Z",
                 )
 
             def get(self, file_id):
                 return FileResponse(
                     id=file_id,
                     filename="test.txt",
-                    bytes=b"test content",
+                    bytes=10,
                     purpose="assistants",
-                    created_at="2024-01-01T00:00:00Z"
+                    created_at="2024-01-01T00:00:00Z",
                 )
 
             def get_content(self, file_id):
@@ -197,9 +167,9 @@ def delete(self, file_id):
                 return FileResponse(
                     id=file_id,
                     filename="test.txt",
-                    bytes=b"test content",
+                    bytes=10,
                     purpose="assistants",
-                    created_at="2024-01-01T00:00:00Z"
+                    created_at="2024-01-01T00:00:00Z",
                 )
 
         class Models:
@@ -250,7 +220,7 @@ def generate(self, *args, **kwargs):
                     created_at="2024-01-01T00:00:00Z",
                     completed_at="2024-01-01T00:00:01Z",
                     response={"result": "test"},
-                    usage={"total_tokens": 100}
+                    usage={"total_tokens": 100},
                 )
 
         class VideoPredictions:
@@ -264,7 +234,7 @@ def generate(self, *args, **kwargs):
                     created_at="2024-01-01T00:00:00Z",
                     completed_at="2024-01-01T00:00:01Z",
                     response={"result": "test"},
-                    usage={"total_tokens": 100}
+                    usage={"total_tokens": 100},
                 )
 
         class DocumentPredictions:
@@ -278,9 +248,76 @@ def generate(self, *args, **kwargs):
                     created_at="2024-01-01T00:00:00Z",
                     completed_at="2024-01-01T00:00:01Z",
                     response={"result": "test"},
-                    usage={"total_tokens": 100}
+                    usage={"total_tokens": 100},
                 )
 
+        class Dataset:
+            def __init__(self, client):
+                self._client = client
+
+            def create(
+                self,
+                file_id: str,
+                domain: str,
+                dataset_name: str,
+                dataset_type: str = "images",
+            ) -> DatasetCreateResponse:
+                if dataset_type not in ["images", "videos", "documents"]:
+                    raise ValueError(
+                        "dataset_type must be one of: images, videos, documents"
+                    )
+                return DatasetCreateResponse(
+                    dataset_id="dataset1",
+                    dataset_uri="gs://vlmrun-test-bucket/dataset1.tar.gz",
+                    dataset_type=dataset_type,
+                    dataset_name=dataset_name,
+                    domain=domain,
+                    message="Dataset created successfully",
+                    created_at=datetime.fromisoformat("2024-01-01T00:00:00+00:00"),
+                    status="pending",
+                    usage=CreditUsage(
+                        credits_used=10,
+                        elements_processed=10,
+                        element_type="image",
+                    ),
+                )
+
+            def get(self, dataset_id: str) -> DatasetCreateResponse:
+                return DatasetCreateResponse(
+                    dataset_id="dataset1",
+                    dataset_uri="gs://vlmrun-test-bucket/dataset1.tar.gz",
+                    dataset_type="images",
+                    dataset_name="test-dataset",
+                    domain="test-domain",
+                    message="Dataset created successfully",
+                    created_at=datetime.fromisoformat("2024-01-01T00:00:00+00:00"),
+                    status="completed",
+                    usage=CreditUsage(
+                        credits_used=10,
+                        elements_processed=10,
+                        element_type="image",
+                    ),
+                )
+
+            def list(self) -> List[DatasetCreateResponse]:
+                return [
+                    DatasetCreateResponse(
+                        dataset_id="dataset1",
+                        dataset_uri="gs://vlmrun-test-bucket/dataset1.tar.gz",
+                        dataset_type="images",
+                        domain="test-domain",
+                        dataset_name="test-dataset",
+                        message="Dataset created successfully",
+                        created_at=datetime.fromisoformat("2024-01-01T00:00:00+00:00"),
+                        status="completed",
+                        usage=CreditUsage(
+                            credits_used=10,
+                            elements_processed=10,
+                            element_type="image",
+                        ),
+                    )
+                ]
+
         class Feedback:
             def __init__(self, client):
                 self._client = client
@@ -290,15 +327,15 @@ def submit(self, id, label=None, notes=None, flag=None):
                     id="feedback1",
                     created_at="2024-01-01T00:00:00Z",
                     request_id=id,
-                    response=label
+                    response=label,
                 )
 
             def get(self, id):
                 return FeedbackSubmitResponse(
                     id="feedback1",
                     created_at="2024-01-01T00:00:00Z",
                     request_id=id,
-                    response=None
+                    response=None,
                 )
 
     monkeypatch.setattr("vlmrun.cli.cli.Client", MockClient)
 
@@ -2,7 +2,7 @@
 
 import pytest
 from datetime import datetime
-from vlmrun.client.types import DatasetResponse
+from vlmrun.client.types import DatasetCreateResponse
 
 
 def test_dataset_create(mock_client):
@@ -13,7 +13,7 @@ def test_dataset_create(mock_client):
         dataset_name="test-dataset",
         dataset_type="images",
     )
-    assert isinstance(response, DatasetResponse)
+    assert isinstance(response, DatasetCreateResponse)
     assert response.dataset_id == "dataset1"
     assert response.domain == "test-domain"
     assert response.dataset_type == "images"
@@ -23,7 +23,7 @@ def test_dataset_create(mock_client):
 def test_dataset_get(mock_client):
     """Test dataset retrieval."""
     response = mock_client.dataset.get("dataset1")
-    assert isinstance(response, DatasetResponse)
+    assert isinstance(response, DatasetCreateResponse)
     assert response.dataset_id == "dataset1"
     assert response.domain == "test-domain"
     assert response.dataset_type == "images"
 
@@ -6,6 +6,7 @@
 
 class TestLabel(BaseModel):
     """Test label model."""
+
     score: int
     comment: str
 
@@ -14,10 +15,7 @@ def test_submit_feedback(mock_client):
     """Test submitting feedback for a prediction."""
     label = TestLabel(score=5, comment="Great prediction!")
     response = mock_client.feedback.submit(
-        id="prediction1",
-        label=label,
-        notes="Test feedback",
-        flag=False
+        id="prediction1", label=label, notes="Test feedback", flag=False
     )
     assert isinstance(response, FeedbackSubmitResponse)
     assert response.id == "feedback1"
 
@@ -1,6 +1,5 @@
 """Tests for files operations."""
 
-from pathlib import Path
 from vlmrun.client.types import FileResponse
 
 
@@ -19,7 +18,7 @@ def test_upload_file(mock_client, tmp_path):
     # Create a temporary file
     test_file = tmp_path / "test.txt"
     test_file.write_text("test content")
-    
+
     response = mock_client.files.upload(test_file)
     assert isinstance(response, FileResponse)
     assert response.id == "file1"
@@ -32,14 +31,7 @@ def test_get_file(mock_client):
     assert isinstance(response, FileResponse)
     assert response.id == "file1"
     assert response.filename == "test.txt"
-    assert len(response.bytes) == len(b"test content")
-
-
-def test_get_content(mock_client):
-    """Test getting file content."""
-    response = mock_client.files.get_content("file1")
-    assert isinstance(response, bytes)
-    assert response == b"test content"
+    assert response.bytes == 10
 
 
 def test_delete_file(mock_client):