triton-inference-server · indrajit96 · May 7, 2024 · May 7, 2024 · May 8, 2024 · May 8, 2024
diff --git a/qa/L0_backend_python/model_control/model_control_test.py b/qa/L0_backend_python/model_control/model_control_test.py
@@ -82,6 +82,23 @@ def test_model_reload(self):
  self.assertFalse(client.is_model_ready(model_name))
  self.assertFalse(client.is_model_ready(ensemble_model_name))
 
+ def test_faulty_model_load(self):
+ working_model_name = "identity_fp32"
+ faulty_model_name = "auto_complete_error"
+ with httpclient.InferenceServerClient(f"{_tritonserver_ipaddr}:8000") as client:
+ # Load a correct model
+ client.load_model(working_model_name)
+ # Load a faulty model
+ with self.assertRaises(InferenceServerException) as cm:
+ _ = client.load_model(faulty_model_name)
+ self.assertIn("load failed for model", str(cm.exception))
+
+ # Check if server is responsive
+ self.assertTrue(client.is_model_ready(working_model_name))
+ # Verify faulty model is not loaded
+ self.assertFalse(client.is_model_ready(faulty_model_name))
+ client.unload_model(working_model_name)
+
 
 if __name__ == "__main__":
  unittest.main()
diff --git a/qa/L0_backend_python/model_control/test.sh b/qa/L0_backend_python/model_control/test.sh
@@ -37,6 +37,9 @@ source ../../common/util.sh
 
 mkdir -p models/identity_fp32/1/
 mkdir -p models/simple_identity_fp32/1/
+mkdir -p models/auto_complete_error/1/
+
+cp ../../python_models/auto_complete_error/model.py ./models/auto_complete_error/1/
 cp ../../python_models/identity_fp32/model.py ./models/identity_fp32/1/model.py
 cp ../../python_models/identity_fp32/config.pbtxt ./models/identity_fp32/config.pbtxt
 cp ../../python_models/simple_identity_fp32/config.pbtxt ./models/simple_identity_fp32/config.pbtxt