Setting max size to local cache implementation

Signed-off-by: Sachin Varghese <[email protected]>
SeldonIO · Oct 15, 2023 · 4c552de · 4c552de
1 parent bce5d36
commit 4c552de
Showing 6 changed files with 15 additions and 7 deletions.
diff --git a/mlserver/cache/__init__.py b/mlserver/cache/__init__.py
@@ -0,0 +1,2 @@
+from .cache import ResponseCache
+from .local import LocalCache
diff --git a/mlserver/cache/local/__init__.py b/mlserver/cache/local/__init__.py
@@ -0,0 +1 @@
+from .local import LocalCache
diff --git a/mlserver/cache/local/local.py b/mlserver/cache/local/local.py
@@ -1,12 +1,15 @@
+from collections import OrderedDict
 from ..cache import ResponseCache
 
-
 class LocalCache(ResponseCache):
-    def __init__(self):
-        self.cache = {}
+    def __init__(self,size=100):
+        self.cache = OrderedDict()
+        self.size_limit = size
 
     async def insert(self, key: str, value: str):
         self.cache[key] = value
+        if len(self.cache) > self.size_limit:
+            self.cache.popitem(last=False)
         return None
 
     async def lookup(self, key: str) -> str:

diff --git a/mlserver/handlers/dataplane.py b/mlserver/handlers/dataplane.py
@@ -18,7 +18,7 @@
 from ..middleware import InferenceMiddlewares
 from ..cloudevents import CloudEventsMiddleware
 from ..utils import generate_uuid
-from ..cache.cache import ResponseCache
+from ..cache import ResponseCache
 
 
 class DataPlane:

diff --git a/mlserver/server.py b/mlserver/server.py
@@ -18,8 +18,7 @@
 from .metrics import MetricsServer
 from .kafka import KafkaServer
 from .utils import logger
-from .cache.cache import ResponseCache
-from .cache.local.local import LocalCache
+from .cache import ResponseCache, LocalCache
 
 HANDLED_SIGNALS = [signal.SIGINT, signal.SIGTERM, signal.SIGQUIT]
 
@@ -63,7 +62,7 @@ def __init__(self, settings: Settings):
 
     def _create_response_cache(self) -> ResponseCache:
         if self._settings.cache_enabled:
-            return LocalCache()
+            return LocalCache(size=self._settings.cache_size)
         else:
             return None
 

diff --git a/mlserver/settings.py b/mlserver/settings.py
@@ -244,6 +244,9 @@ class Config:
     cache_enabled: Optional[bool] = False
     """Enable Caching for the model predictions."""
 
+    cache_size: Optional[int] = 100
+    """Cache size to be used if caching is enabled."""
+
 
 class ModelParameters(BaseSettings):
     """
Original file line number	Diff line number	Diff line change
		@@ -0,0 +1,2 @@
		from .cache import ResponseCache
		from .local import LocalCache