From 995508cbd26b4a030a62ffeac2e3ebf6d049660a Mon Sep 17 00:00:00 2001
From: Yejing-Lai <yejing.lai@intel.com>
Date: Wed, 6 Mar 2024 06:31:46 +0800
Subject: [PATCH] fix fused_qkv model accuracy issue (#5217)

Fused_qkv model can not correctly choose the fused_qkv type. Need to
update the module_name_matches.

Co-authored-by: Olatunji Ruwase <olruwase@microsoft.com>
---
 deepspeed/module_inject/fusedqkv_utils.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/deepspeed/module_inject/fusedqkv_utils.py b/deepspeed/module_inject/fusedqkv_utils.py
index ba238cba7508..cf087c16da8a 100644
--- a/deepspeed/module_inject/fusedqkv_utils.py
+++ b/deepspeed/module_inject/fusedqkv_utils.py
@@ -113,7 +113,7 @@ def _transpose_fused_qkvw(src, mp_size, fused_qkv_type=None, module=None):
 
         raise ValueError("unknown fused_qkv_type")
 
-    module_name_matches = [k for k in fused_type_dict.keys() if module_str in k]
+    module_name_matches = [k for k in fused_type_dict.keys() if k in module_str]
     if module_name_matches:
         # There can be overlap with matches (e.g., "DecoderLayer" and "FalconDecoderLayer").
         # We take the longest matching module_name