Address comment

NVIDIA · chang-l · Jul 30, 2025 · Jul 18, 2025 · Jul 18, 2025 · Jul 21, 2025
commit cd7393a1b4fdcfe96f37b08a0c69a05cb79a27df
@@ -819,7 +819,7 @@ def __init__(self,
         }).cuda()
         load_sharded_checkpoint(self.encoder, model_path, strict=False)
 
-    def attch_multimodal_embeddings(
+    def attach_multimodal_embeddings(
         self, inputs: TextPrompt, multimodal_embedding: Dict[str,
                                                              List[Dict[str,
                                                                        Any]]],

@@ -195,7 +195,7 @@ def _postprocess(self, input_ids, mm_features):
         mm_features = mm_features.view(-1, mm_features.shape[-1])
         return fused_input_ids, mm_features
 
-    def attch_multimodal_embeddings(
+    def attach_multimodal_embeddings(
         self, inputs: TextPrompt,
         multimodal_embedding: Dict[str, List[torch.Tensor]],
         sampling_params: SamplingParams

@@ -379,7 +379,7 @@ def generate_async(
                         inputs, sampling_params)
             elif 'multi_modal_embeddings' in inputs:
                 mm_embedding_info = inputs['multi_modal_embeddings']
-                prompt_token_ids, extra_processed_inputs = self.input_processor.attch_multimodal_embeddings(
+                prompt_token_ids, extra_processed_inputs = self.input_processor.attach_multimodal_embeddings(
                     inputs, mm_embedding_info, sampling_params)
             else:
                 with nvtx_range_debug("input_processor"):