pytorch
diff --git a/‎backends/qualcomm/_passes/__init__.py
Lines changed: 6 additions & 8 deletions b/‎backends/qualcomm/_passes/__init__.py
Lines changed: 6 additions & 8 deletions
diff --git a/‎backends/qualcomm/_passes/build_quant_io.py
Lines changed: 1 addition & 9 deletions b/‎backends/qualcomm/_passes/build_quant_io.py
Lines changed: 1 addition & 9 deletions
diff --git a/‎backends/qualcomm/_passes/constant_i64_to_i32.py
Lines changed: 0 additions & 81 deletions b/‎backends/qualcomm/_passes/constant_i64_to_i32.py
Lines changed: 0 additions & 81 deletions
diff --git a/‎backends/qualcomm/_passes/convert_to_linear.py
Lines changed: 0 additions & 231 deletions b/‎backends/qualcomm/_passes/convert_to_linear.py
Lines changed: 0 additions & 231 deletions
@@ -1,43 +1,41 @@
 from .annotate_decomposed import AnnotateDecomposed
 from .annotate_quant_attrs import AnnotateQuantAttrs
-from .constant_i64_to_i32 import ConstantI64toI32
 from .convert_bmm_to_matmul import ConvertBmmToMatmul
-from .convert_to_linear import ConvertToLinear
 from .decompose_any import DecomposeAny
 from .decompose_einsum import DecomposeEinsum
 from .decompose_linalg_vector_norm import DecomposeLinalgVectorNorm
 from .decompose_silu import DecomposeSilu
 from .expand_broadcast_tensor_shape import ExpandBroadcastTensorShape
+from .fixed_linear_keep_dim import FixedLinearKeepDim
 from .fold_qdq import FoldQDQ
 from .fuse_consecutive_transpose import FuseConsecutiveTranspose
+from .i64_to_i32 import I64toI32
 from .insert_io_qdq import InsertIOQDQ
 from .insert_requantize import InsertRequantize
 from .layout_transform import LayoutTransform
 from .lift_constant_scalar_operands import LiftConstantScalarOperands
 from .recompose_pixel_unshuffle import RecomposePixelUnshuffle
-from .recompose_prelu import RecomposePReLU
 from .recompose_rms_norm import RecomposeRmsNorm
 from .reduce_dynamic_range import ReduceDynamicRange
 from .remove_redundancy import RemoveRedundancy
 from .replace_index_put_input import ReplaceIndexPutInput
 from .replace_inf_buffer import ReplaceInfBuffer
-from .tensor_i64_to_i32 import TensorI64toI32
+from .tag_quant_io import TagQuantIO
 
 
 __all__ = [
     AnnotateDecomposed,
     AnnotateQuantAttrs,
-    ConstantI64toI32,
     ConvertBmmToMatmul,
-    RecomposePReLU,
-    ConvertToLinear,
     DecomposeAny,
     DecomposeEinsum,
     DecomposeLinalgVectorNorm,
     DecomposeSilu,
     ExpandBroadcastTensorShape,
+    FixedLinearKeepDim,
     FoldQDQ,
     FuseConsecutiveTranspose,
+    I64toI32,
     InsertIOQDQ,
     InsertRequantize,
     LayoutTransform,
@@ -48,5 +46,5 @@
     RemoveRedundancy,
     ReplaceIndexPutInput,
     ReplaceInfBuffer,
-    TensorI64toI32,
+    TagQuantIO,
 ]
@@ -27,25 +27,17 @@ def _make_spec(self, x):
             return None
 
     def _build(self, graph_module: torch.fx.GraphModule) -> torch.fx.GraphModule:
-        # forcely update delegate node's meta['spec'] to get correct output
+        # Forcedly update delegate node's meta['spec'] to get correct output
         # tensor size in runtime
         call_delegate = [
             node
             for node in graph_module.graph.nodes
             if node.op == "call_function" and node.name == "executorch_call_delegate"
         ]
         assert len(call_delegate) == 1
-        spec = []
         for n in graph_module.graph.nodes:
             if QCOM_QUANTIZED_IO in n.meta:
                 n.meta["val"] = n.meta["val"].to(dtype=n.meta[QCOM_QUANTIZED_IO])
-            if n.op == "call_function" and "getitem" in n.name:
-                fake_tensor = n.meta["val"]
-                if QCOM_QUANTIZED_IO in n.meta:
-                    fake_tensor = fake_tensor.to(dtype=n.meta[QCOM_QUANTIZED_IO])
-                spec.append(self._make_spec(fake_tensor))
-
-        call_delegate[0].meta["spec"] = tuple(spec)
 
     def call(self, graph_module: torch.fx.GraphModule):
         self._build(graph_module)