hardikkgupta
diff --git a/‎aten/src/ATen/native/ts_native_functions.yaml‎
Lines changed: 2 additions & 2 deletions b/‎aten/src/ATen/native/ts_native_functions.yaml‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎build_variables.bzl‎
Lines changed: 0 additions & 1 deletion b/‎build_variables.bzl‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎test/lazy/test_reuse_ir.py‎
Lines changed: 1 addition & 1 deletion b/‎test/lazy/test_reuse_ir.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎torch/csrc/lazy/core/ir.cpp‎
Lines changed: 2 additions & 0 deletions b/‎torch/csrc/lazy/core/ir.cpp‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎torch/csrc/lazy/core/shape_inference.cpp‎
Lines changed: 71 additions & 0 deletions b/‎torch/csrc/lazy/core/shape_inference.cpp‎
Lines changed: 71 additions & 0 deletions
diff --git a/‎torch/csrc/lazy/core/shape_inference.h‎
Lines changed: 2 additions & 0 deletions b/‎torch/csrc/lazy/core/shape_inference.h‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎torch/csrc/lazy/ts_backend/ops/batch_norm_ops.cpp‎
Lines changed: 0 additions & 97 deletions b/‎torch/csrc/lazy/ts_backend/ops/batch_norm_ops.cpp‎
Lines changed: 0 additions & 97 deletions
diff --git a/‎torch/csrc/lazy/ts_backend/ops/batch_norm_ops.h‎
Lines changed: 0 additions & 156 deletions b/‎torch/csrc/lazy/ts_backend/ops/batch_norm_ops.h‎
Lines changed: 0 additions & 156 deletions
@@ -85,6 +85,8 @@ full_codegen:
   - mm
   - mul.Tensor
   - mv
+  - native_batch_norm
+  - native_batch_norm_backward
   - native_dropout
   - native_dropout_backward
   - native_layer_norm
@@ -153,8 +155,6 @@ supported:
   - expand
   - fill_.Scalar
   - narrow
-  - native_batch_norm
-  - native_batch_norm_backward
   - normal_
   - max_pool3d_with_indices
   - max_pool3d_with_indices_backward
 
@@ -420,7 +420,6 @@ lazy_tensor_core_sources = [
 lazy_tensor_ts_sources = [
     "torch/csrc/lazy/ts_backend/dynamic_ir.cpp",
     "torch/csrc/lazy/ts_backend/config.cpp",
-    "torch/csrc/lazy/ts_backend/ops/batch_norm_ops.cpp",
     "torch/csrc/lazy/ts_backend/ops/device_data.cpp",
     "torch/csrc/lazy/ts_backend/ops/random_ops.cpp",
     "torch/csrc/lazy/ts_backend/ops/generic.cpp",
 
@@ -121,7 +121,7 @@ def testBatchNorm(self):
             torch._lazy.mark_step()
 
         torch.testing.assert_close(z.cpu(), z_lazy.cpu())
-        assert metrics.counter_value("IrNodeReused_torch::lazy::TSNativeBatchNormForward") >= 7
+        assert metrics.counter_value("IrNodeReused_torch::lazy::NativeBatchNorm") >= 7
         metrics.reset()
         torch._lazy.ir_cache.reset()
 
 
@@ -140,9 +140,11 @@ Shape Node::computeShape(const std::function<Shape()>& shape_fn) {
 const std::vector<Output>& Node::operands() const {
   return operands_as_outputs_;
 }
+
 const Output& Node::operand(size_t i) const {
   return operands_as_outputs_.at(i);
 }
+
 const Output& Node::nullable_operand(size_t i) const {
   // We use kNullOutput instead of kNullValue here to avoid implicit casting,
   // which would prevent this method from returning a reference.
 
@@ -470,6 +470,77 @@ std::vector<Shape> compute_shape_cat(at::TensorList tensors, int64_t dim) {
   return {Shape(tensors[0].scalar_type(), out_shape)};
 }
 
+std::vector<torch::lazy::Shape> compute_shape_native_batch_norm(
+    const at::Tensor& input,
+    const c10::optional<at::Tensor>& weight,
+    const c10::optional<at::Tensor>& bias,
+    const c10::optional<at::Tensor>& running_mean,
+    const c10::optional<at::Tensor>& running_var,
+    bool training,
+    double momentum,
+    double eps) {
+  std::vector<torch::lazy::Shape> shapes;
+  shapes.reserve(3);
+  shapes.emplace_back(input.scalar_type(), input.sizes().vec());
+
+  // A separate mean and var needs to be kept for each channel.
+  TORCH_CHECK(
+      input.sizes().size() >= 2,
+      "Input tensor must have at least batch and channel dimensions!");
+  int64_t num_features = input.size(1);
+
+  if (running_mean.has_value()) {
+    shapes.emplace_back(
+        running_mean.value().scalar_type(), running_mean.value().sizes().vec());
+  } else {
+    shapes.emplace_back(
+        at::get_default_dtype_as_scalartype(),
+        std::vector<int64_t>{num_features});
+  }
+
+  if (running_var.has_value()) {
+    shapes.emplace_back(
+        running_var.value().scalar_type(), running_var.value().sizes().vec());
+  } else {
+    shapes.emplace_back(
+        at::get_default_dtype_as_scalartype(),
+        std::vector<int64_t>{num_features});
+  }
+  return shapes;
+}
+
+std::vector<torch::lazy::Shape> compute_shape_native_batch_norm_backward(
+    const at::Tensor& grad_out,
+    const at::Tensor& input,
+    const c10::optional<at::Tensor>& weight,
+    const c10::optional<at::Tensor>& running_mean,
+    const c10::optional<at::Tensor>& running_var,
+    const c10::optional<at::Tensor>& save_mean,
+    const c10::optional<at::Tensor>& save_invstd,
+    bool train,
+    double eps,
+    ::std::array<bool, 3> output_mask) {
+  std::vector<torch::lazy::Shape> shapes;
+  shapes.reserve(3);
+  shapes.emplace_back(input.scalar_type(), input.sizes().vec());
+
+  // A separate mean and var needs to be kept for each channel.
+  TORCH_CHECK(
+      input.sizes().size() >= 2,
+      "Input tensor must have at least batch and channel dimensions!");
+  int64_t num_features = input.size(1);
+
+  // `weight` and `bias` are vectors of length C (number of channels)`
+  shapes.emplace_back(
+      at::get_default_dtype_as_scalartype(),
+      std::vector<int64_t>{num_features});
+  shapes.emplace_back(
+      at::get_default_dtype_as_scalartype(),
+      std::vector<int64_t>{num_features});
+
+  return shapes;
+}
+
 std::vector<Shape> compute_shape_native_layer_norm(
     const at::Tensor& input,
     at::IntArrayRef normalized_shape,
 
@@ -50,6 +50,8 @@ TORCH_API std::vector<torch::lazy::Shape> compute_shape_max(const at::Tensor & s
 TORCH_API std::vector<torch::lazy::Shape> compute_shape_mean(const at::Tensor & self, c10::optional<at::ScalarType> dtype);
 TORCH_API std::vector<torch::lazy::Shape> compute_shape_min(const at::Tensor & self);
 TORCH_API std::vector<torch::lazy::Shape> compute_shape_mv(const at::Tensor & self, const at::Tensor & vec);
+TORCH_API std::vector<torch::lazy::Shape> compute_shape_native_batch_norm(const at::Tensor & input, const c10::optional<at::Tensor> & weight, const c10::optional<at::Tensor> & bias, const c10::optional<at::Tensor> & running_mean, const c10::optional<at::Tensor> & running_var, bool training, double momentum, double eps);
+TORCH_API std::vector<torch::lazy::Shape> compute_shape_native_batch_norm_backward(const at::Tensor & grad_out, const at::Tensor & input, const c10::optional<at::Tensor> & weight, const c10::optional<at::Tensor> & running_mean, const c10::optional<at::Tensor> & running_var, const c10::optional<at::Tensor> & save_mean, const c10::optional<at::Tensor> & save_invstd, bool train, double eps, ::std::array<bool,3> output_mask);
 TORCH_API std::vector<torch::lazy::Shape> compute_shape_native_dropout(const at::Tensor & input, double p, c10::optional<bool> train);
 TORCH_API std::vector<torch::lazy::Shape> compute_shape_native_dropout_backward(const at::Tensor & grad_output, const at::Tensor & mask, double scale);
 TORCH_API std::vector<torch::lazy::Shape> compute_shape_native_layer_norm(const at::Tensor & input, at::IntArrayRef normalized_shape, const c10::optional<at::Tensor> & weight, const c10::optional<at::Tensor> & bias, double eps);
Original file line number	Diff line number	Diff line change
`@@ -140,9 +140,11 @@ Shape Node::computeShape(const std::function<Shape()>& shape_fn) {`
`140`	`140`	`const std::vector<Output>& Node::operands() const {`
`141`	`141`	`return operands_as_outputs_;`
`142`	`142`	`}`
	`143`	`+`
`143`	`144`	`const Output& Node::operand(size_t i) const {`
`144`	`145`	`return operands_as_outputs_.at(i);`
`145`	`146`	`}`
	`147`	`+`
`146`	`148`	`const Output& Node::nullable_operand(size_t i) const {`
`147`	`149`	`// We use kNullOutput instead of kNullValue here to avoid implicit casting,`
`148`	`150`	`// which would prevent this method from returning a reference.`