tensorflow
diff --git a/‎tensorflow_transform/beam/bucketize_integration_test.py
Lines changed: 127 additions & 133 deletions b/‎tensorflow_transform/beam/bucketize_integration_test.py
Lines changed: 127 additions & 133 deletions
diff --git a/‎tensorflow_transform/beam/impl.py
Lines changed: 1 addition & 9 deletions b/‎tensorflow_transform/beam/impl.py
Lines changed: 1 addition & 9 deletions
@@ -21,7 +21,6 @@
 import tensorflow as tf
 import tensorflow_transform as tft
 from tensorflow_transform import analyzers
-from tensorflow_transform import common_types
 from tensorflow_transform.beam import impl as beam_impl
 from tensorflow_transform.beam import tft_unit
 from tensorflow_metadata.proto.v0 import schema_pb2
@@ -129,7 +128,26 @@ def _compute_simple_per_key_bucket(val, key, weighted=False):
             'x_bucketized$sparse_values': [(x - 1) // 3],
             'x_bucketized$sparse_indices_0': [x % 4],
             'x_bucketized$sparse_indices_1': [x % 5]
-        } for x in range(1, 10)])
+        } for x in range(1, 10)]),
+    dict(
+        testcase_name='ragged',
+        input_data=[{
+            'val': [x, 10 - x],
+            'row_lengths': [0, x % 3, 2 - x % 3],
+        } for x in range(1, 10)],
+        input_metadata=tft.DatasetMetadata.from_feature_spec({
+            'x':
+                tf.io.RaggedFeature(
+                    tf.int64,
+                    value_key='val',
+                    partitions=[
+                        tf.io.RaggedFeature.RowLengths('row_lengths')  # pytype: disable=attribute-error
+                    ]),
+        }),
+        expected_data=[{
+            'x_bucketized$ragged_values': [(x - 1) // 3, (9 - x) // 3],
+            'x_bucketized$row_lengths_1': [0, x % 3, 2 - x % 3],
+        } for x in range(1, 10)]),
 ]
 
 _BUCKETIZE_PER_KEY_TEST_CASES = [
@@ -211,139 +229,115 @@ def _compute_simple_per_key_bucket(val, key, weighted=False):
                 'x_bucketized':
                     schema_pb2.IntDomain(min=0, max=2, is_categorical=True),
             })),
+    dict(
+        testcase_name='ragged',
+        input_data=[{
+            'val': [x, x],
+            'row_lengths': [x % 3, 2 - (x % 3)],
+            'key_val': ['a', 'a'] if x < 50 else ['b', 'b'],
+            'key_row_lengths': [x % 3, 2 - (x % 3)],
+        } for x in range(1, 100)],
+        input_metadata=tft.DatasetMetadata.from_feature_spec({
+            'x':
+                tf.io.RaggedFeature(
+                    tf.int64,
+                    value_key='val',
+                    partitions=[
+                        tf.io.RaggedFeature.RowLengths('row_lengths')  # pytype: disable=attribute-error
+                    ]),
+            'key':
+                tf.io.RaggedFeature(
+                    tf.string,
+                    value_key='key_val',
+                    partitions=[
+                        tf.io.RaggedFeature.RowLengths('key_row_lengths')  # pytype: disable=attribute-error
+                    ]),
+        }),
+        expected_data=[{
+            'x_bucketized$ragged_values': [
+                _compute_simple_per_key_bucket(x, 'a' if x < 50 else 'b'),
+            ] * 2,
+            'x_bucketized$row_lengths_1': [x % 3, 2 - (x % 3)],
+        } for x in range(1, 100)],
+        expected_metadata=tft.DatasetMetadata.from_feature_spec(
+            {
+                'x_bucketized':
+                    tf.io.RaggedFeature(
+                        tf.int64,
+                        value_key='x_bucketized$ragged_values',
+                        partitions=[
+                            tf.io.RaggedFeature.RowLengths(  # pytype: disable=attribute-error
+                                'x_bucketized$row_lengths_1')
+                        ]),
+            },
+            {
+                'x_bucketized':
+                    schema_pb2.IntDomain(min=0, max=2, is_categorical=True),
+            })),
+    dict(
+        testcase_name='ragged_weighted',
+        input_data=[{
+            'val': [x, x],
+            'row_lengths': [2 - (x % 3), x % 3],
+            'key_val': ['a', 'a'] if x < 50 else ['b', 'b'],
+            'key_row_lengths': [
+                2 - (x % 3),
+                x % 3,
+            ],
+            'weights_val':
+                ([0, 0] if x in _WEIGHTED_PER_KEY_0_RANGE else [1, 1]),
+            'weights_row_lengths': [
+                2 - (x % 3),
+                x % 3,
+            ],
+        } for x in range(1, 100)],
+        input_metadata=tft.DatasetMetadata.from_feature_spec({
+            'x':
+                tf.io.RaggedFeature(
+                    tf.int64,
+                    value_key='val',
+                    partitions=[
+                        tf.io.RaggedFeature.RowLengths('row_lengths')  # pytype: disable=attribute-error
+                    ]),
+            'key':
+                tf.io.RaggedFeature(
+                    tf.string,
+                    value_key='key_val',
+                    partitions=[
+                        tf.io.RaggedFeature.RowLengths('key_row_lengths')  # pytype: disable=attribute-error
+                    ]),
+            'weights':
+                tf.io.RaggedFeature(
+                    tf.int64,
+                    value_key='weights_val',
+                    partitions=[
+                        tf.io.RaggedFeature.RowLengths('weights_row_lengths')  # pytype: disable=attribute-error
+                    ]),
+        }),
+        expected_data=[{
+            'x_bucketized$ragged_values': [
+                _compute_simple_per_key_bucket(
+                    x, 'a' if x < 50 else 'b', weighted=True),
+            ] * 2,
+            'x_bucketized$row_lengths_1': [2 - (x % 3), x % 3],
+        } for x in range(1, 100)],
+        expected_metadata=tft.DatasetMetadata.from_feature_spec(
+            {
+                'x_bucketized':
+                    tf.io.RaggedFeature(
+                        tf.int64,
+                        value_key='x_bucketized$ragged_values',
+                        partitions=[
+                            tf.io.RaggedFeature.RowLengths(  # pytype: disable=attribute-error
+                                'x_bucketized$row_lengths_1')
+                        ]),
+            },
+            {
+                'x_bucketized':
+                    schema_pb2.IntDomain(min=0, max=2, is_categorical=True),
+            })),
 ]
 
-if common_types.is_ragged_feature_available():
-  _BUCKETIZE_COMPOSITE_INPUT_TEST_CASES.append(
-      dict(
-          testcase_name='ragged',
-          input_data=[{
-              'val': [x, 10 - x],
-              'row_lengths': [0, x % 3, 2 - x % 3],
-          } for x in range(1, 10)],
-          input_metadata=tft.DatasetMetadata.from_feature_spec({
-              'x':
-                  tf.io.RaggedFeature(
-                      tf.int64,
-                      value_key='val',
-                      partitions=[
-                          tf.io.RaggedFeature.RowLengths('row_lengths')  # pytype: disable=attribute-error
-                      ]),
-          }),
-          expected_data=[{
-              'x_bucketized$ragged_values': [(x - 1) // 3, (9 - x) // 3],
-              'x_bucketized$row_lengths_1': [0, x % 3, 2 - x % 3],
-          } for x in range(1, 10)]))
-  _BUCKETIZE_PER_KEY_TEST_CASES.extend([
-      dict(
-          testcase_name='ragged',
-          input_data=[{
-              'val': [x, x],
-              'row_lengths': [x % 3, 2 - (x % 3)],
-              'key_val': ['a', 'a'] if x < 50 else ['b', 'b'],
-              'key_row_lengths': [x % 3, 2 - (x % 3)],
-          } for x in range(1, 100)],
-          input_metadata=tft.DatasetMetadata.from_feature_spec({
-              'x':
-                  tf.io.RaggedFeature(
-                      tf.int64,
-                      value_key='val',
-                      partitions=[
-                          tf.io.RaggedFeature.RowLengths('row_lengths')  # pytype: disable=attribute-error
-                      ]),
-              'key':
-                  tf.io.RaggedFeature(
-                      tf.string,
-                      value_key='key_val',
-                      partitions=[
-                          tf.io.RaggedFeature.RowLengths('key_row_lengths')  # pytype: disable=attribute-error
-                      ]),
-          }),
-          expected_data=[{
-              'x_bucketized$ragged_values': [
-                  _compute_simple_per_key_bucket(x, 'a' if x < 50 else 'b'),
-              ] * 2,
-              'x_bucketized$row_lengths_1': [x % 3, 2 - (x % 3)],
-          } for x in range(1, 100)],
-          expected_metadata=tft.DatasetMetadata.from_feature_spec(
-              {
-                  'x_bucketized':
-                      tf.io.RaggedFeature(
-                          tf.int64,
-                          value_key='x_bucketized$ragged_values',
-                          partitions=[
-                              tf.io.RaggedFeature.RowLengths(  # pytype: disable=attribute-error
-                                  'x_bucketized$row_lengths_1')
-                          ]),
-              },
-              {
-                  'x_bucketized':
-                      schema_pb2.IntDomain(min=0, max=2, is_categorical=True),
-              })),
-      dict(
-          testcase_name='ragged_weighted',
-          input_data=[{
-              'val': [x, x],
-              'row_lengths': [2 - (x % 3), x % 3],
-              'key_val': ['a', 'a'] if x < 50 else ['b', 'b'],
-              'key_row_lengths': [
-                  2 - (x % 3),
-                  x % 3,
-              ],
-              'weights_val':
-                  ([0, 0] if x in _WEIGHTED_PER_KEY_0_RANGE else [1, 1]),
-              'weights_row_lengths': [
-                  2 - (x % 3),
-                  x % 3,
-              ],
-          } for x in range(1, 100)],
-          input_metadata=tft.DatasetMetadata.from_feature_spec({
-              'x':
-                  tf.io.RaggedFeature(
-                      tf.int64,
-                      value_key='val',
-                      partitions=[
-                          tf.io.RaggedFeature.RowLengths('row_lengths')  # pytype: disable=attribute-error
-                      ]),
-              'key':
-                  tf.io.RaggedFeature(
-                      tf.string,
-                      value_key='key_val',
-                      partitions=[
-                          tf.io.RaggedFeature.RowLengths('key_row_lengths')  # pytype: disable=attribute-error
-                      ]),
-              'weights':
-                  tf.io.RaggedFeature(
-                      tf.int64,
-                      value_key='weights_val',
-                      partitions=[
-                          tf.io.RaggedFeature.RowLengths('weights_row_lengths')  # pytype: disable=attribute-error
-                      ]),
-          }),
-          expected_data=[{
-              'x_bucketized$ragged_values': [
-                  _compute_simple_per_key_bucket(
-                      x, 'a' if x < 50 else 'b', weighted=True),
-              ] * 2,
-              'x_bucketized$row_lengths_1': [2 - (x % 3), x % 3],
-          } for x in range(1, 100)],
-          expected_metadata=tft.DatasetMetadata.from_feature_spec(
-              {
-                  'x_bucketized':
-                      tf.io.RaggedFeature(
-                          tf.int64,
-                          value_key='x_bucketized$ragged_values',
-                          partitions=[
-                              tf.io.RaggedFeature.RowLengths(  # pytype: disable=attribute-error
-                                  'x_bucketized$row_lengths_1')
-                          ]),
-              },
-              {
-                  'x_bucketized':
-                      schema_pb2.IntDomain(min=0, max=2, is_categorical=True),
-              })),
-  ])
-
 
 class BucketizeIntegrationTest(tft_unit.TransformTestCase):
 
 
@@ -91,7 +91,6 @@
 # once the Spark issue is resolved.
 from tfx_bsl.types import tfx_namedtuple
 
-from tensorflow.python.framework import ops  # pylint: disable=g-direct-tensorflow-import
 from tensorflow_metadata.proto.v0 import schema_pb2
 
 # TODO(b/123325923): Fix the key type here to agree with the actual keys.
@@ -541,17 +540,10 @@ def _get_tensor_replacement_map(graph, *tensor_bindings):
   """Get Tensor replacement map."""
   tensor_replacement_map = {}
 
-  is_graph_mode = not ops.executing_eagerly_outside_functions()
   for tensor_binding in tensor_bindings:
     assert isinstance(tensor_binding, _TensorBinding), tensor_binding
-    value = tensor_binding.value
-    # TODO(b/160294509): tf.constant doesn't accept List[np.ndarray] in TF 1.15
-    # graph mode. Remove this condition.
-    if (is_graph_mode and isinstance(value, list) and
-        any(isinstance(x, np.ndarray) for x in value)):
-      value = np.asarray(tensor_binding.value)
     replacement_tensor = tf.constant(
-        value, tf.dtypes.as_dtype(tensor_binding.dtype_enum))
+        tensor_binding.value, tf.dtypes.as_dtype(tensor_binding.dtype_enum))
     if graph is not None and tensor_binding.is_asset_filepath:
       graph.add_to_collection(tf.compat.v1.GraphKeys.ASSET_FILEPATHS,
                               replacement_tensor)