Align dl.conv2d with tf.conv2d (remove bias as param) (#723)

dsmilkov · web-flow · commit f133e4693b96 · 2018-02-14T18:47:18.000-05:00
diff --git a/demos/benchmarks/conv_benchmarks.ts b/demos/benchmarks/conv_benchmarks.ts
@@ -45,16 +45,14 @@ export class ConvGPUBenchmark implements BenchmarkTest {
 
     let x: dl.Tensor3D = dl.randomUniform(inShape, -1, 1);
     let W: dl.Tensor4D;
-    let b: dl.Tensor1D;
 
     let benchmark: () => dl.Tensor;
     if (opType === 'regular') {
       const regParams = params as RegularConvParams;
       const wShape = dl.conv_util.computeWeightsShape4D(
           inDepth, regParams.outDepth, filterSize, filterSize);
       W = dl.randomUniform(wShape, -1, 1);
-      b = dl.randomUniform([regParams.outDepth], -1, 1);
-      benchmark = () => x.conv2d(W, b, stride, pad);
+      benchmark = () => x.conv2d(W, stride, pad);
     } else if (opType === 'transposed') {
       const regParams = params as RegularConvParams;
       const wShape = dl.conv_util.computeWeightsShape4D(
@@ -80,9 +78,6 @@ export class ConvGPUBenchmark implements BenchmarkTest {
     x.dispose();
     W.dispose();
     math.dispose();
-    if (b != null) {
-      b.dispose();
-    }
 
     return time;
   }
diff --git a/demos/fast-style-transfer/net.ts b/demos/fast-style-transfer/net.ts
@@ -88,8 +88,8 @@ export class TransformNet implements dl.Model {
       input: dl.Tensor3D, strides: number, relu: boolean,
       varId: number): dl.Tensor3D {
     const y = input.conv2d(
-        this.variables[this.varName(varId)] as dl.Tensor4D, null,
-        [strides, strides], 'same');
+        this.variables[this.varName(varId)] as dl.Tensor4D, [strides, strides],
+        'same');
 
     const y2 = this.instanceNorm(y, varId + 1);
 
diff --git a/demos/performance_rnn/performance_rnn.ts b/demos/performance_rnn/performance_rnn.ts
@@ -445,7 +445,8 @@ async function generateStep(loopId: number) {
       const logits = outputH.matMul(fcW).add(fcB);
 
       const softmax = logits.as1D().softmax();
-      const sampledOutput = dl.multinomial(softmax, 1).asScalar();
+      // TODO(smilkov): Use dl.multinomial once exposed to the user.
+      const sampledOutput = dl.ENV.math.multinomial(softmax, 1).asScalar();
 
       outputs.push(sampledOutput);
       dl.keep(sampledOutput);
diff --git a/src/graph/ops/convolution.ts b/src/graph/ops/convolution.ts
@@ -16,8 +16,8 @@
  */
 
 import {keep, tidy} from '../../globals';
-import * as conv_util from '../../ops/conv_util';
 import {NDArrayMath} from '../../math';
+import * as conv_util from '../../ops/conv_util';
 import {Tensor1D, Tensor3D, Tensor4D} from '../../tensor';
 import * as util from '../../util';
 import {SymbolicTensor} from '../graph';
@@ -84,7 +84,7 @@ export class Convolution2D extends Operation {
     tidy(() => {
       const dw =
           math.conv2dDerFilter(x, dy, filter.shape, this.stride, this.zeroPad);
-      const db = math.conv2dDerBias(dy);
+      const db = math.sum(dy, [0, 1] /* axis */);
       const dx =
           math.conv2dDerInput(x.shape, dy, filter, this.stride, this.zeroPad);
       gradientArrays.add(this.wTensor, dw);
diff --git a/src/kernels/backend.ts b/src/kernels/backend.ts
@@ -150,13 +150,10 @@ export interface KernelBackend extends TensorStorage, BackendTimer {
 
   step<T extends Tensor>(x: T, alpha: number): T;
 
-  conv2d(
-      x: Tensor4D, filter: Tensor4D, bias: Tensor1D|null,
-      convInfo: Conv2DInfo): Tensor4D;
+  conv2d(x: Tensor4D, filter: Tensor4D, convInfo: Conv2DInfo): Tensor4D;
   conv2dDerInput(dy: Tensor4D, filter: Tensor4D, convInfo: Conv2DInfo):
       Tensor4D;
   conv2dDerFilter(x: Tensor4D, dY: Tensor4D, convInfo: Conv2DInfo): Tensor4D;
-  conv2dDerBias(dY: Tensor4D): Tensor1D;
 
   depthwiseConv2D(input: Tensor4D, filter: Tensor4D, convInfo: Conv2DInfo):
       Tensor4D;
diff --git a/src/kernels/backend_cpu.ts b/src/kernels/backend_cpu.ts
@@ -903,9 +903,7 @@ export class MathBackendCPU implements KernelBackend {
     return Tensor.make(x.shape, {values: resultValues}) as T;
   }
 
-  conv2d(
-      x: Tensor4D, filter: Tensor4D, bias: Tensor1D|null,
-      convInfo: Conv2DInfo): Tensor4D {
+  conv2d(x: Tensor4D, filter: Tensor4D, convInfo: Conv2DInfo): Tensor4D {
     const filterHeight = convInfo.filterHeight;
     const filterWidth = convInfo.filterWidth;
     const padLeft = convInfo.padInfo.left;
@@ -934,8 +932,7 @@ export class MathBackendCPU implements KernelBackend {
                 }
               }
             }
-            const biasVal = (bias != null) ? bias.get(d2) : 0;
-            y.set(dotProd + biasVal, b, yR, yC, d2);
+            y.set(dotProd, b, yR, yC, d2);
           }
         }
       }
@@ -1031,23 +1028,6 @@ export class MathBackendCPU implements KernelBackend {
     return dW.toTensor();
   }
 
-  conv2dDerBias(dy: Tensor4D): Tensor1D {
-    const [batchSize, numRows, numCols, outDepth] = dy.shape;
-    const values = new Float32Array(outDepth);
-    for (let d2 = 0; d2 < outDepth; ++d2) {
-      let sum = 0;
-      for (let b = 0; b < batchSize; ++b) {
-        for (let r = 0; r < numRows; ++r) {
-          for (let c = 0; c < numCols; ++c) {
-            sum += dy.get(b, r, c, d2);
-          }
-        }
-      }
-      values[d2] = sum;
-    }
-    return ops.tensor1d(values);
-  }
-
   depthwiseConv2D(x: Tensor4D, filter: Tensor4D, convInfo: Conv2DInfo):
       Tensor4D {
     const filterHeight = convInfo.filterHeight;
diff --git a/src/kernels/backend_webgl.ts b/src/kernels/backend_webgl.ts
@@ -37,7 +37,7 @@ import {BinaryOpProgram} from './webgl/binaryop_gpu';
 import {ClipProgram} from './webgl/clip_gpu';
 import {ConcatProgram} from './webgl/concat_gpu';
 // tslint:disable-next-line:max-line-length
-import {Conv2DDerBiasProgram, Conv2DDerFilterProgram, Conv2DDerInputProgram} from './webgl/conv_backprop_gpu';
+import {Conv2DDerFilterProgram, Conv2DDerInputProgram} from './webgl/conv_backprop_gpu';
 import {Conv2DProgram} from './webgl/conv_gpu';
 import {DepthwiseConv2DProgram} from './webgl/conv_gpu_depthwise';
 import {FromPixelsProgram} from './webgl/from_pixels_gpu';
@@ -776,12 +776,9 @@ export class MathBackendWebGL implements KernelBackend {
     return this.compileAndRun(program, [x]) as T;
   }
 
-  conv2d(
-      x: Tensor4D, filter: Tensor4D, bias: Tensor1D|null,
-      convInfo: Conv2DInfo): Tensor4D {
-    const program = new Conv2DProgram(convInfo, bias != null);
-    const inputs = bias != null ? [x, filter, bias] : [x, filter];
-    return this.compileAndRun(program, inputs);
+  conv2d(x: Tensor4D, filter: Tensor4D, convInfo: Conv2DInfo): Tensor4D {
+    const program = new Conv2DProgram(convInfo);
+    return this.compileAndRun(program, [x, filter]);
   }
 
   conv2dDerInput(dy: Tensor4D, filter: Tensor4D, convInfo: Conv2DInfo):
@@ -795,11 +792,6 @@ export class MathBackendWebGL implements KernelBackend {
     return this.compileAndRun(program, [x, dy]);
   }
 
-  conv2dDerBias(dy: Tensor4D): Tensor1D {
-    const program = new Conv2DDerBiasProgram(dy.shape);
-    return this.compileAndRun(program, [dy]);
-  }
-
   depthwiseConv2D(x: Tensor4D, filter: Tensor4D, convInfo: Conv2DInfo):
       Tensor4D {
     const program = new DepthwiseConv2DProgram(convInfo);
diff --git a/src/kernels/kernel_registry.ts b/src/kernels/kernel_registry.ts
@@ -28,7 +28,7 @@ import {CastNode} from './types/cast';
 // tslint:disable-next-line:max-line-length
 import {ConcatNode} from './types/concat';
 // tslint:disable-next-line:max-line-length
-import {Conv2DDerBiasNode, Conv2DDerFilterNode, Conv2DDerInputNode, Conv2DNode, DepthwiseConv2DNode} from './types/conv';
+import {Conv2DDerFilterNode, Conv2DDerInputNode, Conv2DNode, DepthwiseConv2DNode} from './types/conv';
 import {GatherNode} from './types/gather';
 import {EqualNode, LogicalNode, WhereNode} from './types/logical';
 import {LRN4DNode} from './types/lrn';
@@ -286,8 +286,8 @@ executeKernel<R extends Rank, K extends keyof KernelConfigRegistry<R>, O extends
   } else if (kernelName === 'Conv2D') {
     const config = inputAndArgs as Conv2DNode['inputAndArgs'];
     return backend.conv2d(
-               config.inputs.x, config.inputs.filter, config.inputs.bias,
-               config.args.convInfo) as O;
+               config.inputs.x, config.inputs.filter, config.args.convInfo) as
+        O;
   } else if (kernelName === 'Conv2DDerInput') {
     const config = inputAndArgs as Conv2DDerInputNode['inputAndArgs'];
     return backend.conv2dDerInput(
@@ -297,9 +297,6 @@ executeKernel<R extends Rank, K extends keyof KernelConfigRegistry<R>, O extends
     const config = inputAndArgs as Conv2DDerFilterNode['inputAndArgs'];
     return backend.conv2dDerFilter(
                config.inputs.x, config.inputs.dy, config.args.convInfo) as O;
-  } else if (kernelName === 'Conv2DDerBias') {
-    const config = inputAndArgs as Conv2DDerBiasNode['inputAndArgs'];
-    return backend.conv2dDerBias(config.inputs.dy) as O;
   } else if (kernelName === 'DepthwiseConv2D') {
     const config = inputAndArgs as DepthwiseConv2DNode['inputAndArgs'];
     return backend.depthwiseConv2D(
@@ -423,7 +420,6 @@ export interface KernelConfigRegistry<R extends Rank> {
   Conv2D: Conv2DNode;
   Conv2DDerInput: Conv2DDerInputNode;
   Conv2DDerFilter: Conv2DDerFilterNode;
-  Conv2DDerBias: Conv2DDerBiasNode;
   DepthwiseConv2D: Conv2DNode;
   MaxPool: PoolNode;
   MaxPoolBackprop: PoolBackpropNode;
diff --git a/src/kernels/types/conv.ts b/src/kernels/types/conv.ts
@@ -17,18 +17,16 @@
 
 import {Conv2DInfo} from '../../ops/conv_util';
 import {KernelNode} from '../../tape_types';
-import {Tensor1D, Tensor4D} from '../../tensor';
+import {Tensor4D} from '../../tensor';
 
 export interface Conv2DNode extends KernelNode {
   inputAndArgs: {
-    inputs: {x: Tensor4D; filter: Tensor4D; bias?: Tensor1D;};
-    args: {convInfo: Conv2DInfo;};
+    inputs: {x: Tensor4D; filter: Tensor4D;}; args: {convInfo: Conv2DInfo;};
   };
   output: Tensor4D;
   gradient: (dy: Tensor4D, y: Tensor4D) => {
     x: () => Tensor4D;
     filter: () => Tensor4D;
-    bias?: () => Tensor1D;
   };
 }
 
@@ -53,14 +51,6 @@ export interface Conv2DDerFilterNode extends KernelNode {
   };
 }
 
-export interface Conv2DDerBiasNode extends KernelNode {
-  inputAndArgs: {inputs: {dy: Tensor4D;};};
-  output: Tensor1D;
-  gradient: (dy: Tensor1D, y: Tensor1D) => {
-    dy: () => Tensor4D;
-  };
-}
-
 export interface DepthwiseConv2DNode extends KernelNode {
   inputAndArgs: {
     inputs: {x: Tensor4D; filter: Tensor4D;}; args: {convInfo: Conv2DInfo;};
diff --git a/src/kernels/webgl/conv_backprop_gpu.ts b/src/kernels/webgl/conv_backprop_gpu.ts
@@ -134,29 +134,3 @@ export class Conv2DDerInputProgram implements GPGPUProgram {
     `;
   }
 }
-
-export class Conv2DDerBiasProgram implements GPGPUProgram {
-  variableNames = ['dy'];
-  outputShape: number[];
-  userCode: string;
-
-  constructor(yShape: [number, number, number, number]) {
-    const [batchSize, yNumRows, yNumCols, outputDepth] = yShape;
-    this.outputShape = [outputDepth];
-    this.userCode = `
-      void main() {
-        int d2 = getOutputCoords();
-
-        float derBias = 0.0;
-        for (int b = 0; b < ${batchSize}; b++) {
-          for (int yR = 0; yR < ${yNumRows}; yR++) {
-            for (int yC = 0; yC < ${yNumCols}; yC++) {
-              derBias += getDy(b, yR, yC, d2);
-            }
-          }
-        }
-        setOutput(derBias);
-      }
-    `;
-  }
-}
diff --git a/src/kernels/webgl/conv_gpu.ts b/src/kernels/webgl/conv_gpu.ts
@@ -23,14 +23,8 @@ export class Conv2DProgram implements GPGPUProgram {
   outputShape: number[];
   userCode: string;
 
-  constructor(convInfo: Conv2DInfo, hasBias: boolean) {
-    if (hasBias) {
-      this.variableNames.push('bias');
-    }
-
+  constructor(convInfo: Conv2DInfo) {
     this.outputShape = convInfo.outShape;
-
-    const biasSnippet = hasBias ? 'dotProd += getBias(d2);' : '';
     const padTop = convInfo.padInfo.top;
     const padLeft = convInfo.padInfo.left;
     const strideHeight = convInfo.strideHeight;
@@ -117,7 +111,6 @@ export class Conv2DProgram implements GPGPUProgram {
             }
           }
         }
-        ${biasSnippet}
         setOutput(dotProd);
       }
     `;
diff --git a/src/math.ts b/src/math.ts
@@ -76,13 +76,9 @@ export class NDArrayMath {
   /** @deprecated */
   maxPoolBackprop = pool.Ops.maxPoolBackprop;
 
-  conv1d = conv.Ops.conv1d;
-  conv2d = conv.Ops.conv2d;
   conv2dTranspose = conv.Ops.conv2dTranspose;
   depthwiseConv2D = conv.Ops.depthwiseConv2d;
   /** @deprecated */
-  conv2dDerBias = conv.Ops.conv2dDerBias;
-  /** @deprecated */
   conv2dDerFilter = conv.Ops.conv2dDerFilter;
   /** @deprecated */
   conv2dDerInput = conv.Ops.conv2dDerInput;
@@ -347,6 +343,35 @@ export class NDArrayMath {
   concat4D(a: Tensor4D, b: Tensor4D, axis: number): Tensor4D {
     return ops.concat4d([a, b], axis);
   }
+
+  /** @deprecated */
+  conv1d<T extends Tensor2D|Tensor3D>(
+      input: T, filter: Tensor3D, bias: Tensor1D|null, stride: number,
+      pad: 'valid'|'same'|number, dimRoundingMode?: 'floor'|'round'|'ceil'): T {
+    if (bias != null) {
+      util.assert(
+          bias.rank === 1,
+          `Error in conv1d: bias must be rank 1, but got rank ` +
+              `${bias.rank}.`);
+    }
+    const res = ops.conv1d(input, filter, stride, pad, dimRoundingMode);
+    return res.add(bias) as T;
+  }
+
+  /** @deprecated */
+  conv2d<T extends Tensor3D|Tensor4D>(
+      x: T, filter: Tensor4D, bias: Tensor1D|null,
+      strides: [number, number]|number, pad: 'valid'|'same'|number,
+      dimRoundingMode?: 'floor'|'round'|'ceil'): T {
+    if (bias != null) {
+      util.assert(
+          bias.rank === 1,
+          `Error in conv2d: bias must be rank 1, but got rank ` +
+              `${bias.rank}.`);
+    }
+    const res = ops.conv2d(x, filter, strides, pad, dimRoundingMode);
+    return res.add(bias) as T;
+  }
 }
 
 export type ScopeFn<T extends ScopeResult> =
diff --git a/src/ops/array_ops.ts b/src/ops/array_ops.ts
@@ -454,7 +454,6 @@ export class Ops {
    * @return 1D array of shape `[numSamples]`, or 2D array of shape
    *     `[batchSize, numSamples]`, depending on the rank of the input.
    */
-  @doc({heading: 'Tensors', subheading: 'Creation'})
   @operation
   static multinomial(
       probabilities: Tensor1D|Tensor2D, numSamples: number, seed?: number):
diff --git a/src/ops/conv.ts b/src/ops/conv.ts
diff --git a/src/ops/conv1d_test.ts b/src/ops/conv1d_test.ts
diff --git a/src/ops/conv2d_test.ts b/src/ops/conv2d_test.ts
diff --git a/src/ops/multinomial_test.ts b/src/ops/multinomial_test.ts
diff --git a/src/ops/ops.ts b/src/ops/ops.ts
diff --git a/src/tensor.ts b/src/tensor.ts

Original file line number	Diff line number	Diff line change
`@@ -903,9 +903,7 @@ export class MathBackendCPU implements KernelBackend {`
`903`	`903`	`return Tensor.make(x.shape, {values: resultValues}) as T;`
`904`	`904`	`}`
`905`	`905`
`906`		`- conv2d(`
`907`		`- x: Tensor4D, filter: Tensor4D, bias: Tensor1D\|null,`
`908`		`- convInfo: Conv2DInfo): Tensor4D {`
	`906`	`+ conv2d(x: Tensor4D, filter: Tensor4D, convInfo: Conv2DInfo): Tensor4D {`
`909`	`907`	`const filterHeight = convInfo.filterHeight;`
`910`	`908`	`const filterWidth = convInfo.filterWidth;`
`911`	`909`	`const padLeft = convInfo.padInfo.left;`
`@@ -934,8 +932,7 @@ export class MathBackendCPU implements KernelBackend {`
`934`	`932`	`}`
`935`	`933`	`}`
`936`	`934`	`}`
`937`		`- const biasVal = (bias != null) ? bias.get(d2) : 0;`
`938`		`- y.set(dotProd + biasVal, b, yR, yC, d2);`
	`935`	`+ y.set(dotProd, b, yR, yC, d2);`
`939`	`936`	`}`
`940`	`937`	`}`
`941`	`938`	`}`
`@@ -1031,23 +1028,6 @@ export class MathBackendCPU implements KernelBackend {`
`1031`	`1028`	`return dW.toTensor();`
`1032`	`1029`	`}`
`1033`	`1030`
`1034`		`- conv2dDerBias(dy: Tensor4D): Tensor1D {`
`1035`		`- const [batchSize, numRows, numCols, outDepth] = dy.shape;`
`1036`		`- const values = new Float32Array(outDepth);`
`1037`		`- for (let d2 = 0; d2 < outDepth; ++d2) {`
`1038`		`- let sum = 0;`
`1039`		`- for (let b = 0; b < batchSize; ++b) {`
`1040`		`- for (let r = 0; r < numRows; ++r) {`
`1041`		`- for (let c = 0; c < numCols; ++c) {`
`1042`		`- sum += dy.get(b, r, c, d2);`
`1043`		`- }`
`1044`		`- }`
`1045`		`- }`
`1046`		`- values[d2] = sum;`
`1047`		`- }`
`1048`		`- return ops.tensor1d(values);`
`1049`		`- }`
`1050`		`-`
`1051`	`1031`	`depthwiseConv2D(x: Tensor4D, filter: Tensor4D, convInfo: Conv2DInfo):`
`1052`	`1032`	`Tensor4D {`
`1053`	`1033`	`const filterHeight = convInfo.filterHeight;`