diff --git a/docs/index.html b/docs/index.html
index 327a69f..175d5cf 100644
--- a/docs/index.html
+++ b/docs/index.html
@@ -3,8 +3,8 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.6.1"/>
-    <title>Module List &ndash; pdoc 14.6.1</title>
+    <meta name="generator" content="pdoc 14.7.0"/>
+    <title>Module List &ndash; pdoc 14.7.0</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
     <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
diff --git a/docs/sony_custom_layers/keras.html b/docs/sony_custom_layers/keras.html
index 20e53bd..4170c5f 100644
--- a/docs/sony_custom_layers/keras.html
+++ b/docs/sony_custom_layers/keras.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.6.1"/>
+    <meta name="generator" content="pdoc 14.7.0"/>
     <title>sony_custom_layers.keras API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
diff --git a/docs/sony_custom_layers/pytorch.html b/docs/sony_custom_layers/pytorch.html
index 7bcd0f3..c43389f 100644
--- a/docs/sony_custom_layers/pytorch.html
+++ b/docs/sony_custom_layers/pytorch.html
@@ -3,7 +3,7 @@
 <head>
     <meta charset="utf-8">
     <meta name="viewport" content="width=device-width, initial-scale=1">
-    <meta name="generator" content="pdoc 14.6.1"/>
+    <meta name="generator" content="pdoc 14.7.0"/>
     <title>sony_custom_layers.pytorch API documentation</title>
 
     <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
@@ -98,6 +98,18 @@ <h2>API Documentation</h2>
                         </li>
                 </ul>
 
+            </li>
+            <li>
+                    <a class="class" href="#FasterRCNNBoxDecode">FasterRCNNBoxDecode</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#FasterRCNNBoxDecode.__init__">FasterRCNNBoxDecode</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#FasterRCNNBoxDecode.forward">forward</a>
+                        </li>
+                </ul>
+
             </li>
             <li>
                     <a class="function" href="#load_custom_ops">load_custom_ops</a>
@@ -146,49 +158,53 @@ <h1 class="modulename">
 </span><span id="L-21"><a href="#L-21"><span class="linenos">21</span></a><span class="k">if</span> <span class="n">TYPE_CHECKING</span><span class="p">:</span>
 </span><span id="L-22"><a href="#L-22"><span class="linenos">22</span></a>    <span class="kn">import</span> <span class="nn">onnxruntime</span> <span class="k">as</span> <span class="nn">ort</span>
 </span><span id="L-23"><a href="#L-23"><span class="linenos">23</span></a>
-</span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a><span class="n">__all__</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;multiclass_nms&#39;</span><span class="p">,</span> <span class="s1">&#39;NMSResults&#39;</span><span class="p">,</span> <span class="s1">&#39;multiclass_nms_with_indices&#39;</span><span class="p">,</span> <span class="s1">&#39;NMSWithIndicesResults&#39;</span><span class="p">,</span> <span class="s1">&#39;load_custom_ops&#39;</span><span class="p">]</span>
-</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a>
-</span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a><span class="n">validate_installed_libraries</span><span class="p">(</span><span class="n">required_libraries</span><span class="p">[</span><span class="s1">&#39;torch&#39;</span><span class="p">])</span>
-</span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a>
-</span><span id="L-28"><a href="#L-28"><span class="linenos">28</span></a><span class="kn">from</span> <span class="nn">.object_detection</span> <span class="kn">import</span> <span class="n">multiclass_nms</span><span class="p">,</span> <span class="n">NMSResults</span>    <span class="c1"># noqa: E402</span>
-</span><span id="L-29"><a href="#L-29"><span class="linenos">29</span></a><span class="kn">from</span> <span class="nn">.object_detection</span> <span class="kn">import</span> <span class="n">multiclass_nms_with_indices</span><span class="p">,</span> <span class="n">NMSWithIndicesResults</span>    <span class="c1"># noqa: E402</span>
-</span><span id="L-30"><a href="#L-30"><span class="linenos">30</span></a>
-</span><span id="L-31"><a href="#L-31"><span class="linenos">31</span></a>
-</span><span id="L-32"><a href="#L-32"><span class="linenos">32</span></a><span class="k">def</span> <span class="nf">load_custom_ops</span><span class="p">(</span><span class="n">ort_session_ops</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="s1">&#39;ort.SessionOptions&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;ort.SessionOptions&#39;</span><span class="p">:</span>
-</span><span id="L-33"><a href="#L-33"><span class="linenos">33</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="L-34"><a href="#L-34"><span class="linenos">34</span></a><span class="sd">    Registers the custom ops implementation for onnxruntime, and sets up the SessionOptions object for onnxruntime</span>
-</span><span id="L-35"><a href="#L-35"><span class="linenos">35</span></a><span class="sd">    session.</span>
-</span><span id="L-36"><a href="#L-36"><span class="linenos">36</span></a>
-</span><span id="L-37"><a href="#L-37"><span class="linenos">37</span></a><span class="sd">    Args:</span>
-</span><span id="L-38"><a href="#L-38"><span class="linenos">38</span></a><span class="sd">        ort_session_ops: SessionOptions object to register the custom ops library on. If None, creates a new object.</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a><span class="n">__all__</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a>    <span class="s1">&#39;multiclass_nms&#39;</span><span class="p">,</span> <span class="s1">&#39;NMSResults&#39;</span><span class="p">,</span> <span class="s1">&#39;multiclass_nms_with_indices&#39;</span><span class="p">,</span> <span class="s1">&#39;NMSWithIndicesResults&#39;</span><span class="p">,</span> <span class="s1">&#39;FasterRCNNBoxDecode&#39;</span><span class="p">,</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a>    <span class="s1">&#39;load_custom_ops&#39;</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a><span class="p">]</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos">28</span></a>
+</span><span id="L-29"><a href="#L-29"><span class="linenos">29</span></a><span class="n">validate_installed_libraries</span><span class="p">(</span><span class="n">required_libraries</span><span class="p">[</span><span class="s1">&#39;torch&#39;</span><span class="p">])</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos">30</span></a><span class="kn">from</span> <span class="nn">sony_custom_layers.pytorch.nms</span> <span class="kn">import</span> <span class="p">(</span>    <span class="c1"># noqa: E402</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos">31</span></a>    <span class="n">multiclass_nms</span><span class="p">,</span> <span class="n">NMSResults</span><span class="p">,</span> <span class="n">multiclass_nms_with_indices</span><span class="p">,</span> <span class="n">NMSWithIndicesResults</span><span class="p">)</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos">32</span></a><span class="kn">from</span> <span class="nn">sony_custom_layers.pytorch.box_decode</span> <span class="kn">import</span> <span class="n">FasterRCNNBoxDecode</span>    <span class="c1"># noqa: E402</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos">33</span></a>
+</span><span id="L-34"><a href="#L-34"><span class="linenos">34</span></a>
+</span><span id="L-35"><a href="#L-35"><span class="linenos">35</span></a><span class="k">def</span> <span class="nf">load_custom_ops</span><span class="p">(</span><span class="n">ort_session_ops</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="s1">&#39;ort.SessionOptions&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;ort.SessionOptions&#39;</span><span class="p">:</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos">36</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos">37</span></a><span class="sd">    Registers the custom ops implementation for onnxruntime, and sets up the SessionOptions object for onnxruntime</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos">38</span></a><span class="sd">    session.</span>
 </span><span id="L-39"><a href="#L-39"><span class="linenos">39</span></a>
-</span><span id="L-40"><a href="#L-40"><span class="linenos">40</span></a><span class="sd">    Returns:</span>
-</span><span id="L-41"><a href="#L-41"><span class="linenos">41</span></a><span class="sd">        SessionOptions object with registered custom ops.</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos">40</span></a><span class="sd">    Args:</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos">41</span></a><span class="sd">        ort_session_ops: SessionOptions object to register the custom ops library on. If None, creates a new object.</span>
 </span><span id="L-42"><a href="#L-42"><span class="linenos">42</span></a>
-</span><span id="L-43"><a href="#L-43"><span class="linenos">43</span></a><span class="sd">    Example:</span>
-</span><span id="L-44"><a href="#L-44"><span class="linenos">44</span></a><span class="sd">        ```</span>
-</span><span id="L-45"><a href="#L-45"><span class="linenos">45</span></a><span class="sd">        import onnxruntime as ort</span>
-</span><span id="L-46"><a href="#L-46"><span class="linenos">46</span></a><span class="sd">        from sony_custom_layers.pytorch import load_custom_ops</span>
-</span><span id="L-47"><a href="#L-47"><span class="linenos">47</span></a>
-</span><span id="L-48"><a href="#L-48"><span class="linenos">48</span></a><span class="sd">        so = load_custom_ops()</span>
-</span><span id="L-49"><a href="#L-49"><span class="linenos">49</span></a><span class="sd">        session = ort.InferenceSession(model_path, sess_options=so)</span>
-</span><span id="L-50"><a href="#L-50"><span class="linenos">50</span></a><span class="sd">        session.run(...)</span>
-</span><span id="L-51"><a href="#L-51"><span class="linenos">51</span></a><span class="sd">        ```</span>
-</span><span id="L-52"><a href="#L-52"><span class="linenos">52</span></a><span class="sd">        You can also pass your own SessionOptions object upon which to register the custom ops</span>
-</span><span id="L-53"><a href="#L-53"><span class="linenos">53</span></a><span class="sd">        ```</span>
-</span><span id="L-54"><a href="#L-54"><span class="linenos">54</span></a><span class="sd">        load_custom_ops(ort_session_options=so)</span>
-</span><span id="L-55"><a href="#L-55"><span class="linenos">55</span></a><span class="sd">        ```</span>
-</span><span id="L-56"><a href="#L-56"><span class="linenos">56</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="L-57"><a href="#L-57"><span class="linenos">57</span></a>    <span class="n">validate_installed_libraries</span><span class="p">(</span><span class="n">required_libraries</span><span class="p">[</span><span class="s1">&#39;torch_ort&#39;</span><span class="p">])</span>
-</span><span id="L-58"><a href="#L-58"><span class="linenos">58</span></a>
-</span><span id="L-59"><a href="#L-59"><span class="linenos">59</span></a>    <span class="c1"># trigger onnxruntime op registration</span>
-</span><span id="L-60"><a href="#L-60"><span class="linenos">60</span></a>    <span class="kn">from</span> <span class="nn">.object_detection</span> <span class="kn">import</span> <span class="n">nms_ort</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos">43</span></a><span class="sd">    Returns:</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos">44</span></a><span class="sd">        SessionOptions object with registered custom ops.</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos">45</span></a>
+</span><span id="L-46"><a href="#L-46"><span class="linenos">46</span></a><span class="sd">    Example:</span>
+</span><span id="L-47"><a href="#L-47"><span class="linenos">47</span></a><span class="sd">        ```</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos">48</span></a><span class="sd">        import onnxruntime as ort</span>
+</span><span id="L-49"><a href="#L-49"><span class="linenos">49</span></a><span class="sd">        from sony_custom_layers.pytorch import load_custom_ops</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos">50</span></a>
+</span><span id="L-51"><a href="#L-51"><span class="linenos">51</span></a><span class="sd">        so = load_custom_ops()</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos">52</span></a><span class="sd">        session = ort.InferenceSession(model_path, sess_options=so)</span>
+</span><span id="L-53"><a href="#L-53"><span class="linenos">53</span></a><span class="sd">        session.run(...)</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos">54</span></a><span class="sd">        ```</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos">55</span></a><span class="sd">        You can also pass your own SessionOptions object upon which to register the custom ops</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos">56</span></a><span class="sd">        ```</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos">57</span></a><span class="sd">        load_custom_ops(ort_session_options=so)</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos">58</span></a><span class="sd">        ```</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos">59</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos">60</span></a>    <span class="n">validate_installed_libraries</span><span class="p">(</span><span class="n">required_libraries</span><span class="p">[</span><span class="s1">&#39;torch_ort&#39;</span><span class="p">])</span>
 </span><span id="L-61"><a href="#L-61"><span class="linenos">61</span></a>
-</span><span id="L-62"><a href="#L-62"><span class="linenos">62</span></a>    <span class="kn">from</span> <span class="nn">onnxruntime_extensions</span> <span class="kn">import</span> <span class="n">get_library_path</span>
-</span><span id="L-63"><a href="#L-63"><span class="linenos">63</span></a>    <span class="kn">from</span> <span class="nn">onnxruntime</span> <span class="kn">import</span> <span class="n">SessionOptions</span>
-</span><span id="L-64"><a href="#L-64"><span class="linenos">64</span></a>    <span class="n">ort_session_ops</span> <span class="o">=</span> <span class="n">ort_session_ops</span> <span class="ow">or</span> <span class="n">SessionOptions</span><span class="p">()</span>
-</span><span id="L-65"><a href="#L-65"><span class="linenos">65</span></a>    <span class="n">ort_session_ops</span><span class="o">.</span><span class="n">register_custom_ops_library</span><span class="p">(</span><span class="n">get_library_path</span><span class="p">())</span>
-</span><span id="L-66"><a href="#L-66"><span class="linenos">66</span></a>    <span class="k">return</span> <span class="n">ort_session_ops</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos">62</span></a>    <span class="c1"># trigger onnxruntime op registration</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos">63</span></a>    <span class="kn">from</span> <span class="nn">.nms</span> <span class="kn">import</span> <span class="n">nms_ort</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos">64</span></a>    <span class="kn">from</span> <span class="nn">.box_decode</span> <span class="kn">import</span> <span class="n">box_decode_ort</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos">65</span></a>
+</span><span id="L-66"><a href="#L-66"><span class="linenos">66</span></a>    <span class="kn">from</span> <span class="nn">onnxruntime_extensions</span> <span class="kn">import</span> <span class="n">get_library_path</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos">67</span></a>    <span class="kn">from</span> <span class="nn">onnxruntime</span> <span class="kn">import</span> <span class="n">SessionOptions</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos">68</span></a>    <span class="n">ort_session_ops</span> <span class="o">=</span> <span class="n">ort_session_ops</span> <span class="ow">or</span> <span class="n">SessionOptions</span><span class="p">()</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos">69</span></a>    <span class="n">ort_session_ops</span><span class="o">.</span><span class="n">register_custom_ops_library</span><span class="p">(</span><span class="n">get_library_path</span><span class="p">())</span>
+</span><span id="L-70"><a href="#L-70"><span class="linenos">70</span></a>    <span class="k">return</span> <span class="n">ort_session_ops</span>
 </span></pre></div>
 
 
@@ -779,6 +795,175 @@ <h6 id="example">Example:</h6>
 </div>
 
 
+                            </div>
+                </section>
+                <section id="FasterRCNNBoxDecode">
+                            <input id="FasterRCNNBoxDecode-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">FasterRCNNBoxDecode</span><wbr>(<span class="base">torch.nn.modules.module.Module</span>):
+
+                <label class="view-source-button" for="FasterRCNNBoxDecode-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#FasterRCNNBoxDecode"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="FasterRCNNBoxDecode-30"><a href="#FasterRCNNBoxDecode-30"><span class="linenos">30</span></a><span class="k">class</span> <span class="nc">FasterRCNNBoxDecode</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
+</span><span id="FasterRCNNBoxDecode-31"><a href="#FasterRCNNBoxDecode-31"><span class="linenos">31</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="FasterRCNNBoxDecode-32"><a href="#FasterRCNNBoxDecode-32"><span class="linenos">32</span></a><span class="sd">    Box decoding as per Faster R-CNN &lt;https://arxiv.org/abs/1506.01497&gt;.</span>
+</span><span id="FasterRCNNBoxDecode-33"><a href="#FasterRCNNBoxDecode-33"><span class="linenos">33</span></a>
+</span><span id="FasterRCNNBoxDecode-34"><a href="#FasterRCNNBoxDecode-34"><span class="linenos">34</span></a><span class="sd">    Args:</span>
+</span><span id="FasterRCNNBoxDecode-35"><a href="#FasterRCNNBoxDecode-35"><span class="linenos">35</span></a><span class="sd">        anchors: Anchors with a shape of (n_boxes, 4) in corner coordinates (y_min, x_min, y_max, x_max).</span>
+</span><span id="FasterRCNNBoxDecode-36"><a href="#FasterRCNNBoxDecode-36"><span class="linenos">36</span></a><span class="sd">        scale_factors: Scaling factors in the format (y, x, height, width).</span>
+</span><span id="FasterRCNNBoxDecode-37"><a href="#FasterRCNNBoxDecode-37"><span class="linenos">37</span></a><span class="sd">        clip_window: Clipping window in the format (y_min, x_min, y_max, x_max).</span>
+</span><span id="FasterRCNNBoxDecode-38"><a href="#FasterRCNNBoxDecode-38"><span class="linenos">38</span></a>
+</span><span id="FasterRCNNBoxDecode-39"><a href="#FasterRCNNBoxDecode-39"><span class="linenos">39</span></a><span class="sd">    Inputs:</span>
+</span><span id="FasterRCNNBoxDecode-40"><a href="#FasterRCNNBoxDecode-40"><span class="linenos">40</span></a><span class="sd">        **rel_codes** (Tensor): Relative codes (encoded offsets) with a shape of (batch, n_boxes, 4) in centroid</span>
+</span><span id="FasterRCNNBoxDecode-41"><a href="#FasterRCNNBoxDecode-41"><span class="linenos">41</span></a><span class="sd">                                coordinates (y_center, x_center, h, w).</span>
+</span><span id="FasterRCNNBoxDecode-42"><a href="#FasterRCNNBoxDecode-42"><span class="linenos">42</span></a>
+</span><span id="FasterRCNNBoxDecode-43"><a href="#FasterRCNNBoxDecode-43"><span class="linenos">43</span></a><span class="sd">    Returns:</span>
+</span><span id="FasterRCNNBoxDecode-44"><a href="#FasterRCNNBoxDecode-44"><span class="linenos">44</span></a><span class="sd">        Decoded boxes with a shape of (batch, n_boxes, 4) in corner coordinates (y_min, x_min, y_max, x_max).</span>
+</span><span id="FasterRCNNBoxDecode-45"><a href="#FasterRCNNBoxDecode-45"><span class="linenos">45</span></a>
+</span><span id="FasterRCNNBoxDecode-46"><a href="#FasterRCNNBoxDecode-46"><span class="linenos">46</span></a><span class="sd">    Raises:</span>
+</span><span id="FasterRCNNBoxDecode-47"><a href="#FasterRCNNBoxDecode-47"><span class="linenos">47</span></a><span class="sd">        ValueError: If provided with invalid arguments or an input tensor with unexpected shape</span>
+</span><span id="FasterRCNNBoxDecode-48"><a href="#FasterRCNNBoxDecode-48"><span class="linenos">48</span></a>
+</span><span id="FasterRCNNBoxDecode-49"><a href="#FasterRCNNBoxDecode-49"><span class="linenos">49</span></a><span class="sd">    Example:</span>
+</span><span id="FasterRCNNBoxDecode-50"><a href="#FasterRCNNBoxDecode-50"><span class="linenos">50</span></a><span class="sd">        ```</span>
+</span><span id="FasterRCNNBoxDecode-51"><a href="#FasterRCNNBoxDecode-51"><span class="linenos">51</span></a><span class="sd">        from sony_custom_layers.pytorch import FasterRCNNBoxDecode</span>
+</span><span id="FasterRCNNBoxDecode-52"><a href="#FasterRCNNBoxDecode-52"><span class="linenos">52</span></a>
+</span><span id="FasterRCNNBoxDecode-53"><a href="#FasterRCNNBoxDecode-53"><span class="linenos">53</span></a><span class="sd">        box_decode = FasterRCNNBoxDecode(anchors,</span>
+</span><span id="FasterRCNNBoxDecode-54"><a href="#FasterRCNNBoxDecode-54"><span class="linenos">54</span></a><span class="sd">                                         scale_factors=(10, 10, 5, 5),</span>
+</span><span id="FasterRCNNBoxDecode-55"><a href="#FasterRCNNBoxDecode-55"><span class="linenos">55</span></a><span class="sd">                                         clip_window=(0, 0, 1, 1))</span>
+</span><span id="FasterRCNNBoxDecode-56"><a href="#FasterRCNNBoxDecode-56"><span class="linenos">56</span></a><span class="sd">        decoded_boxes = box_decode(rel_codes)</span>
+</span><span id="FasterRCNNBoxDecode-57"><a href="#FasterRCNNBoxDecode-57"><span class="linenos">57</span></a><span class="sd">        ```</span>
+</span><span id="FasterRCNNBoxDecode-58"><a href="#FasterRCNNBoxDecode-58"><span class="linenos">58</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="FasterRCNNBoxDecode-59"><a href="#FasterRCNNBoxDecode-59"><span class="linenos">59</span></a>
+</span><span id="FasterRCNNBoxDecode-60"><a href="#FasterRCNNBoxDecode-60"><span class="linenos">60</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">anchors</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">scale_factors</span><span class="p">:</span> <span class="n">Sequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">]],</span>
+</span><span id="FasterRCNNBoxDecode-61"><a href="#FasterRCNNBoxDecode-61"><span class="linenos">61</span></a>                 <span class="n">clip_window</span><span class="p">:</span> <span class="n">Sequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">]]):</span>
+</span><span id="FasterRCNNBoxDecode-62"><a href="#FasterRCNNBoxDecode-62"><span class="linenos">62</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="FasterRCNNBoxDecode-63"><a href="#FasterRCNNBoxDecode-63"><span class="linenos">63</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">anchors</span><span class="o">.</span><span class="n">shape</span><span class="p">)</span> <span class="o">==</span> <span class="mi">2</span> <span class="ow">and</span> <span class="n">anchors</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="o">==</span> <span class="mi">4</span><span class="p">):</span>
+</span><span id="FasterRCNNBoxDecode-64"><a href="#FasterRCNNBoxDecode-64"><span class="linenos">64</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Invalid anchors shape </span><span class="si">{</span><span class="n">anchors</span><span class="o">.</span><span class="n">shape</span><span class="si">}</span><span class="s1">. Expected shape (n_boxes, 4).&#39;</span><span class="p">)</span>
+</span><span id="FasterRCNNBoxDecode-65"><a href="#FasterRCNNBoxDecode-65"><span class="linenos">65</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">register_buffer</span><span class="p">(</span><span class="s1">&#39;anchors&#39;</span><span class="p">,</span> <span class="n">anchors</span><span class="p">)</span>
+</span><span id="FasterRCNNBoxDecode-66"><a href="#FasterRCNNBoxDecode-66"><span class="linenos">66</span></a>
+</span><span id="FasterRCNNBoxDecode-67"><a href="#FasterRCNNBoxDecode-67"><span class="linenos">67</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">scale_factors</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">4</span><span class="p">:</span>
+</span><span id="FasterRCNNBoxDecode-68"><a href="#FasterRCNNBoxDecode-68"><span class="linenos">68</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Invalid scale factors </span><span class="si">{</span><span class="n">scale_factors</span><span class="si">}</span><span class="s1">. Expected 4 values for (y, x, height, width).&#39;</span><span class="p">)</span>
+</span><span id="FasterRCNNBoxDecode-69"><a href="#FasterRCNNBoxDecode-69"><span class="linenos">69</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">register_buffer</span><span class="p">(</span><span class="s1">&#39;scale_factors&#39;</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">tensor</span><span class="p">(</span><span class="n">scale_factors</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">float32</span><span class="p">,</span> <span class="n">device</span><span class="o">=</span><span class="n">anchors</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="FasterRCNNBoxDecode-70"><a href="#FasterRCNNBoxDecode-70"><span class="linenos">70</span></a>
+</span><span id="FasterRCNNBoxDecode-71"><a href="#FasterRCNNBoxDecode-71"><span class="linenos">71</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">clip_window</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">4</span><span class="p">:</span>
+</span><span id="FasterRCNNBoxDecode-72"><a href="#FasterRCNNBoxDecode-72"><span class="linenos">72</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Invalid clip window </span><span class="si">{</span><span class="n">clip_window</span><span class="si">}</span><span class="s1">. Expected 4 values for (y_min, x_min, y_max, x_max).&#39;</span><span class="p">)</span>
+</span><span id="FasterRCNNBoxDecode-73"><a href="#FasterRCNNBoxDecode-73"><span class="linenos">73</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">register_buffer</span><span class="p">(</span><span class="s1">&#39;clip_window&#39;</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">tensor</span><span class="p">(</span><span class="n">clip_window</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">float32</span><span class="p">,</span> <span class="n">device</span><span class="o">=</span><span class="n">anchors</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="FasterRCNNBoxDecode-74"><a href="#FasterRCNNBoxDecode-74"><span class="linenos">74</span></a>
+</span><span id="FasterRCNNBoxDecode-75"><a href="#FasterRCNNBoxDecode-75"><span class="linenos">75</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">rel_codes</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="FasterRCNNBoxDecode-76"><a href="#FasterRCNNBoxDecode-76"><span class="linenos">76</span></a>        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">ops</span><span class="o">.</span><span class="n">sony</span><span class="o">.</span><span class="n">faster_rcnn_box_decode</span><span class="p">(</span><span class="n">rel_codes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">anchors</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">scale_factors</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">clip_window</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Box decoding as per Faster R-CNN <a href="https://arxiv.org/abs/1506.01497">https://arxiv.org/abs/1506.01497</a>.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>anchors:</strong>  Anchors with a shape of (n_boxes, 4) in corner coordinates (y_min, x_min, y_max, x_max).</li>
+<li><strong>scale_factors:</strong>  Scaling factors in the format (y, x, height, width).</li>
+<li><strong>clip_window:</strong>  Clipping window in the format (y_min, x_min, y_max, x_max).</li>
+</ul>
+
+<h6 id="inputs">Inputs:</h6>
+
+<blockquote>
+  <p><strong>rel_codes</strong> (Tensor): Relative codes (encoded offsets) with a shape of (batch, n_boxes, 4) in centroid
+                          coordinates (y_center, x_center, h, w).</p>
+</blockquote>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p>Decoded boxes with a shape of (batch, n_boxes, 4) in corner coordinates (y_min, x_min, y_max, x_max).</p>
+</blockquote>
+
+<h6 id="raises">Raises:</h6>
+
+<ul>
+<li><strong>ValueError:</strong>  If provided with invalid arguments or an input tensor with unexpected shape</li>
+</ul>
+
+<h6 id="example">Example:</h6>
+
+<blockquote>
+<pre><code>from <a href="">sony_custom_layers.pytorch</a> import FasterRCNNBoxDecode
+
+box_decode = FasterRCNNBoxDecode(anchors,
+                                 scale_factors=(10, 10, 5, 5),
+                                 clip_window=(0, 0, 1, 1))
+decoded_boxes = box_decode(rel_codes)
+</code></pre>
+</blockquote>
+</div>
+
+
+                            <div id="FasterRCNNBoxDecode.__init__" class="classattr">
+                                        <input id="FasterRCNNBoxDecode.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">FasterRCNNBoxDecode</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">anchors</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">scale_factors</span><span class="p">:</span> <span class="n">Sequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">]]</span>,</span><span class="param">	<span class="n">clip_window</span><span class="p">:</span> <span class="n">Sequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">]]</span></span>)</span>
+
+                <label class="view-source-button" for="FasterRCNNBoxDecode.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#FasterRCNNBoxDecode.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="FasterRCNNBoxDecode.__init__-60"><a href="#FasterRCNNBoxDecode.__init__-60"><span class="linenos">60</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">anchors</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">scale_factors</span><span class="p">:</span> <span class="n">Sequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">]],</span>
+</span><span id="FasterRCNNBoxDecode.__init__-61"><a href="#FasterRCNNBoxDecode.__init__-61"><span class="linenos">61</span></a>                 <span class="n">clip_window</span><span class="p">:</span> <span class="n">Sequence</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">]]):</span>
+</span><span id="FasterRCNNBoxDecode.__init__-62"><a href="#FasterRCNNBoxDecode.__init__-62"><span class="linenos">62</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="FasterRCNNBoxDecode.__init__-63"><a href="#FasterRCNNBoxDecode.__init__-63"><span class="linenos">63</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">anchors</span><span class="o">.</span><span class="n">shape</span><span class="p">)</span> <span class="o">==</span> <span class="mi">2</span> <span class="ow">and</span> <span class="n">anchors</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="o">==</span> <span class="mi">4</span><span class="p">):</span>
+</span><span id="FasterRCNNBoxDecode.__init__-64"><a href="#FasterRCNNBoxDecode.__init__-64"><span class="linenos">64</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Invalid anchors shape </span><span class="si">{</span><span class="n">anchors</span><span class="o">.</span><span class="n">shape</span><span class="si">}</span><span class="s1">. Expected shape (n_boxes, 4).&#39;</span><span class="p">)</span>
+</span><span id="FasterRCNNBoxDecode.__init__-65"><a href="#FasterRCNNBoxDecode.__init__-65"><span class="linenos">65</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">register_buffer</span><span class="p">(</span><span class="s1">&#39;anchors&#39;</span><span class="p">,</span> <span class="n">anchors</span><span class="p">)</span>
+</span><span id="FasterRCNNBoxDecode.__init__-66"><a href="#FasterRCNNBoxDecode.__init__-66"><span class="linenos">66</span></a>
+</span><span id="FasterRCNNBoxDecode.__init__-67"><a href="#FasterRCNNBoxDecode.__init__-67"><span class="linenos">67</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">scale_factors</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">4</span><span class="p">:</span>
+</span><span id="FasterRCNNBoxDecode.__init__-68"><a href="#FasterRCNNBoxDecode.__init__-68"><span class="linenos">68</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Invalid scale factors </span><span class="si">{</span><span class="n">scale_factors</span><span class="si">}</span><span class="s1">. Expected 4 values for (y, x, height, width).&#39;</span><span class="p">)</span>
+</span><span id="FasterRCNNBoxDecode.__init__-69"><a href="#FasterRCNNBoxDecode.__init__-69"><span class="linenos">69</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">register_buffer</span><span class="p">(</span><span class="s1">&#39;scale_factors&#39;</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">tensor</span><span class="p">(</span><span class="n">scale_factors</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">float32</span><span class="p">,</span> <span class="n">device</span><span class="o">=</span><span class="n">anchors</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span><span id="FasterRCNNBoxDecode.__init__-70"><a href="#FasterRCNNBoxDecode.__init__-70"><span class="linenos">70</span></a>
+</span><span id="FasterRCNNBoxDecode.__init__-71"><a href="#FasterRCNNBoxDecode.__init__-71"><span class="linenos">71</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">clip_window</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">4</span><span class="p">:</span>
+</span><span id="FasterRCNNBoxDecode.__init__-72"><a href="#FasterRCNNBoxDecode.__init__-72"><span class="linenos">72</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Invalid clip window </span><span class="si">{</span><span class="n">clip_window</span><span class="si">}</span><span class="s1">. Expected 4 values for (y_min, x_min, y_max, x_max).&#39;</span><span class="p">)</span>
+</span><span id="FasterRCNNBoxDecode.__init__-73"><a href="#FasterRCNNBoxDecode.__init__-73"><span class="linenos">73</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">register_buffer</span><span class="p">(</span><span class="s1">&#39;clip_window&#39;</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">tensor</span><span class="p">(</span><span class="n">clip_window</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">float32</span><span class="p">,</span> <span class="n">device</span><span class="o">=</span><span class="n">anchors</span><span class="o">.</span><span class="n">device</span><span class="p">))</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Initialize internal Module state, shared by both nn.Module and ScriptModule.</p>
+</div>
+
+
+                            </div>
+                            <div id="FasterRCNNBoxDecode.forward" class="classattr">
+                                        <input id="FasterRCNNBoxDecode.forward-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">forward</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">rel_codes</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="FasterRCNNBoxDecode.forward-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#FasterRCNNBoxDecode.forward"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="FasterRCNNBoxDecode.forward-75"><a href="#FasterRCNNBoxDecode.forward-75"><span class="linenos">75</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">rel_codes</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="FasterRCNNBoxDecode.forward-76"><a href="#FasterRCNNBoxDecode.forward-76"><span class="linenos">76</span></a>        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">ops</span><span class="o">.</span><span class="n">sony</span><span class="o">.</span><span class="n">faster_rcnn_box_decode</span><span class="p">(</span><span class="n">rel_codes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">anchors</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">scale_factors</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">clip_window</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Define the computation performed at every call.</p>
+
+<p>Should be overridden by all subclasses.</p>
+
+<div class="alert note">
+
+<p>Although the recipe for forward pass needs to be defined within
+this function, one should call the <code>Module</code> instance afterwards
+instead of this since the former takes care of running the
+registered hooks while the latter silently ignores them.</p>
+
+</div>
+</div>
+
+
                             </div>
                 </section>
                 <section id="load_custom_ops">
@@ -792,41 +977,42 @@ <h6 id="example">Example:</h6>
 
     </div>
     <a class="headerlink" href="#load_custom_ops"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="load_custom_ops-33"><a href="#load_custom_ops-33"><span class="linenos">33</span></a><span class="k">def</span> <span class="nf">load_custom_ops</span><span class="p">(</span><span class="n">ort_session_ops</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="s1">&#39;ort.SessionOptions&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;ort.SessionOptions&#39;</span><span class="p">:</span>
-</span><span id="load_custom_ops-34"><a href="#load_custom_ops-34"><span class="linenos">34</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="load_custom_ops-35"><a href="#load_custom_ops-35"><span class="linenos">35</span></a><span class="sd">    Registers the custom ops implementation for onnxruntime, and sets up the SessionOptions object for onnxruntime</span>
-</span><span id="load_custom_ops-36"><a href="#load_custom_ops-36"><span class="linenos">36</span></a><span class="sd">    session.</span>
-</span><span id="load_custom_ops-37"><a href="#load_custom_ops-37"><span class="linenos">37</span></a>
-</span><span id="load_custom_ops-38"><a href="#load_custom_ops-38"><span class="linenos">38</span></a><span class="sd">    Args:</span>
-</span><span id="load_custom_ops-39"><a href="#load_custom_ops-39"><span class="linenos">39</span></a><span class="sd">        ort_session_ops: SessionOptions object to register the custom ops library on. If None, creates a new object.</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="load_custom_ops-36"><a href="#load_custom_ops-36"><span class="linenos">36</span></a><span class="k">def</span> <span class="nf">load_custom_ops</span><span class="p">(</span><span class="n">ort_session_ops</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="s1">&#39;ort.SessionOptions&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;ort.SessionOptions&#39;</span><span class="p">:</span>
+</span><span id="load_custom_ops-37"><a href="#load_custom_ops-37"><span class="linenos">37</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="load_custom_ops-38"><a href="#load_custom_ops-38"><span class="linenos">38</span></a><span class="sd">    Registers the custom ops implementation for onnxruntime, and sets up the SessionOptions object for onnxruntime</span>
+</span><span id="load_custom_ops-39"><a href="#load_custom_ops-39"><span class="linenos">39</span></a><span class="sd">    session.</span>
 </span><span id="load_custom_ops-40"><a href="#load_custom_ops-40"><span class="linenos">40</span></a>
-</span><span id="load_custom_ops-41"><a href="#load_custom_ops-41"><span class="linenos">41</span></a><span class="sd">    Returns:</span>
-</span><span id="load_custom_ops-42"><a href="#load_custom_ops-42"><span class="linenos">42</span></a><span class="sd">        SessionOptions object with registered custom ops.</span>
+</span><span id="load_custom_ops-41"><a href="#load_custom_ops-41"><span class="linenos">41</span></a><span class="sd">    Args:</span>
+</span><span id="load_custom_ops-42"><a href="#load_custom_ops-42"><span class="linenos">42</span></a><span class="sd">        ort_session_ops: SessionOptions object to register the custom ops library on. If None, creates a new object.</span>
 </span><span id="load_custom_ops-43"><a href="#load_custom_ops-43"><span class="linenos">43</span></a>
-</span><span id="load_custom_ops-44"><a href="#load_custom_ops-44"><span class="linenos">44</span></a><span class="sd">    Example:</span>
-</span><span id="load_custom_ops-45"><a href="#load_custom_ops-45"><span class="linenos">45</span></a><span class="sd">        ```</span>
-</span><span id="load_custom_ops-46"><a href="#load_custom_ops-46"><span class="linenos">46</span></a><span class="sd">        import onnxruntime as ort</span>
-</span><span id="load_custom_ops-47"><a href="#load_custom_ops-47"><span class="linenos">47</span></a><span class="sd">        from sony_custom_layers.pytorch import load_custom_ops</span>
-</span><span id="load_custom_ops-48"><a href="#load_custom_ops-48"><span class="linenos">48</span></a>
-</span><span id="load_custom_ops-49"><a href="#load_custom_ops-49"><span class="linenos">49</span></a><span class="sd">        so = load_custom_ops()</span>
-</span><span id="load_custom_ops-50"><a href="#load_custom_ops-50"><span class="linenos">50</span></a><span class="sd">        session = ort.InferenceSession(model_path, sess_options=so)</span>
-</span><span id="load_custom_ops-51"><a href="#load_custom_ops-51"><span class="linenos">51</span></a><span class="sd">        session.run(...)</span>
-</span><span id="load_custom_ops-52"><a href="#load_custom_ops-52"><span class="linenos">52</span></a><span class="sd">        ```</span>
-</span><span id="load_custom_ops-53"><a href="#load_custom_ops-53"><span class="linenos">53</span></a><span class="sd">        You can also pass your own SessionOptions object upon which to register the custom ops</span>
-</span><span id="load_custom_ops-54"><a href="#load_custom_ops-54"><span class="linenos">54</span></a><span class="sd">        ```</span>
-</span><span id="load_custom_ops-55"><a href="#load_custom_ops-55"><span class="linenos">55</span></a><span class="sd">        load_custom_ops(ort_session_options=so)</span>
-</span><span id="load_custom_ops-56"><a href="#load_custom_ops-56"><span class="linenos">56</span></a><span class="sd">        ```</span>
-</span><span id="load_custom_ops-57"><a href="#load_custom_ops-57"><span class="linenos">57</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="load_custom_ops-58"><a href="#load_custom_ops-58"><span class="linenos">58</span></a>    <span class="n">validate_installed_libraries</span><span class="p">(</span><span class="n">required_libraries</span><span class="p">[</span><span class="s1">&#39;torch_ort&#39;</span><span class="p">])</span>
-</span><span id="load_custom_ops-59"><a href="#load_custom_ops-59"><span class="linenos">59</span></a>
-</span><span id="load_custom_ops-60"><a href="#load_custom_ops-60"><span class="linenos">60</span></a>    <span class="c1"># trigger onnxruntime op registration</span>
-</span><span id="load_custom_ops-61"><a href="#load_custom_ops-61"><span class="linenos">61</span></a>    <span class="kn">from</span> <span class="nn">.object_detection</span> <span class="kn">import</span> <span class="n">nms_ort</span>
+</span><span id="load_custom_ops-44"><a href="#load_custom_ops-44"><span class="linenos">44</span></a><span class="sd">    Returns:</span>
+</span><span id="load_custom_ops-45"><a href="#load_custom_ops-45"><span class="linenos">45</span></a><span class="sd">        SessionOptions object with registered custom ops.</span>
+</span><span id="load_custom_ops-46"><a href="#load_custom_ops-46"><span class="linenos">46</span></a>
+</span><span id="load_custom_ops-47"><a href="#load_custom_ops-47"><span class="linenos">47</span></a><span class="sd">    Example:</span>
+</span><span id="load_custom_ops-48"><a href="#load_custom_ops-48"><span class="linenos">48</span></a><span class="sd">        ```</span>
+</span><span id="load_custom_ops-49"><a href="#load_custom_ops-49"><span class="linenos">49</span></a><span class="sd">        import onnxruntime as ort</span>
+</span><span id="load_custom_ops-50"><a href="#load_custom_ops-50"><span class="linenos">50</span></a><span class="sd">        from sony_custom_layers.pytorch import load_custom_ops</span>
+</span><span id="load_custom_ops-51"><a href="#load_custom_ops-51"><span class="linenos">51</span></a>
+</span><span id="load_custom_ops-52"><a href="#load_custom_ops-52"><span class="linenos">52</span></a><span class="sd">        so = load_custom_ops()</span>
+</span><span id="load_custom_ops-53"><a href="#load_custom_ops-53"><span class="linenos">53</span></a><span class="sd">        session = ort.InferenceSession(model_path, sess_options=so)</span>
+</span><span id="load_custom_ops-54"><a href="#load_custom_ops-54"><span class="linenos">54</span></a><span class="sd">        session.run(...)</span>
+</span><span id="load_custom_ops-55"><a href="#load_custom_ops-55"><span class="linenos">55</span></a><span class="sd">        ```</span>
+</span><span id="load_custom_ops-56"><a href="#load_custom_ops-56"><span class="linenos">56</span></a><span class="sd">        You can also pass your own SessionOptions object upon which to register the custom ops</span>
+</span><span id="load_custom_ops-57"><a href="#load_custom_ops-57"><span class="linenos">57</span></a><span class="sd">        ```</span>
+</span><span id="load_custom_ops-58"><a href="#load_custom_ops-58"><span class="linenos">58</span></a><span class="sd">        load_custom_ops(ort_session_options=so)</span>
+</span><span id="load_custom_ops-59"><a href="#load_custom_ops-59"><span class="linenos">59</span></a><span class="sd">        ```</span>
+</span><span id="load_custom_ops-60"><a href="#load_custom_ops-60"><span class="linenos">60</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="load_custom_ops-61"><a href="#load_custom_ops-61"><span class="linenos">61</span></a>    <span class="n">validate_installed_libraries</span><span class="p">(</span><span class="n">required_libraries</span><span class="p">[</span><span class="s1">&#39;torch_ort&#39;</span><span class="p">])</span>
 </span><span id="load_custom_ops-62"><a href="#load_custom_ops-62"><span class="linenos">62</span></a>
-</span><span id="load_custom_ops-63"><a href="#load_custom_ops-63"><span class="linenos">63</span></a>    <span class="kn">from</span> <span class="nn">onnxruntime_extensions</span> <span class="kn">import</span> <span class="n">get_library_path</span>
-</span><span id="load_custom_ops-64"><a href="#load_custom_ops-64"><span class="linenos">64</span></a>    <span class="kn">from</span> <span class="nn">onnxruntime</span> <span class="kn">import</span> <span class="n">SessionOptions</span>
-</span><span id="load_custom_ops-65"><a href="#load_custom_ops-65"><span class="linenos">65</span></a>    <span class="n">ort_session_ops</span> <span class="o">=</span> <span class="n">ort_session_ops</span> <span class="ow">or</span> <span class="n">SessionOptions</span><span class="p">()</span>
-</span><span id="load_custom_ops-66"><a href="#load_custom_ops-66"><span class="linenos">66</span></a>    <span class="n">ort_session_ops</span><span class="o">.</span><span class="n">register_custom_ops_library</span><span class="p">(</span><span class="n">get_library_path</span><span class="p">())</span>
-</span><span id="load_custom_ops-67"><a href="#load_custom_ops-67"><span class="linenos">67</span></a>    <span class="k">return</span> <span class="n">ort_session_ops</span>
+</span><span id="load_custom_ops-63"><a href="#load_custom_ops-63"><span class="linenos">63</span></a>    <span class="c1"># trigger onnxruntime op registration</span>
+</span><span id="load_custom_ops-64"><a href="#load_custom_ops-64"><span class="linenos">64</span></a>    <span class="kn">from</span> <span class="nn">.nms</span> <span class="kn">import</span> <span class="n">nms_ort</span>
+</span><span id="load_custom_ops-65"><a href="#load_custom_ops-65"><span class="linenos">65</span></a>    <span class="kn">from</span> <span class="nn">.box_decode</span> <span class="kn">import</span> <span class="n">box_decode_ort</span>
+</span><span id="load_custom_ops-66"><a href="#load_custom_ops-66"><span class="linenos">66</span></a>
+</span><span id="load_custom_ops-67"><a href="#load_custom_ops-67"><span class="linenos">67</span></a>    <span class="kn">from</span> <span class="nn">onnxruntime_extensions</span> <span class="kn">import</span> <span class="n">get_library_path</span>
+</span><span id="load_custom_ops-68"><a href="#load_custom_ops-68"><span class="linenos">68</span></a>    <span class="kn">from</span> <span class="nn">onnxruntime</span> <span class="kn">import</span> <span class="n">SessionOptions</span>
+</span><span id="load_custom_ops-69"><a href="#load_custom_ops-69"><span class="linenos">69</span></a>    <span class="n">ort_session_ops</span> <span class="o">=</span> <span class="n">ort_session_ops</span> <span class="ow">or</span> <span class="n">SessionOptions</span><span class="p">()</span>
+</span><span id="load_custom_ops-70"><a href="#load_custom_ops-70"><span class="linenos">70</span></a>    <span class="n">ort_session_ops</span><span class="o">.</span><span class="n">register_custom_ops_library</span><span class="p">(</span><span class="n">get_library_path</span><span class="p">())</span>
+</span><span id="load_custom_ops-71"><a href="#load_custom_ops-71"><span class="linenos">71</span></a>    <span class="k">return</span> <span class="n">ort_session_ops</span>
 </span></pre></div>
 
 
diff --git a/sony_custom_layers/pytorch/tests/object_detection/__init__.py b/sony_custom_layers/common/__init__.py
similarity index 100%
rename from sony_custom_layers/pytorch/tests/object_detection/__init__.py
rename to sony_custom_layers/common/__init__.py
diff --git a/sony_custom_layers/keras/object_detection/box_utils.py b/sony_custom_layers/common/box_util.py
similarity index 95%
rename from sony_custom_layers/keras/object_detection/box_utils.py
rename to sony_custom_layers/common/box_util.py
index 917c818..18553d0 100644
--- a/sony_custom_layers/keras/object_detection/box_utils.py
+++ b/sony_custom_layers/common/box_util.py
@@ -1,5 +1,5 @@
 # -----------------------------------------------------------------------------
-# Copyright 2023 Sony Semiconductor Israel, Inc. All rights reserved.
+# Copyright 2024 Sony Semiconductor Israel, Inc. All rights reserved.
 #
 # Licensed under the Apache License, Version 2.0 (the "License");
 # you may not use this file except in compliance with the License.
@@ -13,7 +13,6 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 # -----------------------------------------------------------------------------
-
 from typing import Tuple
 
 
diff --git a/sony_custom_layers/keras/object_detection/faster_rcnn_box_decode.py b/sony_custom_layers/keras/object_detection/faster_rcnn_box_decode.py
index a4fbac0..652f37b 100644
--- a/sony_custom_layers/keras/object_detection/faster_rcnn_box_decode.py
+++ b/sony_custom_layers/keras/object_detection/faster_rcnn_box_decode.py
@@ -19,8 +19,8 @@
 import tensorflow as tf
 import numpy as np
 
+from sony_custom_layers.common.box_util import corners_to_centroids, centroids_to_corners
 from sony_custom_layers.keras.base_custom_layer import CustomLayer
-from sony_custom_layers.keras.object_detection.box_utils import corners_to_centroids, centroids_to_corners
 from sony_custom_layers.keras.custom_objects import register_layer
 
 
diff --git a/sony_custom_layers/pytorch/__init__.py b/sony_custom_layers/pytorch/__init__.py
index 0c172f0..56067f3 100644
--- a/sony_custom_layers/pytorch/__init__.py
+++ b/sony_custom_layers/pytorch/__init__.py
@@ -21,12 +21,15 @@
 if TYPE_CHECKING:
     import onnxruntime as ort
 
-__all__ = ['multiclass_nms', 'NMSResults', 'multiclass_nms_with_indices', 'NMSWithIndicesResults', 'load_custom_ops']
+__all__ = [
+    'multiclass_nms', 'NMSResults', 'multiclass_nms_with_indices', 'NMSWithIndicesResults', 'FasterRCNNBoxDecode',
+    'load_custom_ops'
+]
 
 validate_installed_libraries(required_libraries['torch'])
-
-from .object_detection import multiclass_nms, NMSResults    # noqa: E402
-from .object_detection import multiclass_nms_with_indices, NMSWithIndicesResults    # noqa: E402
+from sony_custom_layers.pytorch.nms import (    # noqa: E402
+    multiclass_nms, NMSResults, multiclass_nms_with_indices, NMSWithIndicesResults)
+from sony_custom_layers.pytorch.box_decode import FasterRCNNBoxDecode    # noqa: E402
 
 
 def load_custom_ops(ort_session_ops: Optional['ort.SessionOptions'] = None) -> 'ort.SessionOptions':
@@ -57,7 +60,8 @@ def load_custom_ops(ort_session_ops: Optional['ort.SessionOptions'] = None) -> '
     validate_installed_libraries(required_libraries['torch_ort'])
 
     # trigger onnxruntime op registration
-    from .object_detection import nms_ort
+    from .nms import nms_ort
+    from .box_decode import box_decode_ort
 
     from onnxruntime_extensions import get_library_path
     from onnxruntime import SessionOptions
diff --git a/sony_custom_layers/pytorch/box_decode/__init__.py b/sony_custom_layers/pytorch/box_decode/__init__.py
new file mode 100644
index 0000000..df98b28
--- /dev/null
+++ b/sony_custom_layers/pytorch/box_decode/__init__.py
@@ -0,0 +1,21 @@
+# -----------------------------------------------------------------------------
+# Copyright 2024 Sony Semiconductor Israel, Inc. All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# -----------------------------------------------------------------------------
+from .box_decode import FasterRCNNBoxDecode
+
+# trigger onnx op registration
+from . import box_decode_onnx
+
+__all__ = ['FasterRCNNBoxDecode']
diff --git a/sony_custom_layers/pytorch/box_decode/box_decode.py b/sony_custom_layers/pytorch/box_decode/box_decode.py
new file mode 100644
index 0000000..3246c30
--- /dev/null
+++ b/sony_custom_layers/pytorch/box_decode/box_decode.py
@@ -0,0 +1,114 @@
+# -----------------------------------------------------------------------------
+# Copyright 2024 Sony Semiconductor Israel, Inc. All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# -----------------------------------------------------------------------------
+from typing import Union, Sequence
+
+import torch
+from torch import nn
+
+from sony_custom_layers.common.box_util import corners_to_centroids, centroids_to_corners
+from sony_custom_layers.pytorch.custom_lib import register_op
+
+BOX_DECODE_TORCH_OP = 'faster_rcnn_box_decode'
+
+__all__ = ['FasterRCNNBoxDecode']
+
+
+class FasterRCNNBoxDecode(nn.Module):
+    """
+    Box decoding as per Faster R-CNN <https://arxiv.org/abs/1506.01497>.
+
+    Args:
+        anchors: Anchors with a shape of (n_boxes, 4) in corner coordinates (y_min, x_min, y_max, x_max).
+        scale_factors: Scaling factors in the format (y, x, height, width).
+        clip_window: Clipping window in the format (y_min, x_min, y_max, x_max).
+
+    Inputs:
+        **rel_codes** (Tensor): Relative codes (encoded offsets) with a shape of (batch, n_boxes, 4) in centroid
+                                coordinates (y_center, x_center, h, w).
+
+    Returns:
+        Decoded boxes with a shape of (batch, n_boxes, 4) in corner coordinates (y_min, x_min, y_max, x_max).
+
+    Raises:
+        ValueError: If provided with invalid arguments or an input tensor with unexpected shape
+
+    Example:
+        ```
+        from sony_custom_layers.pytorch import FasterRCNNBoxDecode
+
+        box_decode = FasterRCNNBoxDecode(anchors,
+                                         scale_factors=(10, 10, 5, 5),
+                                         clip_window=(0, 0, 1, 1))
+        decoded_boxes = box_decode(rel_codes)
+        ```
+    """
+
+    def __init__(self, anchors: torch.Tensor, scale_factors: Sequence[Union[float, int]],
+                 clip_window: Sequence[Union[float, int]]):
+        super().__init__()
+        if not (len(anchors.shape) == 2 and anchors.shape[-1] == 4):
+            raise ValueError(f'Invalid anchors shape {anchors.shape}. Expected shape (n_boxes, 4).')
+        self.register_buffer('anchors', anchors)
+
+        if len(scale_factors) != 4:
+            raise ValueError(f'Invalid scale factors {scale_factors}. Expected 4 values for (y, x, height, width).')
+        self.register_buffer('scale_factors', torch.tensor(scale_factors, dtype=torch.float32, device=anchors.device))
+
+        if len(clip_window) != 4:
+            raise ValueError(f'Invalid clip window {clip_window}. Expected 4 values for (y_min, x_min, y_max, x_max).')
+        self.register_buffer('clip_window', torch.tensor(clip_window, dtype=torch.float32, device=anchors.device))
+
+    def forward(self, rel_codes: torch.Tensor) -> torch.Tensor:
+        return torch.ops.sony.faster_rcnn_box_decode(rel_codes, self.anchors, self.scale_factors, self.clip_window)
+
+
+######################
+# Register custom op #
+######################
+
+
+def _faster_rcnn_box_decode_impl(rel_codes: torch.Tensor, anchors: torch.Tensor, scale_factors: torch.Tensor,
+                                 clip_window: torch.Tensor) -> torch.Tensor:
+    """ This implementation is intended only to be registered as custom torch and onnxruntime op. """
+    if len(rel_codes.shape) != 3 or rel_codes.shape[-1] != 4:
+        raise ValueError(f'Invalid input tensor shape {rel_codes.shape}. Expected shape (batch, n_boxes, 4).')
+
+    if rel_codes.shape[-2] != anchors.shape[-2]:
+        raise ValueError(f'Mismatch in the number of boxes between input tensor ({rel_codes.shape[-2]}) '
+                         f'and anchors ({anchors.shape[-2]})')
+
+    scaled_codes = rel_codes / scale_factors
+
+    a_y_min, a_x_min, a_y_max, a_x_max = torch.unbind(anchors, dim=-1)
+    a_y_center, a_x_center, a_h, a_w = corners_to_centroids(a_y_min, a_x_min, a_y_max, a_x_max)
+
+    box_y_center = scaled_codes[..., 0] * a_h + a_y_center
+    box_x_center = scaled_codes[..., 1] * a_w + a_x_center
+    box_h = torch.exp(scaled_codes[..., 2]) * a_h
+    box_w = torch.exp(scaled_codes[..., 3]) * a_w
+    box_y_min, box_x_min, box_y_max, box_x_max = centroids_to_corners(box_y_center, box_x_center, box_h, box_w)
+    boxes = torch.stack([box_y_min, box_x_min, box_y_max, box_x_max], dim=-1)
+
+    y_low, x_low, y_high, x_high = clip_window
+    boxes = torch.clip(boxes, torch.tensor([y_low, x_low, y_low, x_low], device=rel_codes.device),
+                       torch.tensor([y_high, x_high, y_high, x_high], device=rel_codes.device))
+    return boxes
+
+
+schema = (BOX_DECODE_TORCH_OP +
+          "(Tensor rel_codes, Tensor anchors, Tensor scale_factors, Tensor clip_window) -> Tensor")
+
+register_op(BOX_DECODE_TORCH_OP, schema, _faster_rcnn_box_decode_impl)
diff --git a/sony_custom_layers/pytorch/box_decode/box_decode_onnx.py b/sony_custom_layers/pytorch/box_decode/box_decode_onnx.py
new file mode 100644
index 0000000..dc0f269
--- /dev/null
+++ b/sony_custom_layers/pytorch/box_decode/box_decode_onnx.py
@@ -0,0 +1,32 @@
+# -----------------------------------------------------------------------------
+# Copyright 2024 Sony Semiconductor Israel, Inc. All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# -----------------------------------------------------------------------------
+import torch
+
+from sony_custom_layers.pytorch.box_decode.box_decode import BOX_DECODE_TORCH_OP
+from sony_custom_layers.pytorch.custom_lib import get_op_qualname
+
+BOX_DECODE_ONNX_OP = "Sony::FasterRCNNBoxDecode"
+
+
+@torch.onnx.symbolic_helper.parse_args('v', 'v', 'v', 'v')
+def box_decode_onnx(g, rel_codes, anchors, scale_factors, clip_window):
+    outputs = g.op(BOX_DECODE_ONNX_OP, rel_codes, anchors, scale_factors, clip_window, outputs=1)
+    # Set output tensors shape and dtype
+    outputs.setType(rel_codes.type())
+    return outputs
+
+
+torch.onnx.register_custom_op_symbolic(get_op_qualname(BOX_DECODE_TORCH_OP), box_decode_onnx, opset_version=1)
diff --git a/sony_custom_layers/pytorch/box_decode/box_decode_ort.py b/sony_custom_layers/pytorch/box_decode/box_decode_ort.py
new file mode 100644
index 0000000..2298531
--- /dev/null
+++ b/sony_custom_layers/pytorch/box_decode/box_decode_ort.py
@@ -0,0 +1,28 @@
+# -----------------------------------------------------------------------------
+# Copyright 2024 Sony Semiconductor Israel, Inc. All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# -----------------------------------------------------------------------------
+import torch
+from onnxruntime_extensions import onnx_op, PyCustomOpDef
+
+from .box_decode import _faster_rcnn_box_decode_impl
+from .box_decode_onnx import BOX_DECODE_ONNX_OP
+
+
+@onnx_op(op_type=BOX_DECODE_ONNX_OP,
+         inputs=[PyCustomOpDef.dt_float, PyCustomOpDef.dt_float, PyCustomOpDef.dt_float, PyCustomOpDef.dt_float],
+         outputs=[PyCustomOpDef.dt_float])
+def box_decode_ort(rel_codes, anchors, scale_factors, clip_window):
+    return _faster_rcnn_box_decode_impl(torch.as_tensor(rel_codes), torch.as_tensor(anchors),
+                                        torch.as_tensor(scale_factors), torch.as_tensor(clip_window))
diff --git a/sony_custom_layers/pytorch/object_detection/__init__.py b/sony_custom_layers/pytorch/nms/__init__.py
similarity index 99%
rename from sony_custom_layers/pytorch/object_detection/__init__.py
rename to sony_custom_layers/pytorch/nms/__init__.py
index f7af0c5..023dd7a 100644
--- a/sony_custom_layers/pytorch/object_detection/__init__.py
+++ b/sony_custom_layers/pytorch/nms/__init__.py
@@ -13,7 +13,6 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 # -----------------------------------------------------------------------------
-
 from .nms import multiclass_nms, NMSResults
 from .nms_with_indices import multiclass_nms_with_indices, NMSWithIndicesResults
 
diff --git a/sony_custom_layers/pytorch/object_detection/nms.py b/sony_custom_layers/pytorch/nms/nms.py
similarity index 98%
rename from sony_custom_layers/pytorch/object_detection/nms.py
rename to sony_custom_layers/pytorch/nms/nms.py
index d4f186a..09cdcec 100644
--- a/sony_custom_layers/pytorch/object_detection/nms.py
+++ b/sony_custom_layers/pytorch/nms/nms.py
@@ -20,7 +20,7 @@
 import torchvision    # noqa: F401 # needed for torch.ops.torchvision
 
 from sony_custom_layers.pytorch.custom_lib import register_op
-from sony_custom_layers.pytorch.object_detection.nms_common import _batch_multiclass_nms, SCORES, LABELS
+from .nms_common import _batch_multiclass_nms, SCORES, LABELS
 
 MULTICLASS_NMS_TORCH_OP = 'multiclass_nms'
 
diff --git a/sony_custom_layers/pytorch/object_detection/nms_common.py b/sony_custom_layers/pytorch/nms/nms_common.py
similarity index 100%
rename from sony_custom_layers/pytorch/object_detection/nms_common.py
rename to sony_custom_layers/pytorch/nms/nms_common.py
diff --git a/sony_custom_layers/pytorch/object_detection/nms_onnx.py b/sony_custom_layers/pytorch/nms/nms_onnx.py
similarity index 98%
rename from sony_custom_layers/pytorch/object_detection/nms_onnx.py
rename to sony_custom_layers/pytorch/nms/nms_onnx.py
index 25ad590..b52c5b4 100644
--- a/sony_custom_layers/pytorch/object_detection/nms_onnx.py
+++ b/sony_custom_layers/pytorch/nms/nms_onnx.py
@@ -15,9 +15,9 @@
 # -----------------------------------------------------------------------------
 import torch
 
+from sony_custom_layers.pytorch.custom_lib import get_op_qualname
 from .nms import MULTICLASS_NMS_TORCH_OP
 from .nms_with_indices import MULTICLASS_NMS_WITH_INDICES_TORCH_OP
-from ..custom_lib import get_op_qualname
 
 MULTICLASS_NMS_ONNX_OP = "Sony::MultiClassNMS"
 MULTICLASS_NMS_WITH_INDICES_ONNX_OP = "Sony::MultiClassNMSWithIndices"
diff --git a/sony_custom_layers/pytorch/object_detection/nms_ort.py b/sony_custom_layers/pytorch/nms/nms_ort.py
similarity index 100%
rename from sony_custom_layers/pytorch/object_detection/nms_ort.py
rename to sony_custom_layers/pytorch/nms/nms_ort.py
diff --git a/sony_custom_layers/pytorch/object_detection/nms_with_indices.py b/sony_custom_layers/pytorch/nms/nms_with_indices.py
similarity index 98%
rename from sony_custom_layers/pytorch/object_detection/nms_with_indices.py
rename to sony_custom_layers/pytorch/nms/nms_with_indices.py
index 2b52b3f..9901fef 100644
--- a/sony_custom_layers/pytorch/object_detection/nms_with_indices.py
+++ b/sony_custom_layers/pytorch/nms/nms_with_indices.py
@@ -19,7 +19,7 @@
 from torch import Tensor
 
 from sony_custom_layers.pytorch.custom_lib import register_op
-from sony_custom_layers.pytorch.object_detection.nms_common import _batch_multiclass_nms, SCORES, LABELS, INDICES
+from .nms_common import _batch_multiclass_nms, SCORES, LABELS, INDICES
 
 __all__ = ['multiclass_nms_with_indices', 'NMSWithIndicesResults']
 
diff --git a/sony_custom_layers/pytorch/tests/test_box_decode.py b/sony_custom_layers/pytorch/tests/test_box_decode.py
new file mode 100644
index 0000000..4b7b3b3
--- /dev/null
+++ b/sony_custom_layers/pytorch/tests/test_box_decode.py
@@ -0,0 +1,224 @@
+# -----------------------------------------------------------------------------
+# Copyright 2024 Sony Semiconductor Israel, Inc. All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# -----------------------------------------------------------------------------
+from typing import Optional
+
+import numpy as np
+import onnx.helper
+import pytest
+import torch
+import onnxruntime as ort
+from sony_custom_layers.util.test_util import exec_in_clean_process
+
+from sony_custom_layers.pytorch import FasterRCNNBoxDecode, load_custom_ops
+from sony_custom_layers.pytorch.tests.util import load_and_validate_onnx_model
+
+
+class TestBoxDecode:
+
+    def test_zero_offsets(self):
+        n_boxes = 100
+        anchors = self._generate_random_anchors(n_boxes, seed=1)
+        model = FasterRCNNBoxDecode(anchors=anchors, scale_factors=(1, 2, 3, 4), clip_window=(0, 0, 1, 1))
+        out = model(torch.zeros((2, n_boxes, 4), dtype=torch.float32))
+        assert torch.allclose(out, anchors)
+
+    @pytest.mark.parametrize('scale_factors', [(1., 1., 1., 1.), (1, 2, 3, 4), (1.1, 2.2, 0.5, 3.3)])
+    @pytest.mark.parametrize('cuda', [False, True])
+    def test_box_decode(self, scale_factors, cuda):
+        if cuda and not torch.cuda.is_available():
+            pytest.skip('cuda is not available')
+
+        n_boxes = 100
+        anchors = self._generate_random_anchors(n_boxes, img_size=(100, 200), seed=1)
+
+        v0, v1, v2, v3 = .5, 1., .2, 1.2
+        offsets = torch.empty((2, n_boxes, 4), dtype=torch.float32)
+        # we define encoded offsets that will yield boxes such that:
+        # np.log(boxes_h / anchors_h) = v2
+        # np.log(boxes_w / anchors_w) = v3
+        # (boxes_center_y - anchors_center_y) / anchors_h = v0
+        # (boxes_center_x - anchors_center_x) / anchors_w = v1
+        offsets[:, :, 0] = v0 * scale_factors[0]
+        offsets[:, :, 1] = v1 * scale_factors[1]
+        offsets[:, :, 2] = v2 * scale_factors[2]
+        offsets[:, :, 3] = v3 * scale_factors[3]
+
+        # disable clipping
+        model = FasterRCNNBoxDecode(anchors, scale_factors, clip_window=(-1000, -1000, 1000, 1000))
+        if cuda:
+            model = model.cuda()
+            offsets = offsets.cuda()
+        boxes = model(offsets)
+
+        boxes = boxes.cpu()
+        boxes_hw = boxes[..., 2:] - boxes[..., :2]
+        anchors_hw = anchors[..., 2:] - anchors[..., :2]
+        assert torch.allclose(boxes_hw[..., 0] / anchors_hw[..., 0], torch.exp(torch.as_tensor(v2)))
+        assert torch.allclose(boxes_hw[..., 1] / anchors_hw[..., 1], torch.exp(torch.as_tensor(v3)))
+        boxes_center = boxes[..., :2] + 0.5 * boxes_hw
+        anchors_center = anchors[..., :2] + 0.5 * anchors_hw
+        t = (boxes_center - anchors_center) / anchors_hw
+        assert torch.allclose(t[..., 0], torch.as_tensor(v0), atol=1e-5)
+        assert torch.allclose(t[..., 1], torch.as_tensor(v1), atol=1e-5)
+
+    @pytest.mark.parametrize('clip_window, normalize', [((-4, 1, 90, 110), False), ((-.04, .01, .9, 1.1), True)])
+    def test_clipping(self, clip_window, normalize):
+        scale_factors = (1, 2, 3, 4)
+        n_boxes = 3
+        anchors = self._generate_random_anchors(n_anchors=n_boxes, seed=1)
+        mul = 0.01 if normalize else 1
+        # (2, n_boxes, 4)
+        boxes = mul * torch.as_tensor(
+            [
+                [
+                    [-5, 5, 1, 12],    # clip y_min
+                    [85, -4, 90, 2],    # clip x_min
+                    [85, 95, 95, 100]    # clip y_max
+                ],
+                [
+                    [0, 85, 2, 115],    # clip x_max
+                    [-10, 115, -5, 120],    # y_min, y_max < 0, x_min, x_max > x_size
+                    [95, -10, 100, -5]    # y_min, y_max > y_size, x_min, x_max < 0
+                ]
+            ],
+            dtype=torch.float32)
+
+        rel_codes = self._encode_offsets(boxes, anchors, scale_factors=scale_factors)
+        model = FasterRCNNBoxDecode(anchors, scale_factors=scale_factors, clip_window=clip_window)
+        out = model(rel_codes)
+        exp_boxes = mul * torch.as_tensor(
+            [
+                [
+                    [-4, 5, 1, 12],    # clip y_min
+                    [85, 1, 90, 2],    # clip x_min
+                    [85, 95, 90, 100]    # clip y_max
+                ],
+                [
+                    [0, 85, 2, 110],    # clip x_max
+                    [-4, 110, -4, 110],    # y_min, y_max < 0, x_min, x_max > x_size
+                    [90, 1, 90, 1]    # y_min, y_max > y_size, x_min, x_max < 0
+                ]
+            ],
+            dtype=torch.float32)
+        assert torch.allclose(out, exp_boxes, atol=1e-6)
+
+    @pytest.mark.parametrize('dynamic_batch', [True, False])
+    @pytest.mark.parametrize('scale_factors, clip_window', [
+        [(1, 2, 3, 4), (0.1, 0.2, 0.9, 1.2)],
+        [(1.1, 2.2, 3.3, 0.5), (10, 20, 30, 40)],
+    ])
+    def test_onnx_export(self, dynamic_batch, scale_factors, clip_window, tmp_path):
+        n_boxes = 1000
+        anchors = self._generate_random_anchors(n_anchors=n_boxes, seed=1)
+        model = FasterRCNNBoxDecode(anchors, scale_factors=scale_factors, clip_window=clip_window)
+        path = str(tmp_path / 'box_decode.onnx')
+        self._export_onnx(model, n_boxes, path, dynamic_batch=dynamic_batch)
+
+        onnx_model = load_and_validate_onnx_model(path, exp_opset=1)
+
+        [box_decode_node] = list(onnx_model.graph.node)
+        assert box_decode_node.domain == 'Sony'
+        assert box_decode_node.op_type == 'FasterRCNNBoxDecode'
+        assert len(box_decode_node.input) == 4
+        assert len(box_decode_node.output) == 1
+        # sanity check that we extracted the input nodes correctly
+        anchors_input, scale_factors_input, clip_window_input = list(onnx_model.graph.initializer)
+        assert box_decode_node.input[1] == anchors_input.name
+        assert box_decode_node.input[2] == scale_factors_input.name
+        assert box_decode_node.input[3] == clip_window_input.name
+
+        def check_input(t, exp_tensor):
+            assert tuple(t.dims) == exp_tensor.shape
+            assert np.allclose(onnx.numpy_helper.to_array(t), exp_tensor)
+
+        check_input(anchors_input, anchors)
+        check_input(scale_factors_input, np.array(scale_factors))
+        check_input(clip_window_input, np.array(clip_window))
+
+    @pytest.mark.parametrize('dynamic_batch', [True, False])
+    @pytest.mark.parametrize('scale_factors, clip_window', [
+        [(1, 2, 3, 4), (0.1, 0.2, 0.9, 1.2)],
+        [(1.1, 2.2, 3.3, 0.5), (10, 20, 30, 40)],
+    ])
+    def test_ort(self, dynamic_batch, scale_factors, clip_window, tmp_path):
+        n_boxes = 1000
+        anchors = self._generate_random_anchors(n_anchors=n_boxes, seed=1)
+        model = FasterRCNNBoxDecode(anchors, scale_factors=scale_factors, clip_window=clip_window)
+        path = str(tmp_path / 'box_decode.onnx')
+        self._export_onnx(model, n_boxes, path, dynamic_batch=dynamic_batch)
+
+        batch = 5 if dynamic_batch else 1
+        boxes = self._generate_random_boxes(batch, n_boxes, seed=1)
+        rel_codes = self._encode_offsets(boxes, anchors, scale_factors)
+
+        torch_res = model(rel_codes)
+        so = load_custom_ops()
+
+        session = ort.InferenceSession(path, sess_options=so)
+        ort_res = session.run(output_names=None, input_feed={'rel_codes': rel_codes.numpy()})
+        assert np.allclose(torch_res, ort_res[0])
+
+        # run in a new process
+        code = f"""
+import onnxruntime as ort
+import numpy as np
+from sony_custom_layers.pytorch import load_custom_ops
+so = ort.SessionOptions()
+so = load_custom_ops(so)
+session = ort.InferenceSession('{path}', so)
+rel_codes = np.random.rand({batch}, {n_boxes}, 4).astype(np.float32)
+ort_res = session.run(output_names=None, input_feed={{'rel_codes': rel_codes}})
+assert ort_res[0].max() and ort_res[0].max() > ort_res[0].min()
+        """
+        exec_in_clean_process(code, check=True)
+
+    @staticmethod
+    def _generate_random_boxes(n_batches, n_boxes, seed=None):
+        if seed:
+            np.random.seed(seed)
+        boxes = np.empty((n_batches, n_boxes, 4))
+        boxes[..., :2] = np.random.uniform(low=0, high=.9, size=(n_batches, n_boxes, 2))
+        boxes[..., 2:] = np.random.uniform(low=boxes[..., :2], high=1., size=(n_batches, n_boxes, 2))
+        return torch.as_tensor(boxes, dtype=torch.float32)
+
+    @classmethod
+    def _generate_random_anchors(cls, n_anchors, img_size: Optional[tuple] = None, seed=None):
+        anchors = cls._generate_random_boxes(1, n_anchors, seed)[0]
+        if img_size:
+            anchors = anchors * torch.tensor(img_size + img_size, dtype=torch.float32)
+        return anchors
+
+    @staticmethod
+    def _encode_offsets(boxes, anchors, scale_factors):
+        anchors_hw = anchors[..., 2:] - anchors[..., :2]
+        boxes_hw = boxes[..., 2:] - boxes[..., :2]
+        boxes_center = boxes[..., :2] + boxes_hw / 2
+        anchors_center = anchors[..., :2] + anchors_hw / 2
+        thw = torch.log(boxes_hw / anchors_hw)
+        tyx = (boxes_center - anchors_center) / anchors_hw
+        t = torch.concat([tyx, thw], dim=-1)
+        return t * torch.as_tensor(scale_factors)
+
+    def _export_onnx(self, model, n_boxes, path, dynamic_batch: bool):
+        input_names = ['rel_codes']
+        output_names = ['decoded']
+        kwargs = {'dynamic_axes': {k: {0: 'batch'} for k in input_names + output_names}} if dynamic_batch else {}
+        torch.onnx.export(model,
+                          args=(torch.ones((1, n_boxes, 4))),
+                          f=path,
+                          input_names=input_names,
+                          output_names=output_names,
+                          **kwargs)
diff --git a/sony_custom_layers/pytorch/tests/object_detection/test_multiclass_nms.py b/sony_custom_layers/pytorch/tests/test_multiclass_nms.py
similarity index 88%
rename from sony_custom_layers/pytorch/tests/object_detection/test_multiclass_nms.py
rename to sony_custom_layers/pytorch/tests/test_multiclass_nms.py
index 0f02979..dbab493 100644
--- a/sony_custom_layers/pytorch/tests/object_detection/test_multiclass_nms.py
+++ b/sony_custom_layers/pytorch/tests/test_multiclass_nms.py
@@ -18,13 +18,13 @@
 import pytest
 import numpy as np
 import torch
-import onnx
 import onnxruntime as ort
 
 from sony_custom_layers.pytorch import multiclass_nms, multiclass_nms_with_indices, NMSResults, NMSWithIndicesResults
 from sony_custom_layers.pytorch import load_custom_ops
-from sony_custom_layers.pytorch.object_detection.nms_common import LABELS, INDICES, SCORES
-from sony_custom_layers.pytorch.tests.object_detection.test_nms_common import generate_random_inputs
+from sony_custom_layers.pytorch.nms.nms_common import LABELS, INDICES, SCORES
+from sony_custom_layers.pytorch.tests.test_nms_common import generate_random_inputs
+from sony_custom_layers.pytorch.tests.util import load_and_validate_onnx_model, check_tensor
 from sony_custom_layers.util.test_util import exec_in_clean_process
 
 
@@ -58,7 +58,7 @@ def _batch_multiclass_nms_mock(self, batch, n_dets, n_classes=20):
     @pytest.mark.parametrize('op, patch_pkg', [(torch.ops.sony.multiclass_nms, 'nms'),
                                                (torch.ops.sony.multiclass_nms_with_indices, 'nms_with_indices')])
     def test_torch_op(self, mocker, op, patch_pkg):
-        mock = mocker.patch(f'sony_custom_layers.pytorch.object_detection.{patch_pkg}._batch_multiclass_nms',
+        mock = mocker.patch(f'sony_custom_layers.pytorch.nms.{patch_pkg}._batch_multiclass_nms',
                             self._batch_multiclass_nms_mock(batch=3, n_dets=5))
         boxes, scores = generate_random_inputs(batch=3, n_boxes=10, n_classes=5)
         ret = op(boxes, scores, score_threshold=0.1, iou_threshold=0.6, max_detections=5)
@@ -89,7 +89,7 @@ def test_torch_op(self, mocker, op, patch_pkg):
                               (multiclass_nms_with_indices, NMSWithIndicesResults,
                                torch.ops.sony.multiclass_nms_with_indices, 'nms_with_indices')])
     def test_torch_op_wrapper(self, mocker, op, res_cls, torch_op, patch_pkg):
-        mock = mocker.patch(f'sony_custom_layers.pytorch.object_detection.{patch_pkg}._batch_multiclass_nms',
+        mock = mocker.patch(f'sony_custom_layers.pytorch.nms.{patch_pkg}._batch_multiclass_nms',
                             self._batch_multiclass_nms_mock(batch=3, n_dets=5))
         boxes, scores = generate_random_inputs(batch=3, n_boxes=20, n_classes=10)
         ret = op(boxes, scores, score_threshold=0.1, iou_threshold=0.6, max_detections=5)
@@ -114,6 +114,14 @@ def test_torch_op_wrapper(self, mocker, op, res_cls, torch_op, patch_pkg):
             assert torch.equal(ret.n_valid, ref_ret[4])
             assert ret.n_valid.dtype == torch.int64
 
+    @pytest.mark.parametrize('op', [multiclass_nms, multiclass_nms_with_indices])
+    @pytest.mark.parametrize('cuda', [True, False])
+    def test_full_op_sanity(self, op, cuda):
+        if cuda and not torch.cuda.is_available():
+            pytest.skip('cuda is not available')
+        boxes, scores = generate_random_inputs(batch=3, n_boxes=20, n_classes=10)
+        op(boxes, scores, score_threshold=0.1, iou_threshold=0.6, max_detections=5)
+
     @pytest.mark.parametrize('op', [multiclass_nms, multiclass_nms_with_indices])
     def test_empty_tensors(self, op):
         # empty inputs
@@ -137,10 +145,7 @@ def test_onnx_export(self, dynamic_batch, tmpdir_factory, with_indices):
         path = str(tmpdir_factory.mktemp('nms').join(f'nms{with_indices}.onnx'))
         self._export_onnx(onnx_model, n_boxes, n_classes, path, dynamic_batch=dynamic_batch, with_indices=with_indices)
 
-        onnx_model = onnx.load(path)
-        onnx.checker.check_model(onnx_model, full_check=True)
-        opset_info = list(onnx_model.opset_import)[1]
-        assert opset_info.domain == 'Sony' and opset_info.version == 1
+        onnx_model = load_and_validate_onnx_model(path, exp_opset=1)
 
         nms_node = list(onnx_model.graph.node)[0]
         assert nms_node.domain == 'Sony'
@@ -155,24 +160,17 @@ def test_onnx_export(self, dynamic_batch, tmpdir_factory, with_indices):
         assert len(nms_node.input) == 2
         assert len(nms_node.output) == 4 + int(with_indices)
 
-        def check_tensor(onnx_tensor, exp_shape, exp_type):
-            tensor_type = onnx_tensor.type.tensor_type
-            shape = [d.dim_value if d.dim_value else d.dim_param for d in tensor_type.shape.dim]
-            exp_shape = ['batch' if dynamic_batch else 1] + exp_shape
-            assert shape == exp_shape
-            assert tensor_type.elem_type == exp_type
-
-        check_tensor(onnx_model.graph.input[0], [10, 4], torch.onnx.TensorProtoDataType.FLOAT)
-        check_tensor(onnx_model.graph.input[1], [10, 5], torch.onnx.TensorProtoDataType.FLOAT)
+        check_tensor(onnx_model.graph.input[0], [10, 4], torch.onnx.TensorProtoDataType.FLOAT, dynamic_batch)
+        check_tensor(onnx_model.graph.input[1], [10, 5], torch.onnx.TensorProtoDataType.FLOAT, dynamic_batch)
         # test shape inference that is defined as part of onnx op
-        check_tensor(onnx_model.graph.output[0], [max_dets, 4], torch.onnx.TensorProtoDataType.FLOAT)
-        check_tensor(onnx_model.graph.output[1], [max_dets], torch.onnx.TensorProtoDataType.FLOAT)
-        check_tensor(onnx_model.graph.output[2], [max_dets], torch.onnx.TensorProtoDataType.INT32)
+        check_tensor(onnx_model.graph.output[0], [max_dets, 4], torch.onnx.TensorProtoDataType.FLOAT, dynamic_batch)
+        check_tensor(onnx_model.graph.output[1], [max_dets], torch.onnx.TensorProtoDataType.FLOAT, dynamic_batch)
+        check_tensor(onnx_model.graph.output[2], [max_dets], torch.onnx.TensorProtoDataType.INT32, dynamic_batch)
         if with_indices:
-            check_tensor(onnx_model.graph.output[3], [max_dets], torch.onnx.TensorProtoDataType.INT32)
-            check_tensor(onnx_model.graph.output[4], [1], torch.onnx.TensorProtoDataType.INT32)
+            check_tensor(onnx_model.graph.output[3], [max_dets], torch.onnx.TensorProtoDataType.INT32, dynamic_batch)
+            check_tensor(onnx_model.graph.output[4], [1], torch.onnx.TensorProtoDataType.INT32, dynamic_batch)
         else:
-            check_tensor(onnx_model.graph.output[3], [1], torch.onnx.TensorProtoDataType.INT32)
+            check_tensor(onnx_model.graph.output[3], [1], torch.onnx.TensorProtoDataType.INT32, dynamic_batch)
 
     @pytest.mark.parametrize('dynamic_batch', [True, False])
     @pytest.mark.parametrize('with_indices', [True, False])
diff --git a/sony_custom_layers/pytorch/tests/object_detection/test_nms_common.py b/sony_custom_layers/pytorch/tests/test_nms_common.py
similarity index 97%
rename from sony_custom_layers/pytorch/tests/object_detection/test_nms_common.py
rename to sony_custom_layers/pytorch/tests/test_nms_common.py
index bf02da4..566a3df 100644
--- a/sony_custom_layers/pytorch/tests/object_detection/test_nms_common.py
+++ b/sony_custom_layers/pytorch/tests/test_nms_common.py
@@ -20,7 +20,7 @@
 import torch
 from torch import Tensor
 
-from sony_custom_layers.pytorch.object_detection import nms_common
+from sony_custom_layers.pytorch.nms import nms_common
 
 
 def generate_random_inputs(batch: Optional[int], n_boxes, n_classes, seed=None):
@@ -84,7 +84,7 @@ def test_image_multiclass_nms(self, mocker, max_detections, mock_tv_op):
         score_threshold = 0.11
         iou_threshold = 0.61
         if mock_tv_op:
-            nms_mock = mocker.patch('sony_custom_layers.pytorch.object_detection.nms_common._nms_with_class_offsets',
+            nms_mock = mocker.patch('sony_custom_layers.pytorch.nms.nms_common._nms_with_class_offsets',
                                     Mock(return_value=Tensor([4, 5, 1, 0, 2, 3]).to(torch.int64)))
         ret, ret_valid_dets = nms_common._image_multiclass_nms(boxes,
                                                                scores,
@@ -159,7 +159,7 @@ def test_batch_multiclass_nms(self, mocker):
         ret_valid_dets = Tensor([[5], [4], [3]])
         # each time the function is called, next value in the list returned
         images_ret = [(img_nms_ret[i], ret_valid_dets[i]) for i in range(3)]
-        mock = mocker.patch('sony_custom_layers.pytorch.object_detection.nms_common._image_multiclass_nms',
+        mock = mocker.patch('sony_custom_layers.pytorch.nms.nms_common._image_multiclass_nms',
                             Mock(side_effect=lambda *args, **kwargs: images_ret.pop(0)))
 
         res, n_valid = nms_common._batch_multiclass_nms(input_boxes,
diff --git a/sony_custom_layers/pytorch/tests/util.py b/sony_custom_layers/pytorch/tests/util.py
new file mode 100644
index 0000000..fc19a8b
--- /dev/null
+++ b/sony_custom_layers/pytorch/tests/util.py
@@ -0,0 +1,32 @@
+# -----------------------------------------------------------------------------
+# Copyright 2024 Sony Semiconductor Israel, Inc. All rights reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# -----------------------------------------------------------------------------
+import onnx
+
+
+def load_and_validate_onnx_model(path, exp_opset):
+    onnx_model = onnx.load(path)
+    onnx.checker.check_model(onnx_model, full_check=True)
+    opset_info = list(onnx_model.opset_import)[1]
+    assert opset_info.domain == 'Sony' and opset_info.version == exp_opset
+    return onnx_model
+
+
+def check_tensor(onnx_tensor, exp_shape, exp_type, dynamic_batch: bool):
+    tensor_type = onnx_tensor.type.tensor_type
+    shape = [d.dim_value if d.dim_value else d.dim_param for d in tensor_type.shape.dim]
+    exp_shape = ['batch' if dynamic_batch else 1] + exp_shape
+    assert shape == exp_shape
+    assert tensor_type.elem_type == exp_type