Skip to content

Evaluating Model Robustness to Dataset Shift #48

@nocotan

Description

@nocotan

一言でいうと

データセットシフトを内包したデータの取得が難しいためにロバスト性の評価が難しい中で,単一のデータセットのみでそうした評価を可能にするフレームワークを提案.

論文リンク

https://arxiv.org/pdf/2010.15100.pdf

著者/所属機関

Adarsh Subbaswamy et al.
(Johns Hopkins University)

投稿日付(yyyy/MM/dd)

2020/10/28

概要

データセットシフトに対するモデルのロバスト性を評価するためには,そうした設定のデータセットが必要になるが,タスクに応じてそのようなデータセットを作ることは容易ではない.

そこで論文では,単一のデータセットだけを用いてそうしたロバスト性の評価を行うフレームワークを提案する.

提案手法では,元々のデータセットからありうる不確実な集合を作り,その集合の中の最悪ケースに該当する分布に対してモデルの評価をおこなう.このような枠組みはdistributionally robust optimizationと呼ばれる.

Instead of examining a model’s performance only on the (empirical) test distribution
associated with a particular validation dataset, DRO defines an uncertainty set of possible test distributions
and considers the model’s performance on the worst-case distribution chosen from this set.

Screen Shot 2021-03-10 at 1 46 38

新規性・差分

  • 単一のデータセットだけからデータセットシフトに対するモデルのロバスト性を評価する手法を提案
  • 周辺分布または同時分布を考慮していた既存のDRO手法を一般化

手法

確率変数を,不変のZ,可変のW,残りのVに分割することで,確率分布を以下のように分解できる:

Screen Shot 2021-03-10 at 2 06 23

これは既存の様々なデータセットシフトの問題を一般化する(例えばZを空集合,W=Xとすると共変量シフトになる).

データセットシフト下での性能の定量化

ありうるシフトされたターゲット分布のuncertainty setを以下のように定義する.

Screen Shot 2021-03-10 at 2 08 46

ここで興味があるのは以下の期待損失

Screen Shot 2021-03-10 at 2 10 52

Screen Shot 2021-03-10 at 1 47 34

最悪ケース評価

Screen Shot 2021-03-10 at 2 12 18

Screen Shot 2021-03-10 at 1 47 51

結果

Screen Shot 2021-03-10 at 1 48 23

Screen Shot 2021-03-10 at 1 48 40

Screen Shot 2021-03-10 at 1 48 58

Screen Shot 2021-03-10 at 1 49 15

コメント

Metadata

Metadata

Assignees

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions