Jubatusのjubaclassifierを使ったマルウェア分類のサンプルです。 以下の論文のデータセットを使用します。
Automatic Analysis of Malware Behavior using Machine Learning http://pi1.informatik.uni-mannheim.de/malheur/
csvと対応するMIST形式のファイルをダウンロードします。
http://pi1.informatik.uni-mannheim.de/malheur/
$ cd word_ngram_plugin
$ ./waf configure
$ ./waf
$ sudo ./waf install
$ ./waf configure
$ ./waf
libword_ngramプラグインのパスをconfig.jsonに指定する。
$ jubaclassifier --configpath config.json
第一引数にconfig.json、第二引数にcsv、第三引数にcsvに対応するMIST形式のファイルが格納されたディレクトリを指定します。
$ ./build/ml_train ./config.json /path_to/malheur/reference/reference.csv /path_to/malheur/reference/refset
引数は学習と同様です。 分類結果は標準出力に1ファイル1行ごとにJSONフォーマットで出力されます。
$ ./build/ml_classify ./config.json /path_to/malheur/2009xxxx.csv /path/to/malheur/2009xxxx_mist_dir