エンジニアのひとりごと

興味あること:機械学習,量子コンピュータ,たまに競馬

Learning Active Learning from Data

Learning Active Learning from Data

・どんな論文
Active Learning(AL)に対してデータ・ドリブンな新しいアプローチを提案
クエリの選択を回帰問題として定式化した

・先行研究に比べて良いところ
以下の二つの先行研究の欠点を改善している.
 *既にある人の手で設計されたヒューリスティックな方法の組み合わせを超えることができないこと
 *ラベル付けされているデータの不足からくる自信のない分類の性能についての信頼できる調査が必要であること

・手法の肝
 回帰モデルで定式化するのだが,使う特徴量はシンプルなものなので,この論文では人工データに対して
実験したけど,他のデータ群に対しても流用できそうな感じ.

・今後の課題は?
 多クラス分類やbatch-mode ALの問題への取り組み.
 転移学習みたいなことをしたい
 強化学習の利用
 などが挙げられていた

・感想
Active Learningというものを初めて知った.
ざっくりいうと
ラベル付けされてないデータがあったときに
ラベル付けがないデータのどれをラベル付けしたら
効率よく精度よくクラスタリングできるのかということを考えて
効果的なデータにラベル付けをしよう
というようなものらしい

まあ,全てのデータにラベル付けされてるわけでないし,
ラベル付けのコストなかなかやばそうだし
ALみたいな発想はあって当然だなぁーと

ざっくりとabst,intro,related work,conclusionしか読んでないので
手法の細かいところは追えてないですが...今日のところはこの辺で