Proc CCS ’15 (ACM SIGSAC Conference on Computer and Communications Security), pp. 1310-1321.
http://dl.acm.org/citation.cfm?doid=2810103.2813687

Deep learningのデータを一カ所に集めるとプライバシーの問題が生ずる。データを分散し、パラメータだけをシェアすることでセキュリティが大幅に向上する。さらにDifferential Privacyも用いることで、さらにセキュリティを向上できる。私も2016年の夏には思いついたのだが、今年に入ってこの論文、すなわちネタかぶりを指摘されました。残念。

各データ側からパラメータサーバへの値のアップロードおよび逆のダウンロードは、影響が多いものだけを選んで送る。1%だけ送れば全部送る場合の90%以上の精度が得られる。Differential Privacyによってさらにプライバシー保護を向上させることもできる。

関連情報:

グーグル、スマホを利用した機械学習モデルの改良をテスト中
https://japan.cnet.com/article/35099499/

Federated Learning: Collaborative Machine Learning without Centralized Training Data
https://research.googleblog.com/2017/04/federated-learning-collaborative.html

カテゴリー: Blog