1分で読めます
| リンク

データが匿名で保管されていると言われると、安心しきってしまいがちです。ある研究者は、データが参照する人物を特定するのは非常に簡単だと結論付けました。実際、アメリカ人の最大99.8%を再特定できたのです。彼らはニューサイエンティスト誌に、その解決策を説明しました。
データの匿名化は不可逆的なはずなのに、インペリアル・カレッジ・ロンドンのイヴ=アレクサンドル・ド・モンジョワ氏らの調査によると、そのプロセスをリバースエンジニアリングするのは比較的容易だという。これは、ある人物に関するデータが多ければ多いほど、その人物だけが条件に合致する可能性が高いためだ。しかし、すべてが失われたわけではない。新たな技術がプライバシー保護の取り組みに役立つだろうと、ド・モンジョワ氏は説明する。「私たちは、正しい人物を再識別する可能性を評価するための機械学習モデルを開発しました。データセットを解析した結果、米国では年齢、性別、婚姻状況など15の特性だけで、事実上あらゆる匿名化データセットにおいて、アメリカ人の99.98%を再識別できることが分かりました。」
チェックしてください:匿名データはそれほど匿名ではありません