1126
需用時?02:15
只需4組數據,還原你的購物模式

再也別亂扔信用卡小票了。在1月30日的《科學》雜志上,來自麻省理工學院媒體實驗室、丹麥奧爾胡斯大學和新澤西羅格斯大學的幾名科學家發表了一篇論文,證明了僅需4組較精確的支付時間、支付商家和交易數額,就基本可以確定持卡人的所有消費記錄,準確率可達90%;甚至僅僅有較模糊的支付數據,也很有可能泄露消費歷史。[1]

研究者們取得了一個匿名信用卡消費數據集,其中包括了來自某個經合組織國家的110萬人在1萬個商家的消費記錄。這份數據集很簡單,只有用戶ID、支付數額、精確到天的支付時間和精確到商家的地點,而沒有明顯的身份信息,沒有電話號碼,沒有姓名,也沒有住址。但是即便如此,通過對消費空間、時間和消費能力的對比,他們還是能夠將消費記錄和某個用戶ID對應起來。

左圖表示了用戶ID為7abc1a23的持卡人按照時間順序排列的消費行為。每筆消費的金額被歸到不同的區間。圖片來源:研究論文

這意味著,只要知道你的幾次信用卡交易具體信息,就可以知道你的所有信用卡消費記錄。這可能不是件新鮮事,畢竟信用卡數據早已用于個人信用評價、欺詐檢測和購物模式分析了。實際上,信用卡公司可能比你還早就知道你的信用卡被盜用——每個人都有獨特的購物模式。

但這項研究揭示了一種新的危險——我們往往認為在一大批匿名數據中,很難將特定用戶與ID對應起來,但這項研究則證實并非如此。個人消費的獨特性比我們以直覺得出的結論要高得多。

值得注意的是,女性用戶比男性用戶更容易識別,高收入用戶也比中低收入用戶更容易被識別。這份數據集還算全面,因此也可以認為在真實世界中,我們的消費記錄也并不安全——這份數據集中,24%用戶為女性,76%用戶為男性;39%用戶收入水平低于收入中值,35%用戶收入水平在中值和2.5倍中值之間,還有22%高于2.5倍中值。

畢竟在美國,有60%的交易是通過信用卡來完成的,而用途各種各樣,從購買日常用品到支付醫療費用等等不一而足。消費記錄能夠展現許多信息,而它現在看起來很容易獲得。甚至,當支付信息更模糊——例如支付時間范圍在半個月之內——時,也有較高的把握可以篩選出使用者的記錄。

這篇論文的第一作者是麻省理工學院媒體實驗室的伊芙-亞歷山大·德蒙鳩依(Yves-Alexandre de Montjoye),他一直在研究人類行為數據和個人隱私的沖突。在2013年,他和同事們發表過一篇論文,證明了因為運動模式的可預見性,只需要知道同一部手機的四個位置點和相應時間,就可以以95%的準確率定位一個用戶。[2]一年后,他的另一篇論文表明,通過移動手機通話記錄,包括通話時間、地點、時長、聯系頻率等數據,可以以較高的準確率預測手機用戶的性格特質。[3]為了避免網絡對個人的侵犯,他還開發了一種叫做OpenPDS的服務,幫助人們保護那些自己不想泄露的個人數據——其中,PDS是Personal Data Store的縮寫。

他可能是在這個以方便為宗旨的信息世界中,為數不多的隱私捍衛戰士。但他的努力也許像是堂吉訶德對風車發起的沖鋒:在諸多收集行為數據成為標準行為的今天,人們的身份信息基本上昭然若揭。畢竟,就像同在研究網絡隱私的普林斯頓大學副教授而阿爾文德·納拉亞南(Arvind Narayanan)所說的那樣,不泄露隱私是“在算法上不可能”的。(編輯:球藻怪)

參考文獻:

  1. Unique in the shopping mall: On the reidentifiability of credit card metadata?Yves-Alexandre de Montjoye,?Laura Radaelli,?Vivek Kumar Singh,?and?Alex “Sandy” Pentland?Science?30 January 2015:?536-539.
  2. de Montjoye, Yves-Alexandre, César A. Hidalgo, Michel Verleysen, and Vincent D. Blondel. "Unique in the Crowd: The privacy bounds of human mobility."Scientific reports?3 (2013).
  3. de Montjoye, Yves-Alexandre, Jake Kendall, and Cameron F. Kerry. "Enabling Humanitarian Use of Mobile Phone Data." (2014).

文章題圖:shutterstock友情提供

The End

發布于2015-02-01, 本文版權屬于果殼網(guokr.com),禁止轉載。如有需要,請聯系果殼

我的評論

猛犸

果殼作者

pic
    pk10稳赢公式反着压