China Daily Homepage
中文網首頁
時政
資訊
C財經
生活
視頻
專欄
原創
觀天下
地方

登錄

注冊

中國日報網 >> 生活滾動

移動新媒體

China Daily Homepage
中文網首頁
時政
資訊
C財經
生活
視頻
專欄
漫畫
原創
觀天下
地方

中國日報網 >> 生活滾動

你的隱私，大數據怎知道

來源：新華網 2023-01-12 09:54

來源：

新華網

2023-01-12 09:54　

分享到

分享到微信

　　在網絡上，每個人都會或多或少，或主動或被動地泄露某些碎片信息。這些信息被大數據挖掘，就存在隱私泄露的風險，引發信息安全問題。面對洶涌而來的5G時代，大眾對自己的隱私保護感到越來越迷茫，甚至有點不知所措。那么，你的隱私，大數據是怎么知道的呢？大家又該如何自我保護呢？

　　1.“已知、未知”大數據都知道

　　大數據時代，每個人都有可能成為安徒生童話中那個“穿新衣”的皇帝。在大數據面前，你說過什么話，它知道；你做過什么事，它知道；你有什么愛好，它知道；你生過什么病，它知道；你家住哪里，它知道；你的親朋好友都有誰，它也知道……總之，你自己知道的，它幾乎都知道，或者說它都能夠知道，至少可以說，它遲早會知道！

　　甚至，連你自己都不知道的事情，大數據也可能知道。例如，它能夠發現你的許多潛意識習慣：集體照相時你喜歡站哪里呀，跨門檻時喜歡先邁左腳還是右腳呀，你喜歡與什么樣的人打交道呀，你的性格特點都有什么呀，哪位朋友與你的觀點不相同呀……

　　再進一步說，今后將要發生的事情，大數據還是有可能知道。例如，根據你“飲食多、運動少”等信息，它就能夠推測出，你可能會“三高”。當你與許多人都在獨立地購買感冒藥時，大數據就知道：流感即將暴發了！其實，大數據已經成功地預測了包括世界杯比賽結果、股票的波動、物價趨勢、用戶行為、交通情況等。

　　當然，這里的“你”并非僅僅指“你個人”，包括但不限于，你的家庭，你的單位，你的民族，甚至你的國家等。至于這些你知道的、不知道的或今后才知道的隱私信息，將會把你塑造成什么，是英雄還是狗熊？這卻難以預知。

　　2.數據挖掘就像“垃圾處理”

　　什么是大數據？形象地說，所謂大數據，就是由許多千奇百怪的數據，雜亂無章地堆積在一起。例如，你在網上說的話、發的微信、收發的電子郵件等，都是大數據的組成部分。在不知道的情況下被采集的眾多信息，例如被馬路攝像頭獲取的視頻、手機定位系統留下的路線圖、駕車的導航信號等被動信息，也都是大數據的組成部分。還有，各種傳感器設備自動采集的有關溫度、濕度、速度等萬物信息，仍然是大數據的組成部分。總之，每個人、每種通信和控制類設備，無論它是軟件還是硬件，其實都是大數據之源。

　　大數據利用了一種名叫“大數據挖掘”的技術，采用諸如神經網絡、遺傳算法、決策樹、粗糙集、覆蓋正例排斥反例、統計分析、模糊集等方法挖掘信息。大數據挖掘的過程，可以分為數據收集、數據集成、數據規約、數據清理、數據變換、挖掘分析、模式評估、知識表示等八大步驟。

　　不過，這些聽起來高大上的大數據產業，幾乎等同于垃圾處理和廢品回收。

　　這并不是在開玩笑。廢品收購和垃圾收集，可算作“數據收集”；將廢品和垃圾送往集中處理場所，可算作“數據集成”；將廢品和垃圾初步分類，可算作“數據規約”；將廢品和垃圾適當清潔和整理，可算作“數據清理”；將破沙發拆成木、鐵、布等原料，可算作“數據變換”；認真分析如何將這些原料賣個好價錢，可算作“數據分析”；不斷總結經驗，選擇并固定上下游賣家和買家，可算作“模式評估”；最后，把這些技巧整理成口訣，可算作“知識表示”。

　　再看原料結構。大數據具有異構特性，就像垃圾一樣千奇百怪。如果非要在垃圾和大數據之間找出本質差別的話，那就在于垃圾是有實體的，再利用的次數有限；而大數據是虛擬的，可以反復處理，反復利用。例如，大數據專家能將數據（廢品）中挖掘出的旅客出行規律交給航空公司，將某群體的消費習慣賣給百貨商店等。總之，大數據專家完全可以“一菜多吃”，反復利用，而且時間越久，價值越大。換句話說，大數據是很值錢的“垃圾”。

　　3.大數據挖掘永遠沒有盡頭

　　大數據挖掘，雖然能從正面創造價值，但是也有其負面影響，即存在泄露隱私的風險。隱私是如何被泄露的呢？這其實很簡單，我們先來分解一下“人肉搜索”是如何侵犯隱私的吧！

　　一大群網友，出于某種目的，利用自己的一切資源渠道，盡可能多地收集當事人或物的所有信息；然后，將這些信息按照自己的目的提煉成新信息，反饋到網上與別人分享。這就完成了第一次“人肉迭代”。

　　接著，大家又在第一次人肉迭代的基礎上，互相取經，再接再厲，交叉重復進行信息的收集、加工、整理等工作，于是，便誕生了第二次“人肉迭代”。如此循環往復，經過多次不懈迭代后，當事人或物的畫像就躍然紙上了。如果構成“滿意畫像”的素材確實已經證實，至少主體是事實，“人肉搜索”就成功了。

　　幾乎可以斷定，只要參與“人肉搜索”的網友足夠多，時間足夠長，大家的毅力足夠強，那么任何人都可能無處遁形。

　　其實，所謂的大數據挖掘，在某種意義上說，就是由機器自動完成的特殊“人肉搜索”而已。只不過，這種搜索的目的，不再限于抹黑或頌揚某人，而是有更加廣泛的目的，例如，為商品銷售者尋找最佳買家、為某類數據尋找規律、為某些事物之間尋找關聯等。總之，只要目的明確，那么，大數據挖掘就會有用武之地。

　　如果將“人肉搜索”與大數據挖掘相比，網友被電腦所替代；網友們收集的信息，被數據庫中的海量異構數據所替代；網友尋找各種人物關聯的技巧，被相應的智能算法替代；網友們相互借鑒、彼此啟發的做法，被各種同步運算所替代。

　　各次迭代過程仍然照例進行，只不過機器的迭代次數更多，速度更快，每次迭代其實就是機器的一次“學習”過程。網友們的最終“滿意畫像”，被暫時的挖掘結果所替代。之所以說是暫時，那是因為對大數據挖掘來說，永遠沒有盡頭，結果會越來越精準，智慧程度會越來越高，用戶只需根據自己的標準，隨時選擇滿意的結果就行了。

　　當然，除了相似性外，“人肉搜索”與“大數據挖掘”肯定也有許多重大的區別。例如，機器不會累，它們收集的數據會更多、更快，數據的渠道來源會更廣泛。總之，網友的“人肉搜索”，最終將輸給機器的“大數據挖掘”。

　　4.隱私保護與數據挖掘“危”“機”并存

　　必須承認，就當前的現實情況來說，大數據隱私挖掘的“殺傷力”，已經遠遠超過了大數據隱私保護的能力；換句話說，在大數據挖掘面前，當前人類有點不知所措。這確實是一種意外。自互聯網誕生以后，在過去幾十年，人們都不遺余力地將碎片信息永遠留在網上。其中的每個碎片雖然都完全無害，可誰也不曾意識到，至少沒有刻意去關注，當眾多無害碎片融合起來，竟然后患無窮！

　　不過，大家也沒必要過于擔心。在人類歷史上，類似的被動局面已經出現過不止一次了。從以往的經驗來看，隱私保護與數據挖掘之間總是像“走馬燈”一樣輪換的——人類通過對隱私的“挖掘”，獲得空前好處，產生了更多需要保護的“隱私”，于是，不得不再回過頭來，認真研究如何保護這些隱私。當隱私積累得越來越多時，“挖掘”它們就會變得越來越有利可圖，于是，新一輪的“挖掘”又開始了。歷史地來看，人類在自身隱私保護方面，整體處于優勢地位，在網絡大數據挖掘之前，“隱私泄露”并不是一個突出的問題。

　　但是，現在人類需要面對一個棘手的問題——對過去遺留在網上的海量碎片信息，如何進行隱私保護呢？單靠技術，顯然不行，甚至還會越“保護”，就越“泄露隱私”。

　　因此，必須多管齊下。例如從法律上，禁止以“人肉搜索”為目的的大數據挖掘行為；從管理角度，發現惡意的大數據搜索行為，對其進行必要的監督和管控。另外，在必要的時候，還需要重塑“隱私”概念，畢竟“隱私”本身就是一個與時間、地點、民族、文化等有關的約定俗成的概念。

　　對于個人的網絡行為而言，在大數據時代，應該如何保護隱私呢？或者說，至少不要把過多包含個人隱私的碎片信息遺留在網上呢？答案只有兩個字：匿名！只要做好匿名工作，就能在一定程度上，保護好隱私了。也就是說，在大數據技術出現之前，隱私就是把“私”藏起來，個人身份可公開，而大數據時代，隱私保護則是把“私”公開（實際上是沒法不公開），而把個人身份隱藏起來，即匿名。（作者：楊義先、鈕心忻，均為北京郵電大學教授）

（楊義先、鈕心忻）

【責任編輯：徐子茗】

COMPO

WS63bf68ffa3102ada8b22acf2

http://jingzhi68.com/a/202301/12/WS63bf68ffa3102ada8b22acf2.html

專題

@國務院我為政府工作報告提建議

澳門回歸祖國25周年

世界互聯網大會烏鎮峰會

黨旗在基層一線高高飄揚

最熱新聞

山西太原：歌聲中迎接新年
三峽移民生活紀實
市場監管總局印發《橫向經營者集中審查指引》
證監會：將香港互認基金客地銷售比例放寬至80%
冬至時節話養生專家解讀健康指南
中菲執法部門聯手遣返4名綁架犯罪嫌疑人
“一九”冷如“三九” 我國從南到北多地氣溫將持續刷新低
菲1架C-208型機非法侵入中國黃巖島領空中國海警局：依法予以警告驅離

精彩推薦

戰爭陰云籠罩中東

關于我們 | 聯系我們

首頁
時政
資訊
財經
生活
視頻
專欄
漫畫
獨家
招聘

地方頻道：
北京
天津
河北
山西
遼寧
吉林
黑龍江
上海
江蘇
浙江
福建
江西
山東
河南
湖北
湖南
廣東
廣西
海南
重慶
四川
貴州
云南
西藏
陜西
新疆
深圳

友情鏈接：
人民網
新華網
中國網
國際在線
央視網
中國青年網
中國經濟網
中國臺灣網
中國西藏網
央廣網
光明網
中國軍網
中國新聞網
人民政協網
法治網

違法和不良信息舉報
互聯網新聞信息服務許可證10120170006
信息網絡傳播視聽節目許可證0108263號
京公網安備11010502032503號
京網文[2011]0283-097號
京ICP備13028878號-6

中國日報網版權說明：凡注明來源為“中國日報網：XXX（署名）”，除與中國日報網簽署內容授權協議的網站外，其他任何網站或單位未經允許禁止轉載、使用，違者必究。如需使用，請與010-84883777聯系；凡本網注明“來源：XXX（非中國日報網）”的作品，均轉載自其它媒體，目的在于傳播更多信息，其他媒體如需轉載，請與稿件來源方聯系，如產生任何問題與本網無關。

版權保護：本網登載的內容（包括文字、圖片、多媒體資訊等）版權屬中國日報網（中報國際文化傳媒（北京）有限公司）獨家所有使用。未經中國日報網事先協議授權，禁止轉載使用。給中國日報網提意見：rx@chinadaily.com.cn

首頁
時政
資訊
財經
文化
漫畫
視頻
地方

中文 | English

人摸人人人澡人人超碰,4虎四虎永久在线精品免费,女人和拘做受全程看视频,韩国无码无遮挡在线观看不卡

你的隱私，大數據怎知道

在網絡上，每個人都會或多或少，或主動或被動地泄露某些碎片信息。幾乎可以斷定，只要參與“人肉搜索”的網友足夠多，時間足夠長，大家的毅力足夠強，那么任何人都可能無處遁形。

你的隱私，大數據怎知道