大地资源网视频在线观看新浪,日本春药精油按摩系列,成人av骚妻潮喷,国产xxxx搡xxxxx搡麻豆

正在閱讀:盲目迷戀與誤用或將導致大數據“失寵”

盲目迷戀與誤用或將導致大數據“失寵”

2017-10-19 10:15:39來源:網易科技 編輯:一不做 關鍵詞:大數據智能控制數據挖掘閱讀量:30985

導讀:國外媒體Slate刊文指出,“大數據(Big Data)”一詞已經變得沒有以往那么紅火了,為什么會這樣呢?
  【中國智能制造網 行業動態】國外媒體Slate刊文指出,“大數據(Big Data)”一詞已經變得沒有以往那么紅火了,為什么會這樣呢?“大數據”的問題并不在于數據或者大數據本身很糟糕,而是在于盲目迷戀數據,不加批判地使用,那會引發災難。數據也不一定完全反映你想要了解的事情的實際情況。
 
  以下是文章主要內容:
 
  5年前——2012年2月——《紐約時報》刊文高呼人類的一個新紀元的到來:“大數據時代”。
 
  該文章告訴我們,社會將開始發生一場革命,在這場革命中,海量數據的收集與分析將會改變人們生活的幾乎每一個方面。
 
  數據分析不再局限于電子數據表和回歸分析:超級計算的到來,伴隨著可持續記錄數據并將數據傳送到云端的聯網傳感器的不斷普及,意味著邁克爾·劉易斯(Michael Lewis)2003年的棒球書籍《Moneyball》所描述的那種先進數據分析有望被應用于各行各業,從商業到學術,再到醫療和兩性關系。
 
  不僅如此,的數據分析軟件還有助于鑒定完全意想不到的相關性,比如貸款方用盡額度和他債務違約的可能性之間的關系。這勢必將會催生會改變我們思考幾乎一切事物的新穎見解。
 
  《紐約時報》并不是個得出這一結論的企業機構:它的文章引用了麥肯錫咨詢公司2011年的一份重大報告,其觀點也得到了2012年瑞士達沃斯世界經濟論壇題為“大數據,大影響”的官方報告的支持。但這種宣言仿佛就是標志大數據時代開啟的里程碑。
 
  在之后的一個月里,巴拉克·奧巴馬(Barack Obama)的白宮成了一個2億美元的國家大數據項目,瘋狂熱潮隨即襲來:學術機構、非盈利組織、政府和企業都爭相去探究“大數據”究竟是什么,他們可以如何好好利用它。
 
  事實證明,這種瘋狂沒有持續很長時間。5年后,數據在我們的日常生活中扮演重要很多的角色,但大數據一詞已經不再流行——甚至讓人覺得有些討厭。我們被允諾的那場革命究竟發生了什么呢?數據、分析技術和算法現在又在往什么方向發展呢?這些問題值得回頭去思考。
 
  科技咨詢公司Gartner在它2015年相當有名的“技術成熟度曲線”報告中不再使用“大數據”一次,之后該詞再也沒有回歸。該公司澄清道,這并不是因為企業放棄挖掘巨量數據集獲得洞見的概念。而是因為那種做法已經變得廣為流行,以至于它不再符合“新興技術”的定義。
 
  大數據幫助驅動我們的動態消息、Netflix視頻推薦、自動化股票交易、自動校正功能、健康跟蹤設備等不計其數的工具背后的算法。但我們現在不大使用大數據一詞了——我們只是將它稱作數據。我們開始將數據集能夠包含無數的觀察結果,先進軟件能夠檢測當中的趨勢當做理所當然的事情。
 
  大數據引發的嚴重錯誤
 
  雖然該詞仍有被使用,但它更多地帶有一種不好的意味,比如凱茜·奧尼爾(Cathy O’Neil)2016年的著作《數學殺傷性武器》(Weapons of Math Destruction)或者弗蘭克·帕斯夸里(Frank Pasquale)2015年的《黑箱社會》(The Black Box Society)。匆忙執行和應用大數據,即進行所謂的“數據驅動型決策”,帶來了嚴重的錯誤。
 
  有的錯誤相當惹人注目:塔吉特(Target)曾向一位沒跟任何人說過自己懷孕的少女的家庭派送嬰兒用品優惠券;Pinterest曾恭喜一位單身女性即將結婚;谷歌照片(Google Photos)也曾引發軒然大波,該公司被大肆吹捧的AI將黑人誤以為是大猩猩,原因是它的訓練數據不夠多元化。(值得指出的是,至少在該事件中,“大數據”還不夠大。)
 
  其它的錯誤更為微妙,或許也更加陰險。當中包括奧尼爾在她的重要著作中記錄的那些不透明的數據驅動式制度性模型:被法庭用來判決罪犯的、帶有種族偏見的累犯模型,或者那些基于可疑的測驗分數數據解雇備受愛戴的教師的模型。大數據出錯的新案例可謂層出不窮——比如Facebook算法明顯幫助俄羅斯通過針對性的假新聞影響美國總統大選的結果。
 
  盲目迷戀數據與誤用
 
  “大數據”的問題并不在于數據本身很糟糕,也不在于大數據本身很糟糕:謹慎應用的話,大型數據集還是能夠揭示其它途徑發現不了的重要趨勢。正如茱莉婭·羅斯·韋斯特(Julia Rose West)在近給Slate撰寫的文章里所說的,盲目迷戀數據,不加批判地使用,往往導致災難的發生。
 
  從本質來看,大數據不容易解讀。當你收集數十億個數據點的時候——一個網站上的點擊或者光標位置數據;大型公共空間十字轉門的轉動次數;對世界各地每個小時的風速觀察;推文——任何給定的數據點的來源會變得模糊。這反過來意味著,看似別的趨勢可能只是數據問題或者方法造成的產物。但也許更重大的問題是,你所擁有的數據通常只是你真正想要知道的東西的一個指標。大數據不能解決那個問題——它反而放大了那個問題。
 
  例如,民意調查被廣泛用作衡量人們在選舉中的投票意向的指標。然而,從湯姆·布拉德利(Tom Bradley)1982年在加州州長競選中敗北,到英國脫歐公投,再到的當選,數十年來結果出乎意料的選舉一再提醒我們,民意測驗和人們實際的投票意向之間并不總是完全一致。Facebook以往主要通過用戶有沒有點贊來估量他們對特定的帖子是否有興趣。但隨著經過算法優化的動態信息開始大量出現標題誘餌、點贊誘餌和嬰兒照片——導致用戶滿意度明顯下降——該公司的高層逐漸意識到,“點贊”這事并不一定意味著用戶真的喜歡特定的內容。
 
  指標和你實際上要估量的東西之間的差別越大,過于倚重它就越危險。以來自奧尼爾的著作的前述例子為例:學區使用數學模型來讓教師的表現評估與學生的測驗分數掛鉤。學生測驗分數與不在教師控制范圍內的無數重要因素有關。大數據的其中一個優勢在于,即便是在非常嘈雜的數據集里,你也可以發現有意義的關聯性,這主要得益于數據量大以及理論上能夠控制混雜變量的強大軟件算法。
 
  例如,奧尼爾描述的那個模型,利用來自多個學區和體系的學生的眾多人口結構方面的相關性,來生成測驗分數的“預期”數據集,再拿它們與學生的實際成績進行比較。(由于這個原因,奧尼爾認為它是“大數據”例子,盡管那個數據集并不夠大,沒達到該詞的一些技術定義的門檻。)
 

我要評論
文明上網,理性發言。(您還可以輸入200個字符)

所有評論僅代表網友意見,與本站立場無關。

版權與免責聲明:

凡本站注明“來源:智能制造網”的所有作品,均為浙江興旺寶明通網絡有限公司-智能制造網合法擁有版權或有權使用的作品,未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:智能制造網”。違反上述聲明者,本站將追究其相關法律責任。

本站轉載并注明自其它來源(非智能制造網)的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:智能制造網”,本站將依法追究責任。

鑒于本站稿件來源廣泛、數量較多,如涉及作品內容、版權等問題,請與本站聯系并提供相關證明材料:聯系電話:0571-89719789;郵箱:1271141964@qq.com。

不想錯過行業資訊?

訂閱 智能制造網APP

一鍵篩選來訂閱

信息更豐富

推薦產品/PRODUCT 更多
智造商城:

PLC工控機嵌入式系統工業以太網工業軟件金屬加工機械包裝機械工程機械倉儲物流環保設備化工設備分析儀器工業機器人3D打印設備生物識別傳感器電機電線電纜輸配電設備電子元器件更多

我要投稿
  • 投稿請發送郵件至:(郵件標題請備注“投稿”)1271141964.qq.com
  • 聯系電話0571-89719789
工業4.0時代智能制造領域“互聯網+”服務平臺
智能制造網APP

功能豐富 實時交流

智能制造網小程序

訂閱獲取更多服務

微信公眾號

關注我們

抖音

智能制造網

抖音號:gkzhan

打開抖音 搜索頁掃一掃

視頻號

智能制造網

公眾號:智能制造網

打開微信掃碼關注視頻號

快手

智能制造網

快手ID:gkzhan2006

打開快手 掃一掃關注
意見反饋
我要投稿
我知道了
主站蜘蛛池模板: 蕲春县| 和政县| 伊金霍洛旗| 遵义县| 江油市| 讷河市| 同德县| 乃东县| 合水县| 德令哈市| 甘肃省| 潢川县| 迁安市| 晋江市| 中宁县| 松溪县| 宁安市| 大港区| 株洲市| 玉山县| 宾川县| 麻江县| 和田市| 建平县| 和龙市| 汉沽区| 湛江市| 昆明市| 宜良县| 琼海市| 安图县| 太保市| 东莞市| 彰化县| 娄底市| 广平县| 那坡县| 渭源县| 潞西市| 澄迈县| 吴堡县|