大地资源网视频在线观看新浪,日本春药精油按摩系列,成人av骚妻潮喷,国产xxxx搡xxxxx搡麻豆

正在閱讀:八大原因告訴你 數據分析機器學習模型為何部署難

八大原因告訴你 數據分析機器學習模型為何部署難

2016-06-21 09:54:53來源:36大數據 原標題:數據分析/機器學習模型無法部署的八大原因 關鍵詞:數據分析機器學習落地難閱讀量:31912

導讀:本文中我列出了在建立模型時你應當謹記的所有可能原因。在我的職業生涯中,我曾多次遇到過這種情況。我希望在我經驗的幫助下,可以幫助你克服這種情況。
  【中國智能制造網 市場分析】在本文中,我列出了在建立模型時你應當謹記的所有可能原因。在我的職業生涯中,我曾多次遇到過這種情況。因此,我認為在我經驗的幫助下,可以幫助你克服這種情況。

八大原因告訴你 數據分析機器學習模型為何部署難
  
  不要成為一個模型無法部署的數據科學家
  
  舉一個典型的模型部署失敗的實例:Netflix大獎競賽。簡單來說,這是一個面向大眾開放的競賽,參與者需要寫一個協同過濾算法來預測電影的用戶評級。勝出者獲得了1000萬美元的大獎。然而后,這個完整的模型卻沒有得到部署。
  
  不僅僅是Netflix,大多數公司都發生過這種戲劇性的事件。就在近,我與許多數據分析公司的公司高管進行了交流,而他們大的擔憂就是公司50%的預測模型都得不到實現。
  
  為什么要建立一個在現實世界中無法使用的模型呢?這就好像你做一個蛋糕,嘗試過后發現很美味,但卻永遠不讓任何人吃一個道理。
  
  模型部署失敗的8個原因
  
  1、高假正性(FP):這看上去似乎有點專業,而目前重要的是了解什么是假正。假設在一個分類模型中,我們想要預測客戶是應答者(給出答案的人)還是非應答者(不給出答案的人)
  
  想象一下,如果你預測一個人X會是一個應答者,但實際上他并不會給出任何答案。這種情況下,X就被稱為假正。那么在現實世界中這會造成什么影響,我知道你想要問這個問題。
  
  舉個例子,例如你需要為1000個客戶建立一個保留活動,在這1000個客戶中會有100個客戶流失(離開)。你創建一個了不起的模型,在這個模型中前十個人中有四個人會離開(相等的部分)
  
  這就意味著,從你預測的前100個客戶中,40個客戶會流失。所以,你推薦企業專為這100個客戶提供一個吸引人的購物方案,這樣可以阻止他們流失。但是,這仍有很大問題。
  
  問題就是你花費在那些客戶身上的每一美元中,只有0.4美元被用來阻止客戶流失。剩下的0.6美元都浪費在那些并不是真心想要離開的假正(FP)客戶身上。
  
  2、不了解基本業務模型:近,對于使用機器學習算法和更加復雜的模型建立技術的需求正在日益增長。換句話說,各企業正在逐漸減少使用傳統的模型技術。
  
  毫無疑問,使用機器學習技術可以加大預測能力。但是企業仍不是太接受這種黑盒技術。以我經驗而言,這將導致實施一個預測策略時會需要更長的前置時間。由于大多數的應用程序業務上是高度動態的,該模型也會由于較長的前置時間變得越來越冗余。
  
  3、對業務問題不夠了解:創建過預測模型對分析師或者業務同行而言都會在其履歷上添加濃墨重彩的一筆。然而,這并不是你建立模型的目的。在某些情況下,分析師進入創建模型階段,并會試圖削減本應分配給了解業務問題的時間。
  
  4、模型實施過于復雜:預測能力是這些模型實施的靈魂,但是一般情況下,預測能力是以模型的復雜度為代價的。為使模型更加健壯我們開始引入雙變量和三變量,不論這些變量對業務來說有沒有意義。這樣的模型在書本上可能是十分精彩的,然而就因如此,他們也只能停留在書本上,并不能在現實世界中實現。
  
  5、不能解決根本原因,僅僅試圖提高一個過程的影響。我們為什么做模型?重要的原因是為找到一個特定響應的驅動程序。這些驅動程序又是什么?驅動程序往往是響應率的根本原因。如果你引進所有影響當做輸入變量,然后這些變量也會作為重要輸出時將會發生什么?這將沒有任何用處,因為你沒有改變任何可能帶來變化的事情。
  
  6、訓練人口與得分人口完全不同:在很多情況下,我們終是在一個與實際人口完全不同的人口中建立模型。舉例來說,如果你正在創建一個針對人口的活動,并且以前沒有類似的活動。在這種情況下,我們先從基本假設開始,假設該人口具有高響應率,且有可能有高增量響應率。但是這種假設很少是真實的,因此該模型將很難使用。
  
  7、不穩定模型:高性能模型通常是高度不穩定的,并且不在同一時間內執行。在這種情況下,業務可能需要高頻的模型修正。隨著模型創建的前置時間越來越長,業務可能會開始回到基于直覺的策略。
  
  8、依賴于高動態變量的模型:動態變量給模型帶來真正的預測能力。然而,你也可能會有這樣的變量,它的賦值永遠不會顯示在訓練窗口。
  
  例如,你可能得到一些工作日的銷售量作為重要變量來預測一個分支的月銷售量。我們就說這種變量具有高預測性。但是對于我們的評分窗口而言,有一些月份僅僅有10-15天的工作日。如果你的訓練數據沒有這樣的月份,你的模型可能無法進行準確預測。
我要評論
  • 如何利用人工智能和數據分析實現可持續綠色技術

    人工智能和數據分析為實現可持續綠色技術提供了強大的支持。通過優化資源利用、推動綠色創新和智能環境監測與保護,AI和數據分析在多個領域發揮了重要作用。
    人工智能數據分析綠色技術
    2025-06-10 15:37:59
  • 人工智能和機器學習在工業自動化中的作用

    人工智能(AI)和機器學習(ML)正在推動工業自動化的范式轉變,使制造流程更智能、更快速、更高效。預計工業自動化市場規模將從2023年的2056.3億美元增長到2031年的4274.2億美元。
    人工智能機器學習工業自動化
    2025-06-03 10:33:09
  • 計算機視覺與機器學習的創新浪潮:開啟智能未來

    在這個快速發展的時代,計算機視覺和機器學習的進步正在改變我們與世界互動的方式。未來,隨著技術的不斷成熟和創新,計算機視覺和機器學習系統將變得更加智能、高效和可靠。
    計算機視覺機器學習
    2025-05-22 09:19:46
  • 國家發展改革委等部門關于促進數據產業高質量發展的指導意見

    到2029年,數據產業規模年均復合增長率超過15%,數據產業結構明顯優化,數據技術創新能力躋身世界先進行列,數據產品和服務供給能力大幅提升,催生一批數智應用新產品新服務新業態,涌現一批具有國際競爭力的數據企業,數據產業綜合實力顯著增強,區域聚集和協同發展格局基本形成。
    數據產業數據分析
    2025-01-03 09:58:46
  • 未來最值得關注的人工智能和機器學習趨勢是什么?

    人工智能和機器學習社區最緊迫的問題之一是道德人工智能系統的開發和實施。隨著人工智能技術在我們生活中變得越來越普遍,確保負責任地設計和部署這些系統至關重要。
    人工智能機器學習
    2024-12-23 11:21:00
  • 市場分析|推動工業物聯網數據分析的四項關鍵技術

    人工智能無疑將工業物聯網分析提升到了一個新的水平。這種改進主要是因為人工智能可以在大量數據中檢測模式,讓人們能夠比沒有技術幫助的情況下更快地得出結論。
    工業物聯網數據分析
    2024-10-23 09:39:50
版權與免責聲明:

凡本站注明“來源:智能制造網”的所有作品,均為浙江興旺寶明通網絡有限公司-智能制造網合法擁有版權或有權使用的作品,未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:智能制造網”。違反上述聲明者,本站將追究其相關法律責任。

本站轉載并注明自其它來源(非智能制造網)的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:智能制造網”,本站將依法追究責任。

鑒于本站稿件來源廣泛、數量較多,如涉及作品內容、版權等問題,請與本站聯系并提供相關證明材料:聯系電話:0571-89719789;郵箱:1271141964@qq.com。

不想錯過行業資訊?

訂閱 智能制造網APP

一鍵篩選來訂閱

信息更豐富

推薦產品/PRODUCT 更多
智造商城:

PLC工控機嵌入式系統工業以太網工業軟件金屬加工機械包裝機械工程機械倉儲物流環保設備化工設備分析儀器工業機器人3D打印設備生物識別傳感器電機電線電纜輸配電設備電子元器件更多

我要投稿
  • 投稿請發送郵件至:(郵件標題請備注“投稿”)1271141964.qq.com
  • 聯系電話0571-89719789
工業4.0時代智能制造領域“互聯網+”服務平臺
智能制造網APP

功能豐富 實時交流

智能制造網小程序

訂閱獲取更多服務

微信公眾號

關注我們

抖音

智能制造網

抖音號:gkzhan

打開抖音 搜索頁掃一掃

視頻號

智能制造網

公眾號:智能制造網

打開微信掃碼關注視頻號

快手

智能制造網

快手ID:gkzhan2006

打開快手 掃一掃關注
意見反饋
我要投稿
我知道了
主站蜘蛛池模板: 思茅市| 泰宁县| 古田县| 云梦县| 灯塔市| 恭城| 平潭县| 稷山县| 阜平县| 共和县| 全南县| 东方市| 台东县| 馆陶县| 灵台县| 西峡县| 尉氏县| 马边| 海淀区| 韶山市| 溆浦县| 新巴尔虎右旗| 邵东县| 偃师市| 商水县| 德阳市| 开封市| 金门县| 佛坪县| 富源县| 延长县| 如皋市| 鞍山市| 堆龙德庆县| 青州市| 潮安县| 仲巴县| 临颍县| 荣成市| 抚顺县| 西乌|