分層聚類法就是對給定數據對象的集合進行層次分解,根據分層分解采用的分解策略,分層聚類法又可以分為凝聚的(agglomerative)和分裂的(divisive)分層聚類。
凝聚的分層聚類
它采用自底向上的策略,首先將每一個對象作為一個類,然后根據某種度量(如2個當前類中心點的距離)將這些類合并為較大的類,直到所有的對象都在一個類中,或者是滿足某個終止條件時為止,絕大多數分層聚類算法屬于這一類,它們只是在類間相似度的定義上有所不同。
分裂的分層聚類
它采用與凝聚的分層聚類相反的策略——自頂向下,它首先將所有的對象置于一個類中,然后根據某種度量逐漸細分為較小的類,直到每一個對象自成一個類,或者達到某個終止條件(如達到希望的類個數,或者2個近的類之間的距離超過了某個閾值)。
分層聚類雖然比較簡單,但經常會遇到選擇合并點或者分裂點的問題。這種選擇非常關鍵,因為一旦一組對象被合并或者分裂,下一步的工作就是在新形成的類上進行,已做的處理不能撤銷,類之間也不能交換對象。如果合并或者分裂的決定不合適,就可能得出低質量的聚類結果。而且,分層聚類算法沒有很好的可伸縮性,在決定合并或者分裂之前需要檢查和估算大量的對象和類。
(原標題:分層聚類算法,為何如此關鍵?)
版權與免責聲明:
凡本站注明“來源:智能制造網”的所有作品,均為浙江興旺寶明通網絡有限公司-智能制造網合法擁有版權或有權使用的作品,未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:智能制造網”。違反上述聲明者,本站將追究其相關法律責任。
本站轉載并注明自其它來源(非智能制造網)的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:智能制造網”,本站將依法追究責任。
鑒于本站稿件來源廣泛、數量較多,如涉及作品內容、版權等問題,請與本站聯系并提供相關證明材料:聯系電話:0571-89719789;郵箱:1271141964@qq.com。