線性探測哈希表新研究成果有望讓計算機更有效地存儲和檢索數據

2021-11-22 13:27:45來源：cnBeta.COM 關鍵詞：存儲數據閱讀量：20709

導讀：麻省理工學院 CSAIL 一項關于線性探測哈希表的新研究成果，有望讓計算機更有效地存儲和檢索數據。

　　麻省理工學院 CSAIL 一項關于線性探測哈希表的新研究成果，有望讓計算機更有效地存儲和檢索數據。該成果由該校計算機科學博士生 William Kuszmaul 在內的三人研究小組取得，對 1954 年推出的“線性探測哈希表”進行了優化。

　　“線性探測哈希表”于 1954 年推出，是當今最古老、最簡單和最快的數據結構之一。數據結構提供了在計算機中組織和存儲數據的方法，而哈希表是最常用的方法之一。在線性探測哈希表中，可以存儲信息的位置是沿著一個線性陣列。

　　例如，假設一個數據庫被設計用來存儲 10000 人的身份證號碼，Kuszmaul 建議：“我們取你的身份證號碼x，然后計算 x 的哈希函數，h(x)，它給你一個 1 到10000之間的隨機數。下一步是拿著這個隨機數 h(x)，走到數組中的那個位置，把 x，即身份證號碼，放到那個位置”。

　　Kuszmaul 說，如果已經有東西占據了那個位置，你只需前進到下一個空閑位置并把它放在那里。這就是“線性探測”一詞的由來，因為你一直線性地向前移動，直到找到一個空位。

　　為了以后檢索那個社會安全號碼，x，你只要去指定的位置，h(x)，如果它不在那里，你就向前走，直到你找到 x 或來到一個空閑位置，并得出結論說 x 不在你的數據庫中。

　　對于刪除一個項目，如社會安全號碼，有一個有點不同的協議。如果你在刪除信息后只是在哈希表中留下一個空位，那么當你后來試圖尋找其他東西時就會造成混亂，因為這個空位可能會錯誤地暗示你正在尋找的項目在數據庫中無處可尋。為了避免這個問題，Kuszmaul 解釋說，你可以去元素被移除的地方，在那里放一個叫做“墓碑”(tombstone)的小標記，表示這里曾經有一個元素，但現在已經消失了。

　　這個常規程序已經被遵循了半個多世紀。但在所有這些時間里，幾乎所有使用線性探測哈希表的人都認為，如果你允許它們變得太滿，長長的被占點會跑到一起形成"集群"。因此，找到一個空閑位置所需的時間會急劇上升--事實上是四倍--需要如此長的時間，以至于不切實際。因此，人們被訓練成在低容量下操作哈希表--這種做法會影響公司必須購買和維護的硬件數量，從而造成經濟損失。

　　該團隊還設計了一種新的策略，稱為“墓地散列”(graveyard hashing)，其中包括人為地增加放置在陣列中的墓碑數量，直到它們占據了大約一半的空閑位置。然后，這些墓碑保留了可用于未來插入的空間。

　　Kuszmaul 說，這種方法與人們習慣上被指示的做法相反，"可以導致線性探測哈希表的最佳性能"?；蛘撸缢退暮献髡咴谒麄兊恼撐闹兴鶊猿值哪菢樱?精心設計的墓碑的使用可以完全改變......線性探測的行為方式。"

上一篇：研究稱奇特的新材料或是兩種超導體的結合體具有重要的量子計算用途

下一篇：利用人工智能和物聯網技術開發智能家居

我要評論

昵稱

匿名

文明上網，理性發言。（您還可以輸入200個字符)

表情

所有評論僅代表網友意見，與本站立場無關。

黃石大冶：數據互聯 AI把關精準控能增綠降碳華興玻璃智能窯爐點火
DY6號爐成功升級提升華興玻璃的核心競爭力，將成為后續產線智能化升級改造的可復制方案。
數據AI
2025-06-25 10:41:02
2025年5月經濟運行數據發布總體勢頭良好
5月份，41個大類行業中有35個行業增加值保持同比增長。其中，煤炭開采和洗選業增長5.5%，石油和天然氣開采業增長5.3%，農副食品加工業增長7.6%，酒、飲料和精制茶制造業增長4.1%，紡織業增長0.6%。
經濟運行數據
2025-06-20 09:15:35
武漢市數據局聯合四部門印發《三年行動方案》
數據標注產業是對數據進行篩選、清洗、分類、注釋、標記和質量檢驗等加工處理的新興產業。
數據數字經濟
2025-06-10 14:54:06
引領園區網效率革命：新華三正式發布全光網絡5.0解決方案
伴隨AGI時代的加速到來，端側智能應用正在快速涌現，與此同時，傳統園區網絡在成本、運維及關鍵業務保障等方面的短板日益顯現，已難以滿足創新應用對高密度、高帶寬和靈活彈性的迫切需求。
網絡安全數據
2025-05-28 10:01:53
數字經濟民營企業座談會在福州召開
國家數據局將深入貫徹黨中央、國務院決策部署，強化數據要素保障，深化數據資源開發利用和開放共享，推動科技創新和產業創新深度融合，打造具有國際競爭力的數字產業集群，更好激發數字經濟創新活力。
數字經濟數據
2025-05-08 09:57:33
國家數據局綜合司關于征集數據基礎設施建設優秀案例的通知
為落實《國家數據基礎設施建設指引》（簡稱《建設指引》）工作部署，加快推進數據基礎設施建設，現組織征集數據基礎設施建設優秀案例，總結數據基礎設施建設經驗，遴選推廣先進做法，供各方借鑒參考。
數據基礎設施
2025-04-28 10:13:06

版權與免責聲明：

凡本站注明“來源：智能制造網”的所有作品，均為浙江興旺寶明通網絡有限公司-智能制造網合法擁有版權或有權使用的作品，未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的，應在授權范圍內使用，并注明“來源：智能制造網”。違反上述聲明者，本站將追究其相關法律責任。

本站轉載并注明自其它來源（非智能制造網）的作品，目的在于傳遞更多信息，并不代表本站贊同其觀點或和對其真實性負責，不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時，必須保留本站注明的作品第一來源，并自負版權等法律責任。如擅自篡改為“稿件來源：智能制造網”，本站將依法追究責任。

鑒于本站稿件來源廣泛、數量較多，如涉及作品內容、版權等問題，請與本站聯系并提供相關證明材料：聯系電話：0571-89719789；郵箱：1271141964@qq.com。