微軟研究院首席研究員 Miltos Alamanis 與高級首席研究主管 Marc Brockschmidt,剛剛在一篇博客文章中介紹了他們新開發的 BugLabs 人工智能。顧名思義。這是一套專門用于發現代碼中的錯誤,幫助開發者更精準、高效地調試其應用程序的 AI 解決方案。而且它的開發過程,與創建生成對抗網絡(GAN)的形式大致相同。
在《借助深度學習查找并修復錯誤》一文中,微軟研究員介紹了他們設置的兩個相互對抗的網絡。其中一個旨在將小錯誤引入代碼,另一個則旨在發現這些 bug 。
隨著深度學習訓練的持續推進,AI 的能力也變得愈加完善,最終成為了我們看到的這個特別擅長識別“隱藏在真是代碼中的 bug”的人工智能。
這種方法的優點,在于全程無需自我監督或標記數據。Miltos Allamanis 與 Marc Brockschmidt 在報告中提到:
理論上,我們可以將之廣泛地應用于‘捉迷藏’游戲 —— 教授機器去識別任務復雜的錯誤。遺憾的是,這些 bug 通常超出了現代人工智能方法的運用范圍。
有鑒于此,研究團隊決定更加專注于一組常見的錯誤 —— 包括不正確的比較(例如使用 <= 而不使用 < 或 > 符號、不適當的布爾運算符(與 / 或)、濫用變量(誤用 i 而不是 j)等。
系統測試期間,微軟研究員特別專注于 Python 代碼。一旦檢測器通過了訓練,即可將它用于檢測和修復實際代碼中的 bug 。
不過為了均衡性能,他們還是手動注釋了 Python Package Index 中包含的某些類型的小錯誤數據集。
最終與隨機錯誤插入等其它替代方案相比,其“hide-and-seek”訓練模型有高達三成的前沿優勢,前景很是光明。
具體說來是,hide-and-seek 能夠自動找到并修復大約 26% 的錯誤,且其中包括了 19 個此前未知的真實開源 GitHub 代碼中的 bug 。
與此同時,現階段的 AI 模型仍存在許多誤報。在投入實際運用之前,顯然還需要開展更多的改進。
最后,鑒于微軟已經成功地推動了 GitHub 上的 GPT-3 項目,預計 hide-and-seek 也將很快迎來商業化應用。
(原標題:微軟開發可高效揪除代碼錯誤的BugLabs人工智能解決方案)
版權與免責聲明:
凡本站注明“來源:智能制造網”的所有作品,均為浙江興旺寶明通網絡有限公司-智能制造網合法擁有版權或有權使用的作品,未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:智能制造網”。違反上述聲明者,本站將追究其相關法律責任。
本站轉載并注明自其它來源(非智能制造網)的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:智能制造網”,本站將依法追究責任。
鑒于本站稿件來源廣泛、數量較多,如涉及作品內容、版權等問題,請與本站聯系并提供相關證明材料:聯系電話:0571-89719789;郵箱:1271141964@qq.com。