文章閱讀頁通欄

分析區塊鏈數據集的四種新機器學習方法

來源: 區塊網 作者:考拉
使用機器學習來分析區塊鏈數據集是一個令人著迷的挑戰。區塊鏈數據集除了具有不可思議的潛力,可以幫助我們了解加密貨幣資產的行為,但是這對機器......
使用機器學習來分析區塊鏈數據集是一個令人著迷的挑戰。區塊鏈數據集除了具有不可思議的潛力,可以幫助我們了解加密貨幣資產的行為,但是這對機器學習的實踐者提出了非常獨特的挑戰。然而這些挑戰被轉化為大多數傳統機器學習技術的主要障礙。機器智能技術的快速發展使得新機器學習方法的產生成為可能,這些方法非常適用于區塊鏈數據集的分析。在IntoTheBlock,我們定期試驗了這些新方法,以提高市場情報信號的效率。今天,我想簡要介紹一下機器學習領域的一些新思想,它們可以在分析區塊鏈數據時產生有趣的結果。

區塊鏈數據集提供了一個與加密貨幣資產行為相關的獨特的數據宇宙,因此,為機器學習方法的應用提供了獨特的機會。然而,區塊鏈數據集的性質和結構給機器學習方法帶來了獨特的挑戰。雖然我們可能認為區塊鏈數據集是機器學習應用程序的天堂,但傳統方法通常會遇到一些意想不到的挑戰:

·缺少標記數據:區塊鏈數據集中只有很少的標記數據可用于訓練機器學習模型。
·模糊數據:區塊鏈充滿了加密或模糊的數據,幾乎不可能進行分析。
·缺乏基準測試模型:機器學習就是將模型與其他模型進行基準測試。在一個很少有文檔記錄的模型產生可信結果的空間中,這樣的結果有點困難。

傳統的機器學習思想

傳統的機器學習實踐者將世界分為兩類模型:

·監督學習(Unsupervised Learning):有監督學習(Supervised Learning)這個名稱表示有一名導師作為老師在場。基本上,監督學習是一種我們使用數據來教或訓練機器的學習,這些數據都有很好的標記,這意味著一些數據已經有了正確的答案。

·非監督學習:非監督學習是機器使用既不分類也不標記的信息進行訓練,并允許算法在沒有指導的情況下對該信息進行操作。在這里,機器的任務是根據相似、模式和差異對未排序的信息進行分組,而不需要事先對數據進行任何訓練。

在區塊鏈數據集中,由于標記數據集的有限可用性,監督學習應用程序是有限的。非監督方法可能非常有效,但在缺乏其他模型或基準進行比較的情況下,很難判斷其性能。

為了幫助改進區塊鏈數據分析中的非監督和監督方法,我們嘗試使用一些近年來在機器學習社區中獲得廣泛關注的新方法。

新的機器學習方法,可以幫助我們了解區塊鏈數據集

我們生活在機器學習研究技術的黃金時代。今天,機器學習框架和平臺正在迅速整合許多技術,幫助實現傳統監督和非監督方法之外的新功能。我們發現其中一些技術與區塊鏈數據集的分析非常相關。

半監督學習

半監督學習是近年來備受關注的機器學習領域之一。從概念上講,半監督學習是監督學習的一種變體,它結合了用于訓練的標記和未標記數據集。半監督學習的原理是利用少量的帶標簽的監督學習和大量的無標簽的非監督學習數據,在許多情況下可以比完全監督的模型產生更好的準確性。

在區塊鏈分析中,半監督學習可以用于訓練模型,這些模型可以對參與者(如交換器或錢包)進行分類,而不需要依賴大型標記數據集進行訓練。例如,分類器可以學習使用幾個標記地址來識別加密貨幣交易,并使用一個更大的未標記地址池來進行擴展。

遷移學習

遷移學習是一種表示法學習,其基礎是通過重用以前任務中的知識來掌握新任務的思想。傳統的學習是孤立的,只基于特定的任務、數據集和單獨的訓練模型。沒有可以從一個模型轉移到另一個模型的知識被保留。在遷移學習中,您可以利用以前訓練過的模型中的知識(特性、權重等)來訓練新的模型。

當涉及到區塊鏈數據分析時,可以使用遷移學習來構建模型,從而從以前的任務中歸納出知識。例如,識別異常比特幣轉移的模型可以將其知識推廣到以太坊區塊鏈。

AutoML與自動化

設計機器學習模型是一項難以置信的主觀任務,它通常依賴于數據科學家的經驗,而這些經驗沒有經過客觀測試。一個給定的機器學習問題可以有無限個解,很難理解我們是否有這個問題的正確解。

AutoML是一種新技術,旨在自動創建機器學習模型。對于給定的數據集、一系列優化指標和一些時間或資源方面的約束,AutoML方法應該能夠評估成千上萬的神經網絡體系結構并產生最優結果。雖然有效的數據科學團隊可能能夠評估給定問題的12個模型,但是AutoML方法可以在相對可管理的時間內快速搜索成千上萬的體系結構。

在區塊鏈數據集中,NAS和AutoML可以幫助我們評估給定場景的大量模型。例如,我們可以評估數百個模型,得出一個更完善的架構,而不是設計一個特定的神經網絡來預測交易所資金流動。

元學習

元學習可以簡單地定義為獲取知識多樣性的能力。作為人類,我們能夠用最少的信息同時獲得多個任務。我們可以通過看到一個新的物體的圖片來識別它,或者我們可以同時學習復雜的、多任務的活動,比如駕駛飛機。雖然人工智能代理可以掌握非常復雜的任務,但它們需要在任何原子子任務上進行大量訓練,而且它們在多任務處理方面仍然非常糟糕。一種流行的元學習技術被稱為“少鏡頭學習”(few-shot learning),它可以創建深度神經網絡,通過模仿極簡數據集來學習,例如,嬰兒如何通過只看一兩張照片來學習識別物體。

在區塊鏈分析中,我們可以使用元學習來重用識別模式(如惡意傳輸)的模型來識別有用信息(如支付交易)。

這些是一些新的機器學習方法,可以成為非常有用的區塊鏈數據分析。隨著加密貨幣分析空間的發展,其中一些技術的應用將從一個開放的實踐變成必須的,以產生有意義的,能夠幫助我們理解加密貨幣資產的行為。

關鍵詞: 區塊鏈數據  區塊鏈  
0/300
? 好运彩3单双 好友麻将作弊器 笑傲江湖赚钱攻略2015 60彩票游戏 广水卡五星麻将群 天天捕鱼赢话费qq登陆 北京麻将手机游戏 恒发彩票游戏 加盟中国石油赚钱吗 qq捕鱼大亨官方网站 qq麻将花猪赔多少 快播彩票安卓 支付宝除了领红包还有什么赚钱的 河北时时彩 山西扣点点客服 千炮捕鱼达人街机 电脑怎么轻松赚钱的方法