比特幣的日益普及,基於Minitab預測分析模塊的比特幣數據分析你知道嗎?

隨著比特幣的日益普及,越來越多的分析師試圖更好地理解這一現象。雖然很難準確預測比特幣的實際價格,但仍有可能查明一些有趣的趨勢和關係。在下面的內容中,我們將了解到如何使用Minitab預測分析模塊來完成這項任務。

比特幣的日益普及,基於Minitab預測分析模塊的比特幣數據分析你知道嗎?插图

實際的比特幣數據可以從許多公共來源獲得。可以下載一個非常有用的數據集。

該數據集包括每天的比特幣統計數據,可以追溯到2009年。每一天都有44種不同的衡量標準,包括比特幣價格、各種收費、分組計數、交易計數、投資回報等等。

為便於分析,我將查看2015年1月1日至2021年4月20日期間的比特幣每日統計數據。這消除了一些早期的歷史,這些歷史可能會削弱最近的趨勢。該數據集包含一個名為ROI30d的變量–假設在30天前購買了該資產,該資產的投資回報率為百分之一。接下來,我的主要目標將是利用剩餘的變量作為潛在的預測指標,對30天的投資回報做出準確的預測。

01數據摘要
首先,讓我快速查看使用Minitab的各種數據摘要。

以下是30天投資回報的時間序列圖:

正如你所看到的,投資比特幣可以帶來豐厚的回報或巨大的損失。鑑於這一資產的波動性,投資比特幣的時機對回報至關重要。因此,了解回報的影響可以幫助確定什麼時候是投資的最佳時機。

02確定最重要的預測因素
所以我們經常被問到問題,需要在最短的時間內找到最好的答案。有了44個可能的預測因子,我需要知道哪一個最重要,我需要盡快知道,這樣我就可以進行分析了。

這就是為什麼Minitab預測分析模塊有一個名為“發現關鍵預測器”的選項。這個選項允許我讓軟件識別最重要的變量,使我能夠建立一個仍然是高度精確,但遠沒有那麼複雜的模型,使它更加用戶友好。

我使用我的數據集並通過TreeNet“發現關鍵預測器”來運行它。正如預期的那樣,Minitab從提供的候選預測器集合開始,然後依次構建一系列模型,每個後續模型通過刪除最不重要的變量使用一個較少的預測器。因此,整個過程是從經典回歸模型中得知的向後消去過程的現代推廣。下面是從完整的預測器(不包括日期)開始時發生的情況:

看一下我可能的模型的圖形可視化,您可以看到模型的準確性在90%左右波動,直到只剩下兩個預測器。當我深入分析時,“發現關鍵預測器”揭示了AssetEODCompletionTime是“最後一個站立的人”或最重要的預測器。

不幸的是,從數據字典中查找它的定義,這個“預測器”僅僅是每天收集最後一次數據的時間,這不是一個有用的度量。因此,我想消除這一點,因為我知道–當然–這些可能是相關的,但不是預測性的。這在預測器選擇中並不少見:機器通常會首先選擇一堆無用的玩家。此示例還強調了將預測分析與主題知識結合在一起的重要性。幸運的是,解決方案很簡單–只需將其從變量的起始列表中刪除,然後重新進行“發現最佳預測器”分析!

在從原始列表中刪除AssetEODCompletionTime並重新啟動預測器發現過程後,我獲得以下總結:

注意,Minitab的引擎強調,最優模型使用8個原始變量(度量),在50%的測試分區上達到91%的R平方。對於這種類型的回歸模型來說,這是一個極好的性能結果!另外要注意的是,模型性能的統計變化在90%左右。

Minitab也給了我一個有用的可視化,模型的總體精度只有在預測器數低於3時才會顯著下降。為了建立最簡單的模型,同時最大限度地提高模型的準確性,我選擇了一個有3個預測器的模型進行更詳細的分析。或者,您可以從原始候選列表中刪除其中一些變量,並重新執行最佳預測器搜索,以確定不同的贏家子集。記住,在這個例子中,我試圖快速確定什麼是重要的。如果最大的精度是你的目標,你可能會選擇最優的模型。機會是無限的,不管你的目標是什麼,你只要點擊幾下就可以輕鬆地完成它!

03數據摘要
回到我的例子。現在,我將更仔細地看一看上面選擇的3變量模型。以下是該模型的總結性能:

正如你所看到的,我們在50%的測試樣本上有88%以上的準確性–一個很好的結果!此外,Minitab報告了三種尚存指標對該模型的總體貢獻的相對排名:

與3天投資回報相關的最重要變量是CapMVRVCur。事實證明,這個變量概括了市場可能高估/低估的情況。下面是這個變量在過去6年中的時間序列圖:

這個指標似乎在1.0到4.0之間波動,目前的數值在3.3左右,可能還在下降。下面是關於此度量的更詳細說明:

(創造這一比率背後的直覺是將價格函數除以“基本面”,代之以已實現的資本化(見資本化,已實現,美元)。這給出了一個比率,它潛在地指示了高估期(當網絡價值遠遠超過其與已實現上限的歷史關係時)和低估時期。已實現上限是一個強有力的基礎,因為它可以理解為持有人在某一特定時間的平均成本基礎,因此兩者的比率表明持有者是否在水下,從而洞察總體情緒。)

Treenet梯度提升模型還揭示了這一指標對30天投資回報的貢獻的本質:

回想一下,這一指標的最新數值在3.3左右波動,可能還會繼續下降。從上面的依賴情節來看,很明顯,如果真的是這樣的話,那麼我們預計3天的ROI將繼續下降。或者,如果有任何理由相信這一指標將增加到3.7或更高,我們可能預計在歷史模式的基礎上,投資回報率會大幅上升。

以上一系列步驟模擬了預測分析中遇到的典型場景。我們從一個包含44個變量的數據集開始,很快就在幾分鐘內找到了最重要的預測因素。關鍵預測器的選擇創建了一條捷徑,以避免每次查看每個變量的潛在繁瑣和費力的過程。此外,TreeNet梯度增強模型具有很好的精度。所有這些都突出了現代預測分析的力量,並說明了為什麼你需要它前進!

本文最初出現在Minitab博客上。

 萬倍幣推薦 幣黃金(BHJ)代幣火熱預售中,300美元=40萬幣黃金,以“媒體+金融+遊戲”3大實體項目做運營支撐應用,具有萬倍潛力,由幣媒體新聞平臺官方發行

认证标识
認證:Bimeiti News 官方帳號

——加密貨幣投資分析日報,開放式的區塊鏈新聞媒體平臺,提供全球最新加密貨幣、NFT、DeFi等區塊鏈新聞資訊閱讀與數字媒體內容創作輸出應用。

發佈留言