Power BI 散佈圖中的高密度取樣

Power BI 取樣演算法可改善散佈圖代表高密度數據的方式。

例如,您可能會從組織的銷售活動建立散佈圖,每個商店每年都有數萬個數據點。 這類資訊的散佈圖會從該數據有意義的表示法中取樣數據,以說明銷售在一段時間內的發生方式。 本文將說明高密度數據取樣的詳細數據。

Screenshot of a scatter chart, showing the high-density sampling data.

注意

本文所述的高密度取樣演算法可在Power BI Desktop和 Power BI 服務散佈圖中取得。

高密度散佈圖的運作方式

先前, Power BI 會以決定性的方式選取完整基礎數據範圍中的範例數據點集合,以建立散佈圖。 具體而言,Power BI 會選取散佈圖數列中第一個和最後一個數據列,然後將剩餘的數據列平均除以在散佈圖上繪製 3,500 個數據點。 例如,如果樣本有 35,000 個數據列,則會選取第一個和最後一個數據列進行繪製,則每十個數據列也會繪製 (35,000 / 10 = 每十個數據列 = 3,500 個數據點)。 此外,在數據序列中不會顯示無法繪製的 Null 值或點,例如文字值,因此在產生視覺效果時不會考慮。 透過這類取樣,散佈圖的感知密度也是以代表性數據點為基礎,因此隱含的視覺密度是取樣點的情況,而不是基礎數據的完整集合。

當您啟用 高密度取樣時,Power BI 會實作能消除重疊點的演算法,並確保與視覺效果互動時可以到達視覺效果上的點。 此演算法也可確保數據集中的所有點都會以視覺效果表示,提供內容給所選點的意義,而不只是繪製代表性的範例。

根據定義,高密度數據會取樣,以建立響應互動的視覺效果。 視覺效果上的數據點太多可能會降低其速度,並減去趨勢的可見度。 取樣數據的方式會驅動取樣演算法的建立,以提供最佳的視覺效果體驗,並確保所有數據都呈現。 在 Power BI 中,演算法已改善,以提供回應性、表示和清楚保留整體數據集中重要點的最佳組合。

注意

使用高密度取樣演算法的散佈圖最適合繪製在方形視覺效果上,如同所有散佈圖一樣。

散佈圖取樣演算法的運作方式

散佈圖高密度取樣的演算法會採用更有效率地擷取和表示基礎數據的方法,並消除重疊點。 此演算法會從每個數據點的小半徑開始,這是視覺效果上指定點的視覺圓形大小。 然後,它會增加所有數據點的半徑。 當兩個或多個數據點重疊時,增加半徑大小的單一圓形代表那些重疊的數據點。 演算法會繼續增加數據點的半徑,直到該半徑值導致散佈圖中顯示的合理數據點數(3,500 個)。

此演算法中的方法可確保產生的視覺效果中會呈現極端值。 演算法也會在決定重疊時採用小數字數,如此一來,指數尺規就會以逼真度呈現至基礎可視化點。

此演算法也會保留散佈圖的整體形狀。

注意

針對散佈圖使用 高密度取樣 演算法時, 數據的準確分佈 是目標, 而不是 隱含的視覺密度。 例如,您可能會看到散佈圖,其中有許多圓圈在特定區域中重疊(密度),並假設必須在那裡叢集許多數據點。 由於高密度取樣演算法可以使用一個圓形來代表許多數據點,因此不會顯示這類隱含視覺密度或「群集」。 若要在指定區域中取得更詳細的數據,您可以使用交叉分析篩選器來放大。

此外,無法繪製的數據點,例如 Null 或文字值,會被忽略,因此會選取另一個可以繪製的值。 這進一步可確保維護散佈圖的真實形狀。

使用散佈圖的標準演算法時

在某些情況下,高密度取樣無法套用至散佈圖,並使用原始演算法。 這些情況如下:

  • 如果您以滑鼠右鍵按下 [值] 底下的值,並將其設定為 [顯示功能表中沒有數據的專案],散佈圖會還原為原始演算法。

    Screenshot of the Visualization menu, showing the Values pane with Show items with no data selection.

  • [播放軸] 欄位中的任何值都會導致散佈圖還原為原始演算法。

  • 如果散佈圖上遺漏 X 和 Y 軸,圖表會還原為原始演算法。

  • 在 [分析] 窗格中使用比例線會導致圖表還原為原始演算法。

    Screenshot of the Visualization menu, showing a pointer to the Analytics pane and Ratio line.

如何開啟散佈圖的高密度取樣

若要將高密度取樣切換至 [開啟],請選取散佈圖、移至 [格式化視覺效果] 窗格、展開 [一般] 卡片,然後在該卡片底部附近,將 [高密度取樣] 切換滑桿滑動[開啟]。

Screenshot of the Visualization menu, showing a pointer to the Format visual pane, General card, and High Density Sampling toggle slider.

注意

開啟開關之後,Power BI 會儘可能嘗試使用 高密度取樣 演算法。 當無法使用演算法時,例如當您在 Play 軸中放置值時,即使圖表已還原為標準演算法,參數仍會保持開啟狀態。 如果您接著從 Play 軸移除值,或條件變更為啟用高密度取樣演算法,圖表會自動使用該圖表的高密度取樣,因為此功能為作用中。

注意

數據點是由索引分組或選取。 擁有圖例不會影響演算法的取樣。 它只會影響視覺效果的排序。

考量與限制

高密度取樣演算法是Power BI的重要改進。 不過,高密度取樣演算法只適用於 Power BI 服務 型模型、匯入模型或 DirectQuery 的實時連線。