チュートリアル:Power BI Desktop を使用して Web ページのデータを分析する
昔からのサッカー ファンなら、UEFA 欧州選手権 (ユーロ カップ) の優勝国が気になります。 Power BI Desktop を使うと、このデータを Web ページからレポートにインポートして、データを表示する視覚エフェクトを作成できます。 このチュートリアルでは、Power BI Desktop を使って次のことを行う方法を学習します。
- Web データ ソースに接続し、使用可能なテーブルの間を移動します。
- Power Query エディターを使ってデータの整形と変換を行います。
- クエリに名前を付け、Power BI Desktop レポートにインポートします。
- マップと円グラフの視覚エフェクトを作成してカスタマイズします。
Web データ ソースに接続する
UEFA 優勝国のデータは、UEFA European Football Championship Wikipedia ページ (https://en.wikipedia.org/wiki/UEFA_European_Football_Championship
) の Results テーブルから取得できます。
Web 接続の確立には基本認証のみが使用されます。 Web コネクタを使用すると、認証が必要な Web サイトが正常に動作しないことがあります。
データをインポートするには:
Power BI Desktop の [ホーム] リボン タブで、 [データを取得] の横の矢印をドロップダウンして、 [Web] を選びます。
Note
[データの取得] 項目自体を選択するか、Power BI Desktop の [作業の開始] ダイアログから [データの取得] を選択し、 [データの取得] ダイアログの [すべて] または [その他] セクションから [Web] を選択して、 [接続] を選択することもできます。
[Web から] ダイアログで、URL
https://en.wikipedia.org/wiki/UEFA_European_Football_Championship
を [URL] テキスト ボックスに貼り付けて、 [OK] を選択します。Wikipedia の Web ページに接続すると、[ナビゲーター] ダイアログに、ページで使用可能なテーブルの一覧が表示されます。 テーブル名を選んでデータをプレビューできます。 Results[edit] テーブルに目的のデータがありますが、必要な形式と正確には一致していません。 レポートに読み込む前に、形式を変更し、データをクリーンアップします。
Note
[プレビュー] ペインには最後に選択したテーブルが表示されますが、[データの変換] または [読み込み] を選択すると、選択したすべてのテーブルが Power Query エディターに読み込まれます。
[ナビゲーター] の一覧で Results[edit] テーブルを選択し、 [データの変換] を選択します。
テーブルのプレビューが Power Query エディターで開きます。ここで、変換を適用してデータをクリーンアップできます。
Power Query エディターでデータを整形する
年と優勝国/地域だけを表示することによって、データをスキャンしやすくします。 Power Query エディターを使って、以下のデータ整形とクレンジングの手順を実行します。
まず、テーブルから 2 列を除くすべての列を削除します。 このプロセスの後半で、これらの列の名前を Year と CountryRegion に変更します。
[Power Query エディター] グリッドで、列を選択します。 複数の項目を選択するには、Ctrl キーを押しながら選択します。
右クリックして [他の列の削除] を選択するか、 [ホーム] リボン タブの [列の管理] グループから [列の削除]>[他の列の削除] を選択し、テーブルから他のすべての列を削除します。
or
インポートされたデータのこのバージョンには、年に Details という語が付加されています。 最初の列のセルから余計な単語 Details を削除できます。
最初の列を選択します。
右クリックし、 [値の置換] を選択するか、リボンの [ホーム] タブの [変換] グループから [値の変換] を選択します。 このオプションは、 [変換] タブの [任意の列] グループにもあります。
or
[値の置換] ダイアログの [検索する値] テキスト ボックスに「Details」と入力し、 [置換後の文字列] テキスト ボックスを空のままにします。そして、 [OK] を選択してこの列から Details という単語を削除します。
一部のセルには、年の値ではなく "Year" という単語のみが含まれています。 列をフィルター処理して、"Year" という単語が含まれていない行のみを表示できます。
列のフィルター ドロップダウン矢印を選択します。
ドロップダウン メニューで下にスクロールし、Year オプションの横にあるチェックボックスをオフにして [OK] を選択します。
勝者国のデータだけが表示されるので、2 列目の名前を CountryRegion に変更します。 列の名前を変更するには次のようにします。
2 列目のヘッダーをダブルクリックするか長押しします。
- 列ヘッダーを右クリックし、 [名前の変更] を選択します。
- \* 列を選択し、リボンの [変換] タブの [任意の列] グループから [名前の変更] を選択します。
or
ヘッダーに「CountryRegion」と入力して Enter キーを押し、列の名前を変更します。
CountryRegion 列が null
値の行もフィルターで除外します。 Year の値で行ったようにフィルター メニューを使って行うことができます。または次のようにしてもかまいません。
値が null である 2020 の行の CountryRegion セルを右クリックします。
コンテキスト メニューで [テキスト フィルター]>[指定の値と等しくない] を選び、そのセルの値を含むすべての行を削除します。
レポート ビューにクエリをインポートする
意図したとおりにデータを整形したので、クエリに "Euro Cup Winners" という名前を付けて、レポートにインポートすることができます。
[クエリ設定] ウィンドウの [名前] テキスト ボックスに「 欧州選手権の勝者」と入力します。
リボンの [ホーム] タブから [閉じて適用]>[閉じて適用] を選びます。
クエリが Power BI Desktop のレポート ビューに読み込まれて、 [フィールド] ペインに表示されます。
ヒント
いつでも次のようにして Power Query エディターに戻ってクエリを編集および調整できます。
- [フィールド] ペインで Euro Cup Winners の隣の [その他のオプション] の省略記号ボタン [...] を選択して、 [クエリの編集] を選択します。
- [レポート] ビューの [ホーム] リボン タブの [クエリ] グループで [データの変換] 選択します。
視覚エフェクトを作成する
データに基づいて視覚エフェクトを作成するには:
[フィールド] ペインで CountryRegion フィールドを選ぶか、フィールドをレポート キャンバスにドラッグします。 Power BI Desktop がデータを国/地域の名前として認識し、自動的にマップ視覚エフェクトを作成します。
隅のハンドルをドラッグしてマップを拡大し、すべての優勝国/地域の名前が表示されるようにします。
マップには、欧州選手権トーナメントで優勝したすべての国/地域のデータ ポイントが同じように表示されています。 国/地域が優勝した回数を反映するように各データ ポイントのサイズを変更するには、[視覚化] ペインの下部にある [バブル サイズ] の下の [ここにデータ フィールドをドラッグしてください] に Year フィールドをドラッグします。 フィールドが自動的に [Year のカウント] メジャーに変化し、マップ視覚エフェクトで優勝回数が多い国/地域ほどデータ ポイントが大きく表示されるようになります。
視覚エフェクトをカスタマイズする
ご覧のように、データに基づいて視覚化を作成することはとても簡単です。 また、意図した表現方法に少しでも近くなるように視覚エフェクトをカスタマイズするのも簡単です。
マップの書式を設定する
視覚エフェクトを選んで [視覚化] ウィンドウの [書式] (ペイント ブラシ) アイコンを選ぶことで、視覚エフェクトの外観を変更することができます。 たとえば、視覚エフェクトの "Germany" のデータ ポイントは誤解を招きやすい表現になっています。ドイツは西ドイツとして 2 回、ドイツとして 1 回優勝しているためです。 マップでは 2 つのポイントが分けられたりまとめられたりせずに、重ねて表示されます。 2 つのポイントに異なる色を設定して、このファクトをわかりやすくします。 また、マップのタイトルをよりわかりやすく魅力的にすることもできます。
視覚エフェクトを選び、[書式] アイコンを選んでから、[ビジュアル]>[バブル]>[色] を選んでデータの色のオプションを展開します。
[すべて表示] を [オン] にし、West Germany の横のドロップダウン メニューで黄色を選択します。
[全般]>[タイトル] を選んでタイトルのオプションを展開し、[テキスト] フィールドの現在のタイトルの代わりに「Euro Cup Winners」と入力します。
[テキストの色] を赤色、サイズを 12、[フォント] を [Segoe UI (Bold)] に変更します。
マップの視覚エフェクトは次の例のようになります。
視覚化の種類の変更
視覚化の種類を変更するには、視覚化を選択し、 [視覚化] ペインの上部で別のアイコンを選択します。 たとえば、マップ視覚エフェクトにはソビエト連邦のデータが表示されていません。この国/地域が世界地図上に存在しなくなったためです。 "ツリーマップ" や "円グラフ" のような別の種類の視覚エフェクトの方が、すべての値が表示されるためいっそう正確です。
マップを円グラフに変更するには、マップを選んでから、[視覚化] ペインで [円グラフ] アイコンを選択します。
ヒント
- [データの色] 書式オプションを使って、"Germany" と "West Germany" を同じ色にすることができます。
- 円グラフで優勝回数の多い国/地域をグループにするには、視覚化の右上隅にある省略記号 ([...]) を選択し、[Year のカウントで並べ替え] を選択します。
Power BI Desktop は、さまざまなデータ ソースからデータを取得して分析のニーズに合わせてデータの形を整えることから、このデータを機能豊富な対話型の方法で視覚化することまで、シームレスなエンド ツー エンドのエクスペリエンスを提供します。 レポートが完成したら、Power BI にアップロードし、それに基づいて、他の Power BI ユーザーと共有可能なダッシュボードを作成できます。