Руководство. Анализ данных веб-страницы с помощью Power BI Desktop

Как давний футбольный болельщик, вы хотите сообщить о победителях чемпионата Европы УЕФА (Кубок Европы) на протяжении многих лет. С помощью Power BI Desktop эти данные можно импортировать с веб-страницы в отчет и создавать визуализации, отображающие данные. В этом руководстве описано, как использовать Power BI Desktop для:

  • Подключение в источник веб-данных и перейдите по доступным таблицам.
  • Фигура и преобразование данных в Редактор Power Query.
  • Назовите запрос и импортируйте его в отчет Power BI Desktop.
  • Создание и настройка карты и визуализации круговой диаграммы.

Подключение в источник веб-данных

Вы можете получить данные победителей УЕФА из таблицы результатов на странице https://en.wikipedia.org/wiki/UEFA_European_Football_ChampionshipВикипедии чемпионата Европы по футболу УЕФА.

Screenshot shows Wikipedia Results table for the Euro Cup, which includes winners and other information.

Веб-подключения устанавливаются только с помощью базовой проверки подлинности. Веб-сайты, требующие проверки подлинности, могут работать неправильно с веб-соединителем.

Чтобы импортировать данные, выполните следующие действия.

  1. На вкладке "Главная лента Power BI Desktop" в раскрывающемся списке рядом со стрелкой "Получить данные" и выберите "Интернет".

    Screenshot shows the Get data option on the ribbon with Web selected.

    Примечание.

    Вы также можете выбрать сам элемент "Получить данные" или выбрать "Получить данные" в диалоговом окне "Начало работы" Power BI Desktop, а затем выбрать веб-сайт из раздела "Все" или "Другие" диалогового окна "Получить данные", а затем выбрать Подключение.

  2. В диалоговом окне "Из Интернета" вставьте URL-адрес в текстовое поле URL-адреса https://en.wikipedia.org/wiki/UEFA_European_Football_Championship и нажмите кнопку "ОК".

    Screenshot shows the From Web dialog where you can enter the URL for the webpage.

    После подключения к веб-странице Википедии диалоговое окно "Навигатор " отображает список доступных таблиц на странице. Чтобы просмотреть данные, можно выбрать любое из имен таблиц. В таблице "Результаты[правки] есть нужные данные, хотя это не совсем в нужной форме. Перед загрузкой данных в отчет вы будете перепечатываться и очищать их.

    Screenshot shows the Navigator dialog with a table selected and Transform Data highlighted.

    Примечание.

    В области предварительного просмотра показана последняя таблица, но все выбранные таблицы загружаются в Редактор Power Query при выборе преобразования данных или загрузки.

  3. Выберите таблицу "Результаты[изменить] в списке навигатора и выберите " Преобразовать данные".

    Предварительная версия таблицы открывается в Редактор Power Query, где можно применить преобразования для очистки данных.

    Screenshot shows Power Query Editor with imported data ready for transformations.

Данные фигуры в Редактор Power Query

Вы хотите упростить сканирование данных, отображая только годы и страны или регионы, которые выиграли. Вы можете использовать Редактор Power Query для выполнения этих действий по формированию и очистке данных.

Сначала удалите все столбцы, кроме двух из таблицы. Переименуйте эти столбцы в качестве Year и CountryRegion далее в процессе.

  1. В сетке Редактор Power Query выберите столбцы. Нажмите клавиши CTRL , чтобы выбрать несколько элементов.

  2. Щелкните правой кнопкой мыши и выберите "Удалить другие столбцы" или выберите "Удалить>другие столбцы" в группе "Управление столбцами" на вкладке "Главная лента", чтобы удалить все остальные столбцы из таблицы.

    Screenshot shows columns highlighted with Remove Other Columns selected in the context menu.

    or

    Screenshot shows columns highlighted with Remove Other Columns selected in the ribbon.

Эта версия импортированных данных содержит слово Details , добавленное в год. Вы можете удалить дополнительные сведения о слове из первых ячеек столбцов.

  1. Выберите первый столбец.

  2. Щелкните правой кнопкой мыши и выберите "Заменить значения" или выберите "Заменить значения" в группе "Преобразование" на вкладке "Главная" ленты. Этот параметр также найден в группе "Любой столбец " на вкладке "Преобразование ".

    Screenshot shows a column highlighted with Replace Values selected in the context menu.

    or

    Screenshot shows a column highlighted with Replace Values selected in the ribbon.

  3. В диалоговом окне "Заменить значения" введите "Сведения" в текстовом поле "Найти значение", оставьте текстовое поле "Заменить с пустым", а затем нажмите кнопку "ОК", чтобы удалить слово "Сведения" из этого столбца.

    Screenshot shows the Replace Values dialog where you can remove a word from a column.

Некоторые ячейки содержат только слово "Год", а не значения года. Вы можете отфильтровать столбец, чтобы отобразить только строки, не содержащие слово Year.

  1. Щелкните стрелку раскрывающегося списка фильтра в столбце.

  2. В раскрывающемся меню прокрутите вниз и снимите флажок проверка рядом с параметром "Год", а затем нажмите кнопку "ОК".

    Screenshot shows Text Filters in the context menu where you can remove entries.

Так как вы просматриваете только последние данные победителей сейчас, вы можете переименовать второй столбец в CountryRegion. Чтобы переименовать столбец, выполните следующие действия.

  1. Дважды щелкните или коснитесь и удерживайте его во втором заголовке столбца или

    • Щелкните правой кнопкой мыши заголовок столбца и выберите " Переименовать" или
    • Выберите столбец *и выберите "Переименовать " из группы "Любой столбец " на вкладке "Преобразование " ленты.

    Screenshot shows the Rename option selected from the context menu for a column.

    or

    Screenshot shows the Rename option selected from the ribbon.

  2. Введите CountryRegion в заголовке и нажмите клавишу ВВОД , чтобы переименовать столбец.

Вы также хотите отфильтровать строки, имеющие null значения в столбце CountryRegion . Вы можете использовать меню фильтра, как это было с значениями Года , или вы можете:

  1. Щелкните правой кнопкой мыши ячейку CountryRegion в строке 2020 года, которая имеет значение NULL.

  2. Выберите текстовые>фильтры не равны в контекстном меню, чтобы удалить строки, содержащие значение этой ячейки.

    Screenshot shows a context menu with Text Filters and Does Not Equal selected.

Импорт запроса в представление отчета

Теперь, когда вы создали нужные данные, вы можете присвоить запросу "Победители Кубка Евро" и импортировать его в отчет.

  1. В области "Запрос Параметры" в текстовом поле "Имя" введите победителей Кубка Евро.

    Screenshot shows Query Settings with the name Euro Cup Winners entered.

  2. Нажмите кнопку "Закрыть" и "Применить>" на вкладке "Главная" ленты.

    Screenshot shows the Close & Apply option on the Home ribbon.

Запрос загружается в представление отчета Power BI Desktop, где его можно увидеть на панели "Поля".

Screenshot shows the Fields pane with Euro Cup Winners fields, Country and Year.

Совет

Вы всегда можете вернуться к Редактор Power Query, чтобы изменить и уточнить запрос:

  • Выбор дополнительных параметров с многоточием (...) рядом с победителями Кубка Евро в области "Поля " и нажатием кнопки "Изменить запрос" или
  • Выбор данных преобразования в группе "Запросы" вкладки "Главная лента" в представлении отчета.

Создание визуализации

Чтобы создать визуализацию на основе данных, выполните приведенные далее действия.

  1. Выберите поле CountryRegion в области "Поля" или перетащите его на холст отчета. Power BI Desktop распознает данные как имена стран и регионов и автоматически создает визуализацию карты .

    Screenshot shows a map visualization of the Country/Region field.

  2. Увеличьте карту, перетащив дескриптора в углах, чтобы все имена стран и регионов были видимы.

    Screenshot shows the map enlarged, as described.

  3. На карте показаны одинаковые точки данных для каждой страны или региона, выигравшая турнир Кубка Европы. Чтобы сделать размер каждой точки данных отражением частоты победы страны или региона, перетащите поле "Год", чтобы перетащить поля данных здесь внижней части области "Визуализации". Поле автоматически изменяется на меру count of Year , и визуализация карты теперь отображает большие точки данных для стран или регионов, которые выиграли больше турниров.

    Screenshot shows the result of dragging Count of Year into Bubble size.

Настройка визуализации

Как видно, очень легко создавать визуализации на основе данных. Кроме того, можно легко настроить визуализации, чтобы лучше представить нужные данные.

Форматирование карты

Вы можете изменить внешний вид визуализации, выбрав ее, а затем щелкните значок "Формат " (кисть краски) на панели "Визуализации ". Например, точки данных "Германия" в визуализации могут быть вводящими в заблуждение, потому что Западная Германия выиграла два турнира, а Германия выиграла один. Карта заменяет две точки, а не разделяет или добавляет их вместе. Эти два пункта можно цветить по-разному, чтобы выделить этот факт. Вы также можете дать карте более описательное и привлекательное название.

  1. Выбрав визуализацию, выберите значок "Формат", а затем выберите цвета визуальных>> пузырьков, чтобы развернуть параметры цвета данных.

    Screenshot shows the Format icon selected with the Bubbles option open and Colors highlighted.

  2. Включите все, а затем выберите раскрывающееся меню рядом с Западной Германией и выберите желтый цвет.

    Screenshot shows colors you can select to change the color, including Theme colors and Recent colors.

  3. Выберите "Общий>заголовок", чтобы развернуть параметры заголовка, а в поле "Текст" введите "Победители Кубка Евро" вместо текущего названия.

  4. Измените цвет текста на красный, размер до 12 и шрифт в пользовательский интерфейс Segoe (полужирный).

    Screenshot shows the Title option, where you can change font color, size, and family.

Визуализация карты теперь выглядит следующим образом:

Screenshot shows the map visualization with the formatting changes applied.

Изменить тип визуализации

Вы можете изменить тип визуализации, выбрав его и выбрав другой значок в верхней части области визуализаций . Например, визуализация карты отсутствует в данных для Советского Союза, так как эта страна или регион больше не существует на карте мира. Другой тип визуализации, например диаграмма дерева или круговая диаграмма, может быть более точной, так как она отображает все значения.

Чтобы изменить карту на круговую диаграмму, выберите карту и щелкните значок круговой диаграммы в области "Визуализации ".

Screenshot shows the same fields changed to a pie chart.

Совет

  • Вы можете использовать параметры форматирования цветов данных, чтобы сделать "Германия" и "Западная Германия" одинаковым цветом.
  • Чтобы сгруппировать страны или регионы с наибольшим количеством побед на круговой диаграмме, выберите многоточие (...) в правом верхнем углу визуализации, а затем выберите " Сортировка по количеству лет".

Power BI Desktop обеспечивает простой комплексный интерфейс, от получения данных из широкого спектра источников данных и его формирования в соответствии с потребностями анализа до визуализации этих данных в широких и интерактивных способах. Когда отчет будет готов, вы можете отправить его в Power BI и создать панели мониторинга на его основе, которые можно предоставить другим пользователям Power BI.