Данные находятся в основе Power BI. При изучении данных, создании диаграмм и панелей мониторинга или добавлении вопросов в список вопросов и ответов все визуализации и ответы, отображаемые на экране, основаны на определенном наборе данных. Этот набор извлекается из источника.

В этой статье мы рассмотрим различные типы источников данных, к которым можно подключаться из службы Power BI. Помните о том, что существует и множество других источников. Однако для них вам могут потребоваться приложение Power BI Desktop либо расширенные функции запросов и моделирования Excel. Мы обратимся к этим темам позже. Пока что изучим различные типы источников данных, к которым можно подключаться непосредственно с сайта службы Power BI.

Чтобы загрузить информацию из любого из этих источников, в Power BI нужно выбрать Моя рабочая область > Получить данные.

Файлы

Excel (XLSX, XLXM). Особенность Excel заключается в том, что книга может содержать как значения, введенные непосредственно на листах, так и данные, загруженные из внешних источников с помощью запросов Power Query (функция "Скачать и преобразовать" в Excel 2016) или Power Pivot. Вы можете импортировать данные из таблиц на листах (данные должны быть в формате таблицы) или данные, загруженные в модель данных. Дополнительные сведения см. в статье Получение данных из Excel.

Power BI Desktop (формат PBIХ) — с помощью Power BI Desktop можно запрашивать и загружать данные из внешних источников, добавлять в модель данных меры и отношения, а также создавать отчеты. Файл Power BI Desktop можно импортировать на сайт Power BI. Приложение Power BI Desktop лучше всего подходит для более опытных пользователей, которые хорошо понимают, как работают их источники данных, запросы и преобразования, а также знакомы с принципами моделирования данных. Дополнительные сведения см. в статье Подключение к данным в Power BI Desktop.

Файл с разделителями-запятыми (CSV). Это обычные текстовые файлы, данные в которых упорядочены по строкам. Каждая строка может содержать одно или несколько значений через запятую Например, в CSV-файле с именами и адресами может быть несколько строк, каждая из которых содержит значение имени, фамилии, улицы, номера дома, города, региона и т. д. Импортировать данные в CSV-файл нельзя, однако многие приложения, такие как Excel, позволяют сохранять данные из простых таблиц в виде таких файлов.

Данные других типов, таких как таблицы XML (XML) и текстовые файлы (TXT), можно извлечь и преобразовать с помощью функции «Скачать и преобразовать», а затем загрузить в файл Excel или Power BI Desktop. После этого такой файл можно импортировать в Power BI.

Многое также зависит от того, где хранятся файлы. Служба OneDrive для бизнеса обеспечивает высокую степень гибкости и интеграции с Power BI. Файлы можно хранить и на локальном диске, однако для обновления данных потребуется выполнить несколько дополнительных действий. Дополнительные сведения приведены в статьях по ссылкам.

Пакеты содержимого

В пакетах содержимого есть все необходимые данные и отчеты, уже готовые к работе. В Power BI есть пакеты содержимого двух типов: загруженные из служб наподобие Google Analytics, Marketo и Salesforce, а также созданные и опубликованные другими пользователями организации.

Службы. Существуют буквально десятки служб с пакетами содержимого для Power BI, и каждый день появляются новые. Для работы с большинством из них необходима учетная запись. Дополнительные сведения см. в статье Подключение к службам.

Организация. Если у вас и других пользователей организации есть учетная запись Power BI Pro, вы можете создавать, публиковать и использовать пакеты содержимого. Дополнительные сведения см. в статье Знакомство с пакетами содержимого организации.

Базы данных

Базы данных в облаке. Из службы Power BI можно в режиме реального времени подключаться к базам данных и хранилищу данных SQL Azure, службам Spark на Azure HDInsight и SQL Server Analysis Services с помощью DirectQuery. Подключения из Power BI к этим базам данных являются динамическими. Это означает, что при работы с информацией с помощью отчетов в Power BI в режиме соединения, например, с базой данных SQL Azure каждый раз, когда вы создаете срез данных или добавляете поле в визуализацию, формируется запрос непосредственно к базе. Дополнительные сведения см. в разделе Azure и Power BI.

Локальные базы данных. Из службы Power BI можно подключаться непосредственно к базам данных табличных моделей в службах SQL Server Analysis Services. Для этого необходим корпоративный шлюз Power BI. Если вы не знаете точно, как подключиться к базе данных табличной модели организации, уточните это у своего администратора или в отделе ИТ. Дополнительные сведения см. в разделе Табличные данные служб SQL Server Analysis Services в Power BI.

Для работы с корпоративными базами данных других типов потребуется сначала установить подключение, извлечь и загрузить информацию в модель данных с помощью приложения Power BI Desktop или Excel. После этого файл можно импортировать в Power BI, где будет создан соответствующий набор данных. Если у вас настроено обновление по расписанию, Power BI использует сведения о подключении из файла, а также заданные вами параметры для подключения непосредственно к источнику данных и запроса обновлений. Новая информация затем загружается в набор данных в Power BI. Дополнительные сведения см. в статье Подключение к данным в Power BI Desktop.

Что, если мои данные находятся в другом источнике?

Для работы с Power BI можно использовать буквально сотни различных источников данных. Однако независимо от того, где находится ваша информация, для создания отчетов и панелей мониторинга, поиска ответов в списках вопросов и ответов и т. д. формат этих данных должен поддерживаться службой Power BI.

Данные в некоторых источниках, таких как пакеты содержимого от поставщиков наподобие Google Analytics и Twilio, уже представлены в формате, готовом к работе с Power BI. Это относится и к базам данных табличных моделей служб SQL Server Analysis Services. Кроме того, можно в режиме реального времени подключаться к облачным базам данных, таким как SQL Azure и Spark на HDInsight.

В других случаях может потребоваться извлечь и загрузить необходимые данные в файл. Например, предположим, информация о логистических операциях находится в хранилище данных на корпоративном сервере. Из службы Power BI невозможно подключиться непосредственно к этой базе и приступить к работе с хранящимися в ней сведениями (если только это не база табличной модели). Однако эту информацию можно извлечь и загрузить в модель данных с помощью приложения Power BI Desktop или Excel, а затем сохранить ее в виде файла. После этого файл можно импортировать в Power BI, где будет создан соответствующий набор данных.

У вас может возникнуть вопрос: что, если логистическая информация меняется каждый день? Как сделать так, чтобы сведения в Power BI постоянно обновлялись? В набор данных вместе с информацией из файла Power BI Desktop или Excel импортируются и сведения о подключении. Если у вас настроено обновление по расписанию либо вы обновляете набор данных вручную, Power BI использует эту информацию вместе с рядом дополнительных параметров для установки соединения непосредственно с базой данных, запроса обновлений и их загрузки в набор. Для безопасного обмена данными между локальным сервером и Power BI, вероятно, потребуется шлюз Power BI Gateway. Все визуализации в отчетах и информационных панелях обновляются автоматически.

Как мы видим, невозможность непосредственного подключения к источнику данных непосредственно из службы Power BI не означает, что данные нельзя загрузить в Power BI. Для этого просто потребуется несколько дополнительных действий и, возможно, помощь специалистов из отдела ИТ. Дополнительные сведения см. в статье Источники данных в Power BI Desktop.

Еще кое-что

В контексте Power BI часто встречаются термины "набор данных" и "источник данных". Они часто смешиваются, но на самом деле это две разные, хотя и связанные между собой вещи.

Набор данных автоматически создается в Power BI при использовании операции получения данных для подключения к пакету содержимого, файлу и импорта данных из него или при подключении к источнику динамических данных. Набор данных содержит сведения об источниках данных, учетные данные для подключения к ним, а во многих случаях и подмножество данных, скопированных из источника. В большинстве случаев при создании визуализаций в отчетах и панелях мониторинга используются данные из набора.

Источник данных — это место происхождения данных в наборе. Например, это может быть веб-служба, такая как Google Analytics или QuickBooks, база данных в облаке, такая как SQL Azure, либо база данных или файл на локальном компьютере или сервере вашей организации.

Обновление данных

Если ваши файлы хранятся на локальном диске или другом компьютере организации, для обновления наборов данных в Power BI вам, возможно, потребуется шлюз Power BI Gateway. Кроме того, во время обновления компьютер, на котором находится соответствующий файл, должен быть включен. Вы также можете повторно импортировать файл или воспользоваться функцией публикации из Excel или Power BI Desktop, однако эти действия выполняются вручную.

Если вы подключаетесь к файлам, которые хранятся в службе OneDrive для бизнеса или на сайтах групп SharePoint, либо импортируете из них информацию в Power BI, ваши наборы данных, отчеты и панели мониторинга будут всегда актуальны. Поскольку службы OneDrive и Power BI являются облачными, Power BI примерно раз в час подключается непосредственно к сохраненному файлу для проверки обновлений. При их наличии все наборы данных и визуализации обновляются автоматически.

Пакеты содержимого из служб обновляются автоматически. В большинстве случаев это происходит раз в сутки. Обновление можно выполнить и вручную, однако наличие или отсутствие новых данных зависит от поставщика соответствующей службы. Пакеты содержимого, публикуемые пользователями организации, связаны с соответствующими источниками данных, и их обновление зависит от параметров, настроенных их создателями.

Особенность базы данных и хранилища данных SQL Azure, а также Spark на Azure HDInsight заключается в том, что эти источники находятся в облаке. Поскольку служба Power BI также является облачной, она может подключаться к этим источникам данных в динамическом режиме с помощью DirectQuery. Благодаря этому все содержимое в Power BI постоянно синхронизировано с источниками, и настраивать его обновление не требуется.

Особенность служб SQL Server Analysis Services заключается в том, что подключение к ним из Power BI является динамическим (так же, как, например, к облачной базе данных Azure), но при этом сама база расположена на корпоративном сервере. Для подключений такого типа необходим шлюз Power BI Gateway, который обычно настраивают специалисты отдела ИТ.

Обновление данных — исключительно важный аспект работы с Power BI, и здесь невозможно рассмотреть все связанные с этим вопросы. Если вы хотите подробнее ознакомиться с ними, изучите статью Обновление данных в Power BI.

Рекомендации и ограничения

Для всех источников данных, используемых в службе Power BI, действуют приведенные ниже ограничения и рекомендации. Существуют и другие ограничения, которые относятся к отдельным функциям, но перечисленные ниже ограничения действуют для службы Power BI в целом.

  • Максимальный размер набора данных. Максимальный размер каждого набора данных в службе Power BI не может превышать 1 ГБ.
  • Ограничение количества строк. Максимальное число строк в наборе данных (если не используется DirectQuery) составляет 2 млрд. Три из этих строк зарезервированы, поэтому для использования остаются доступными 1 999 999 997 строк. Максимальное количество строк при использовании DirectQuery равно 1 млн.
  • Ограничение количества столбцов. Максимальное число столбцов в наборе данных (все таблицы в наборе данных) равно 16 000. Это ограничение распространяется на службу Power BI, а также на наборы данных в Power BI Desktop. В Power BI в каждой таблице из набора данных один столбец используется для внутренней нумерации строк. Это означает, что максимальное количество столбцов в каждой таблице из набора данных равно 16 000 минус один столбец.