Você pode usar R, uma linguagem de programação amplamente usada por estatísticos, cientistas de dados e analistas de dados, no Editor de Consultas do Power BI Desktop. Essa integração de R ao Editor de Consultas permite executar a limpeza de dados usando R e executar análise e modelagem de dados avançadas em conjuntos de dados, inclusive completar dados ausentes, fazer previsões e clustering, apenas para citar alguns exemplos. R é uma linguagem poderosa e pode ser usada no Editor de Consultas para preparar seu modelo de dados e criar relatórios.

Instalando o R

Para usar R no Editor de Consultas do Power BI Desktop, você precisa instalar R no computador local. É possível baixar e instalar o R gratuitamente em vários locais, incluindo a página de download do Revolution Open e o Repositório CRAN.

Uso de R no Editor de Consultas

Para mostrar como usar R no Editor de consultas, usaremos um exemplo de um conjunto de dados do mercado de ações, com base em um arquivo .CSV que você pode baixar aqui para acompanhar o exemplo. As etapas deste exemplo são as seguintes:

  1. Primeiro, carregue os dados no Power BI Desktop. No exemplo, carregaremos o arquivo EuStockMarkets_NA.csv. Selecione Obter Dados > CSV na faixa de opções Início no Power BI Desktop.

  2. Selecione o arquivo e selecione Abrir. O CSV será exibido na caixa de diálogo Arquivo CSV.

  3. Depois que os dados forem carregados, você os verá no painel Campos no Power BI Desktop.

  4. Abra o Editor de Consultas selecionando Editar Consultas na guia Início do Power BI Desktop.

  5. Na guia Transformar, selecione Executar Script R, e o editor Executar Script R será exibido (mostrado na próxima etapa). Observe que as linhas 15 e 20 têm dados ausentes, assim como outras linhas que você não pode ver na imagem a seguir. As etapas a seguir mostram como R pode (e vai) completar essas linhas para você.

  6. Para este exemplo, vamos inserir o seguinte código de script:

    library(mice)
    tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100)
    completedData <- complete(tempData,1)
    output <- dataset
    output$completedValues <- completedData$"SMI missing values"
    

    Observação: você precisará ter a biblioteca mice instalada em seu ambiente de R para que o código de script anterior funcione corretamente. Para instalar mice, execute o seguinte em sua instalação de R: | > install.packages('mice')

    Quando colocado na caixa de diálogo Executar Script R, o código é semelhante ao seguinte:

  7. Quando selecionarmos OK, o Editor de Consultas exibirá um aviso sobre a privacidade dos dados.

  8. Para que os scripts de R funcionem corretamente no serviço do Power BI, todas as fontes de dados precisam ser definidas como públicas. Para obter mais informações sobre as configurações de privacidade e suas implicações, confira Níveis de privacidade.

    Em seguida, vemos uma nova coluna em Campos, chamada completedValues. Observe que há alguns elementos de dados ausentes, como nas linhas 15 e 18. Veremos como R lida com isso na próxima seção.

    Aviso

Com apenas cinco linhas de script R, o Editor de Consultas preencheu os valores ausentes com um modelo preditivo.

Criar elementos visuais com base em dados de script R

Agora, podemos criar um elemento visual para ver como o código de script R usando a biblioteca mice preencheu os valores ausentes, conforme mostrado na imagem a seguir.

Quando esse elemento visual for concluído, assim como outros elementos visuais que talvez desejemos criar usando o Power BI Desktop, poderemos salvar o arquivo do Power BI Desktop (que é salvo como um arquivo .pbix) e, em seguida, usar o modelo de dados, inclusive os scripts R que fazem parte dele, no serviço do Power BI.

Observação: quer ver um arquivo .pbix concluído com estas etapas concluídas? Você está com sorte: pode baixar o arquivo concluído do Power BI Desktop usado nesses exemplos aqui.

Depois que você carregar o arquivo .pbix no serviço do Power BI, algumas etapas serão necessárias para habilitar a atualização de dados (no serviço) e habilitar os elementos visuais para serem atualizados no serviço (os dados precisam acessar R para que os elementos visuais sejam atualizados). As etapas adicionais são as seguintes:

  • Habilitar atualização agendada para o conjunto de dados - para habilitar a atualização agendada para a pasta de trabalho que contém o conjunto de dados com scripts R, confira Configurar a atualização agendada, que também inclui informações sobre o Gateway Pessoal.

  • Instale o Gateway Pessoal - você precisa de um Gateway Pessoal instalado no computador em que o arquivo está localizado e R está instalado. O serviço do Power BI deve acessar essa pasta de trabalho e renderizar novamente qualquer elemento visual atualizado. Você pode obter mais informações sobre como Instalar e configurar o Gateway Pessoal.

Limitações

Existem algumas limitações para consultas que incluem scripts R criados no Editor de Consultas:

  • Todas as configurações de fonte de dados R devem ser definidas como Públicas, e todas as outras etapas em uma consulta criada no Editor de Consultas também devem ser públicas. Para obter as configurações de fonte de dados, no Power BI Desktop, selecione Arquivo > Opções e configurações > Configurações de fonte de dados.

    Na caixa de diálogo Configurações de Fonte de Dados, selecione a fontes de dados, selecione Editar Permissões... e verifique se o Nível de Privacidade está definido como Público.

  • Para habilitar a atualização agendada do conjunto de dados ou dos elementos visuais R, você precisa habilitar a Atualização agendada e ter um Gateway Pessoal instalado no computador que hospeda a pasta de trabalho e a instalação de R. Para obter mais informações sobre ambos, confira a seção anterior deste artigo, que fornece links, para saber mais sobre cada um.

Há inúmeras coisas que você pode fazer com R e consultas personalizadas, então, explore e modele seus dados da maneira como deseja que eles sejam mostrados.