O Spark no Azure HDInsight com DirectQuery permite criar relatórios dinâmicos baseados nos dados e nas métricas que você já tem em seu cluster do Spark. Com o DirectQuery, as consultas são enviadas de volta para o cluster do Spark no HDInsight conforme você explora os dados na exibição do relatório. Essa experiência é sugerida para usuários que estão familiarizados com as entidades aos quais eles se conectam.

Aviso:

Atualização automática de bloco foi desabilitada para blocos de dashboard criados em conjuntos de dados com base no Spark. Você pode selecionar Atualizar Blocos do Dashboard para atualizar manualmente. Os relatórios não são afetados e devem permanecer atualizados.

  • Cada ação, como selecionar uma coluna ou adicionar um filtro, enviará uma consulta de volta para o banco de dados – antes de selecionar campos muito grandes, considere escolher um tipo adequado de visual.
  • P e R não estão disponíveis para conjuntos de dados do DirectQuery.
  • As alterações de esquema não são selecionadas automaticamente.
  • Os grupos estão disponíveis apenas no Power BI Pro.

Essas restrições e observações podem mudar conforme continuamos a aprimorar as experiências. As etapas para conectar são detalhadas abaixo. Documentação adicional pode ser encontrada em Usar ferramentas de BI com o Apache Spark no Azure HDInsight

  1. Selecione Obter Dados na parte inferior do painel de navegação esquerdo.

  2. Selecione Bancos de Dados e Mais.

  3. Selecione o conector Spark no HDInsight e escolha Conectar.

  4. Insira o nome do servidor que você deseja se conectar, bem como seu nome de usuário e senha. O servidor sempre está no formato <clustername>.azurehdinsight.net, veja mais detalhes sobre como localizar estes valores a seguir.

  5. Uma vez conectado, você verá um novo conjunto de dados com o nome "SparkDataset". Você também pode acessar o conjunto de dados por meio do bloco de espaço reservado que é criado.

  6. Detalhando o conjunto de dados, você pode explorar todas as tabelas e colunas do banco de dados. Selecionar uma coluna resultará no envio de uma consulta de volta para a fonte, criando dinamicamente seu visual. Esses elementos visuais podem ser salvos em um novo relatório e fixados de volta em seu painel.

Localizando seus parâmetros do Spark no HDInsight

O servidor sempre está no formato <clustername>.azurehdinsight.net e pode ser encontrado no Portal do Azure.

O nome de usuário e a senha também podem ser encontrados no Portal do Azure.

Solução de problemas

Se estiver acessando problemas ao executar consultas em seu cluster, verifique se o aplicativo ainda está em execução e reinicie se necessário.

Você também pode alocar recursos adicionais no Portal do Azure em Configuração > Cluster de Escala:

Consulte também

Introdução: criar o cluster do Apache Spark no HDInsight Linux e executar consultas interativas usando o Spark SQL
Introdução ao Power BI
Obter dados para o Power BI
Mais perguntas? Experimente a Comunidade do Power BI