Desde la versión de septiembre de 2017 de Power BI Desktop y las actualizaciones del servicio Power BI, hay disponible un nuevo algoritmo de muestreo que mejora cómo se representan los datos de alta densidad en los gráficos de dispersión.

Por ejemplo, podría crear un gráfico de dispersión de la actividad de ventas de la organización, cada almacén con decenas de miles de puntos de datos de cada año. Un gráfico de dispersión de dicha información realizará un muestreo de los datos (seleccionando una representación significativa de los datos para ilustrar cómo se producen las ventas a través del tiempo) a partir de los datos disponibles y creará un gráfico de dispersión que representa los datos subyacentes. Esta es una práctica común en los gráficos de dispersión de alta densidad y Power BI ha mejorado el muestreo de datos de alta densidad, cuyos detalles se describen en este artículo.

Nota: El algoritmo de muestreo de alta densidad que se describe en este artículo se aplica y está disponible en los gráficos de dispersión, tanto en Power BI Desktop como en el servicio Power BI.

Modo de funcionamiento de los gráficos de dispersión de alta densidad

Anteriormente, Power BI seleccionaba una colección de puntos de datos de muestra en el intervalo completo de datos subyacentes de manera determinista para crear un gráfico de dispersión. En concreto, Power BI seleccionaría la primera y última fila de datos de la serie del gráfico de dispersión y a continuación dividiría las filas restantes uniformemente para representar un total de 3500 puntos de datos en el gráfico de dispersión. Por ejemplo, si la muestra tenía 35 000 filas, se seleccionarán la primera y la última fila para trazar, y se trazaría cada décima fila (35 000/10 = cada décima fila = 3500 puntos de datos). Anteriormente, los valores NULL o los puntos que no se podían trazar (por ejemplo, los valores de texto) de la serie de datos no se mostraban y, por tanto, no se tenían en cuenta al generar el objeto visual. Con este tipo de muestreo, la densidad percibida del gráfico de dispersión también se basaba en los puntos de datos representativos y, por tanto, la densidad visual implícita era una circunstancia de los puntos de la muestra y no de la colección completa de los datos subyacentes.

Cuando se habilita el muestreo de alta densidad, Power BI implementa un algoritmo que elimina los puntos que se superponen y se asegura de que se puedan alcanzar los puntos del objeto visual al interactuar con el mismo. También se asegura de que todos los puntos del conjunto de datos se representan en el objeto visual, lo que proporciona contexto para el significado de los puntos seleccionados, en lugar de simplemente trazar una muestra representativa.

Por definición, los datos de alta densidad se muestrean para crear visualizaciones de forma razonablemente rápida y que respondan a la interactividad (si hay demasiados puntos de datos en un objeto visual, este puede bloquearse y la visibilidad de las tendencias puede quedar limitada). La forma en la que se muestrean los datos para proporcionar la mejor experiencia de visualización y asegurarse de que todos los datos están representados es lo que promovió la creación del algoritmo de muestreo. En Power BI, el algoritmo se ha mejorado para proporcionar la mejor combinación de capacidad de respuesta, representación y conservación de los puntos importantes en el conjunto de datos.

Nota: Los gráficos de dispersión que usan el algoritmo de muestreo de alta densidad se trazan mejor en objetos visuales cuadrados, al igual que ocurre con todos los gráficos de dispersión.

Modo de funcionamiento del nuevo algoritmo de muestreo de gráficos de dispersión

El nuevo algoritmo de muestreo de alta densidad para gráficos de dispersión emplea métodos que capturan y representan los datos subyacentes de forma más eficaz y elimina los puntos que se superponen. Lo hace comenzando con un radio pequeño para cada punto de datos (el tamaño del círculo visual de un punto dado en la visualización). A continuación, aumenta el radio de todos los puntos de datos; cuando se superponen dos (o más) puntos de datos, un círculo único (con el tamaño del radio aumentado) representa los puntos de datos superpuestos. El algoritmo continúa aumentando el radio de los puntos de datos hasta que dicho valor del radio da como resultado un número razonable de puntos de datos (3500) para mostrar en el gráfico de dispersión.

Los métodos de este algoritmo garantizan que los valores atípicos se representarán en el objeto visual resultante. El algoritmo también respeta la escala a la hora de determinar la superposición, de modo que se visualicen las escalas exponenciales con fidelidad en los puntos visualizados subyacentes.

El algoritmo también conserva la forma general del gráfico de dispersión.

Nota: Cuando se usa el algoritmo de muestreo de alta densidad para gráficos de dispersión, la distribución precisa de los datos es el objetivo y la densidad visual implícita no es el objetivo. Por ejemplo, podría ver un gráfico de dispersión con una gran cantidad de círculos que se superponen (densidad) en un área concreta e imaginar que muchos puntos de datos deben estar agrupados ahí; puesto que el algoritmo de muestreo de alta densidad puede usar un círculo para representar muchos puntos de datos, tal densidad visual implícita (o "agrupación") no se mostrará. Para obtener más detalles de una zona determinada, puede utilizar controles deslizantes para acercar la vista.

Además, se omiten los puntos de datos que no se pueden trazar (por ejemplo, los valores NULL o valores de texto), por lo que se selecciona otro valor que se puede trazar para garantizar aún más que la forma real del gráfico de dispersión se mantenga.

Cuándo se usa el algoritmo estándar para los gráficos de dispersión

Hay circunstancias en las que el muestreo de alta densidad no se puede aplicar a un gráfico de dispersión y se utiliza el algoritmo original. Dichas circunstancias son las siguientes:

  • Si hace clic con el botón derecho en Detalles y, a continuación, selecciona Mostrar elementos sin datos en el menú que aparece, el gráfico de dispersión volverá al algoritmo original.

  • Cualquier valor en el eje Reproducir dará como resultado que el gráfico de dispersión vuelva al algoritmo original.

  • Si faltan los ejes X e Y en un gráfico de dispersión, el gráfico vuelve al algoritmo original.

  • El uso de una línea de relación en el panel Análisis hace que el gráfico se revierte al algoritmo original.

Activación del muestreo de alta densidad para un gráfico de dispersión

Para activar el muestreo de alta densidad, seleccione un gráfico de dispersión y, a continuación, vaya al panel Formato y expanda la tarjeta General. En la parte inferior de la tarjeta, hay disponible un control deslizante de alternancia llamado Muestreo de alta densidad. Para activarlo, deslícelo hasta Activado.

Nota: Una vez que el control deslizante está activado, Power BI intentará usar el algoritmo de muestreo de alta densidad siempre que sea posible. Cuando el algoritmo no se puede usar (por ejemplo, si se coloca un valor en el eje Reproducir), el control deslizante permanece en la posición Activado aunque el gráfico se haya revertido al algoritmo estándar. Si después quita un valor del eje Reproducir (o cambian las condiciones para habilitar el uso del algoritmo de muestreo de alta densidad), como el control deslizante está activado, el gráfico utilizará automáticamente el muestreo de alta densidad para ese gráfico.

Nota: Los puntos de datos se agrupan o seleccionan por el índice. Tener una leyenda no afecta al muestreo para el algoritmo, solo afecta a la ordenación del objeto visual.

Consideraciones y limitaciones

El algoritmo de muestreo de alta densidad es una mejora importante en Power BI, pero hay algunas consideraciones que debe conocer a la hora de trabajar con valores de alta densidad y gráficos de dispersión.

  • El algoritmo Muestreo de alta densidad solo funciona con conexiones dinámicas a modelos basados en el servicio Power BI, modelos importados o DirectQuery.

Más información

Para más información sobre el muestreo de alta densidad en otros tipos de gráficos, consulte el artículo siguiente.