Пример №1. Создание гистограмм
Мы уже писали о гистограммах в цикле статей «Tableau Essentials» («Самое необходимое в Tableau») здесь. Это визуальное представление данных, сгруппированных по бинам (bins). Давайте сконструируем пример при помощи источника данных Sample– Superstore.xlsx.
Мы хотим узнать, сколько времени займет доставка наших товаров. Отображение средних значений дает высокую степень детализации, но на самом деле это не слишком полезно.Нам надо получить разбивку – сколько товаров было доставлено за 1 день, за 2 дня и так далее. При помощи функции DateDiff я создаем вычисляемое поле с именем Days to Ship (Дней до отгрузки).
DATEDIFF(‘day’, [Order Date], [Ship Date])
Мы собираемся создать следующую гистограмму:
Когда речь идет о создании гистограмм, следует иметь в виду две важные вещи. Во-первых, для вашего объема данных лучше использовать функцию Count (Количество значений), а не Sum(Сумма), поскольку мы хотим знать, сколько значений попадает в каждый диапазон (бин). Во-вторых, следует помнить о самих бинах: для создания бина нам следует нажать правой кнопкой мыши на объем данных и выбрать Create > Bin (Создать > Бин). Этот бин будет служить в качестве измерения для области отображения. Ниже показано окно Create Bin (Создать бин):
Мы установили размер бина Size of bins равным 1, поскольку он должен включать 1 день. Однако если нажать на выпадающее меню, мы получим возможность вставить параметр:
Бины с параметром
Создать параметр для бина – это то же самое, что создать любой другой параметр. Вспомним четыре шага:
- Создание параметра;
- Отображение элемента управления;
- Использование параметра в вычислениях;
- Использование вычислений в области отображения.
Шаг № 1 – создание параметра. Использование параметра для отображения данных на гистограмме из бина – это шаги № 2 и № 4. И в последнюю очередь нам нужно отобразить элемент управления параметром для использования его в отчете.
Рекомендуем склеить параметр для бина с Range (Допустимые значения). В данном частном случае время доставки не превышает 7 дней, поэтому настроим параметр следующим образом:
Минимальное значение для бина – 1. Максимальное значение срока доставки группы товаров кратно 3. Например, все товары, доставляемые в течение 0, 1 или 2 дней попадут в первый бин по максимальному значению времени доставки. Товары, доставляемые в течение 3, 4 или 5 дней попадут в следующий бин, и так далее. При первом создании Tableau выбирает тип данных с плавающей точкой Float. Чтобы изменить тип данных на целое число Integer, который имеет смысл для нашей гистограммы, вернитесь к редактированию параметра. Там вы сможете выбрать тип Integer из выпадающего списка Data Type (Тип данных).
Пора отобразить элемент управления параметром. Вспомним, как это сделать – нажмите правой кнопкой мыши на желаемый параметр в разделе Parameters (Параметры) на панели Data (Данные), и выберите Show Parameter Control (Показать элемент управления параметром):
Как можно видеть, в качестве элемента управления выбран слайдер, который логичнее всего использовать для отображения. Можно отредактировать элемент управления параметром точно так же, как и элемент управления фильтром, в том смысле, что большинство опций, задающие внешний вид элемента управления в отчете и их функции те же самые.
В следующей статье на тему Глубокого погружения в параметры мы изучим линии референс значений (reference lines). Помните, существует множество способов добавления линий референс значений на область отображения: при помощи выпадающего меню Analysis (Анализ), панели Analytics (Аналитика), или по нажатию правой кнопкой мыши на оси. Кроме того, «линия референс значений» — это широкий термин. Пусть вас не смущают различные опции в меню Analytics (Аналитика) кроме опции Reference Line (Линии референс значений), такие как Reference Bands (Диапазоны референс значений), Distribution Bands (Диапазоны распределения) и т. п. Вы можете использовать параметры практически с каждым из них.
Пример № 2: Линия референс значений
В нашем первом примере мы начнем со столбчатой диаграммы рентабельности Profit Margin. Вспомним, что рентабельность – это:
Исходная область отображения выглядит так:
У нас есть различные целевые рентабельности, с которыми нужно сравнить фактические показатели. Используем эти целевые показатели для создания линии референс значений с параметром. Начнем с добавления линии референс значения. Добавив линию референс значений, вы сможете затем настроить ее при помощи окна Edit Reference Line, Band or Box (Редактировать линию референс значений, диапазон или ящичковую диаграмму).
Откройте выпадающий список Line — Value (Линия — Величина) и выберите Create New Parameter (Создать новый параметр):
Вот мой параметр:
Теперь график выглядит так:
Чтобы она стала чуть более полезной добавим немного условного форматирования к меткам со значениями меньше заданного линией референс значения. Когда пользователь отчетом изменит этот параметр, цвет меток также изменится. Чтобы сделать это, мы создадим простое вычисление, которое будет выдавать результат True (Истина) или False (Ложь), используемый при форматировании:
Profit Margin (Рентабельность) – это значение величины, а Profit Margin Goals (Целевая рентабельность) – наш параметр. Перетащим только что созданное вычисляемое поле на полку Color (Цвет) карточки Marks (Метки) и настроим цвета так, чтобы получить следующее:
Небольшая заметка о цветовой схеме области отображения: обозначив результат True (Истина) серым, а False (Ложь) красным, мы сделали так, чтобы область отображения сразу предупреждала о недостаточно рентабельных товарах. Мы показали, что такие товары, как Binders (Скоросшиватели) и Paper (Бумага) не дотягивают до целевой рентабельности. Может быть, наша цель – достичь минимальной рентабельности? Изменив цветовую схему так, чтобы результат True (Истина) был обозначен синим, а False (Ложь) серым, мы можем выделить товары, рентабельность которых достигла цели:
Видите разницу? Сам параметр не важен, важно понимать, что это — хорошая возможность показать, насколько цвет меток может помочь пользователю понять то, что вы хотите сказать – рассказываете ли вы об успехе (синий цвет) или сообщаете о неудачах (красный цвет).
Пулевая диаграмма (столбчатая диаграмма с маркером)
Используем полученные знания, чтобы добавить пулевую диаграмму, о чем просило сообщество Tableau. Создадим такой параметр, как целевая прибыль (Profit Goal) в виде процента от продаж. Этот процент будет основан на параметре Profit Margin Goals (Целевая рентабельность). Вычисляемое поле для целевой прибыли (Profit Goal) будет выглядеть следующим образом:
Все готово для создания области отображения. Сначала добавляем Profit (Прибыль) к Columns (Колонкам), отложив Category (Категории) в Rows (Рядах):
Теперь пришло время воспользоваться панелью Analytics (Аналитика), чтобы добавить линии референс значений и диапазоны распределения. Добавим наше вычисляемое поле Profit Goal (Целевая прибыль) на кнопку Detail (Детализация). Начнем с создания следующей линии референс значения:
Перейдем к диапазонам распределения:
И график примет следующий вид:
Диапазоны распределения обозначены областями серого цвета у каждого столбца, они отражают прогресс. В данном случае серые области показывают достижение 50%, 75% и 100% от целевой прибыли. Толстые черные линии референс значений означают финишную черту, они ясно показывают, какие категории превзошли показатель целевой прибыли.
Пример №3: Табличные вычисления в Tableau
Для того, чтобы добавить табличные вычисления, нажмите правой кнопкой мыши на любые данные, использованные в области отображения, и выберите Add Table Calculation (Добавить табличные вычисления) или Quick Table Calculation (Быстрые табличные вычисления). Начнём с исходной области отображения, где отражен непрерывный помесячный график Profit (прибыль):
Мы хотим добавить табличные вычисления скользящего среднего к данным Profit (Прибыль).
На экране появляется окно Table Calculation (Табличные вычисления):
Возможно, мы хотим добавить параметр к предыдущим значениям Previous Values. Мы хотим дать пользователю возможность изменять количество предыдущих значений, используемых в вычислении скользящего среднего. Таким образом, пользователь сможет решить сам, насколько сильно будут влиять на величину предыдущие значения. Чем больше значений будет участвовать в вычислении, тем более гладким будет выглядеть скользящее среднее.
К сожалению, Tableau не дает возможности включить параметр в окне Table Calculation (Табличные вычисления). В окне нет возможности выбрать параметр. На первый взгляд можно решить, что в данном случае параметр использовать нельзя.
Тем не менее, это сделать можно.
Превращение табличных вычислений в вычисляемое поле
Мы можем взять любые табличные вычисления, используемые в области отображения, и перетащить их на панель с данными, чтобы сохранить их в качестве вычисляемого поля. В этом заключается секрет использования параметра в табличных вычислениях. Давайте перетащим те самые табличные вычисления скользящего среднего на панель Data (Данные) и посмотрим, как они выглядят в редакторе вычисляемого поля:
Window_Avg (Окно среднего) – это функция, при помощи которой получается скользящее среднее в наших табличных вычислениях. В форме вычисляемого поля, мы можем добавить наш параметр. Давайте превратим значение Previous Values (Предыдущие значения) в параметр, чтобы дать возможность пользователю выбирать из значений за последние два, шесть или двенадцать месяцев.
Создадим параметр. Заполняя список значений, необходимо помнить, что следует использовать отрицательные числа для отражения предыдущих значений. В функции Window_Avg использование предыдущих двух значений обозначено числом
-2, поэтому наш список значений будет содержать значений -2, -6 и -12.
Посмотрим теперь, как выглядит параметр в наших вычислениях:
Наконец, нам нужно отобразить элемент управления параметром. Область отображения теперь будет содержать следующие табличные вычисления с параметром:
Вернемся в окно Table Calculation (Табличные вычисления) и посмотрим, как Tableau изменил настройки при добавлении параметра:
Окно настроек изменилось так, чтобы отразить сделанные нами изменения в редакторе Calculated Field (Вычисляемое поле). Результат наших вычислений отображается в области с заголовком Formula (Формула).