Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

10545

.pdf
Скачиваний:
1
Добавлен:
25.11.2023
Размер:
6.75 Mб
Скачать

09.04.01-УММ-М.1.2.5-ПИС-ЛК04-Инструмент Microsoft Analysis Services в процессе анализа данных

Сначала на странице Select a Data Source выберите существующий реляционный источник данных (для этого примера выберите BI_Source) и нажмите кнопку Next. На следующей странице мастера — Select Tables and Views — добавьте таблицы, входящие

в куб как таблицы измерений или как таблицы фактов. Чтобы добавить таблицу, в

панели Available objects выберите ее имя и нажмите кнопку >, чтобы переместить эту

таблицу в панель Included Objects. Для этого примера выберите в базе данных AdventureWorksDW таблицы для клиентов и продуктов (Dim Customer и Dim Product

соответственно). Эти таблицы будут использоваться для создания куба измерений.

Они создают набор таблиц измерения для схемы типа "звезда".

Далее, на этой же странице мастера нужно указать одну или несколько таблиц фак-

тов, которые соответствуют выбранным таблицам измерений. (Одна таблица фактов

вместе с соответствующими таблицами измерений создает схему типа "звезда".)

Для этого внизу панели Included objects нажмите кнопку Add Related Tables. Таким

образом мы даем задание системе найти таблицы, которые связаны с таблицами DimCustomer и DimProduct. (Чтобы найти связанные таблицы, система просматривает все зависимости "первичный ключ/внешний ключ", которые существуют в базе данных.)

Система обнаружит несколько таблиц фактов и поместит их в панель Included objects.

Для создания схемы типа "звезда" из всех этих таблиц требуется только одна:

FactInternetSales. Кроме соответствующих таблиц фактов, система также выполняет поиск и добавляет другие таблицы, созданные отдельно для уровня иерархии соответствующего измерения. Одной из таких таблиц, которую следует оставить, является таблица DimProductSubcategory, которая воплощает уровень иерархии Subcategory измерения Product. Также следует оставить таблицу Dim Date, т. к.

измерение Time почти всегда является частью куба.

Таким образом, для нашей схемы типа "звезда" требуются следующие пять таблиц (как

показано на рис. 22.3):

FactInternetSales;

DimCustomer;

DimDate;

DimProduct;

DimProductSubcategory.

Удалите все другие выбранные системой таблицы из правой панели, выбрав не- нужную таблицу и нажав кнопку <

09.04.01-УММ-М.1.2.5-ПИС-ЛК04-Инструмент Microsoft Analysis Services в процессе анализа данных

.

Рис. 3. Страница Select Tables and Views мастера Data Source View Wizard

Завершив отбор таблиц, нажмите кнопку Next. На следующей странице мастера,

Completing the Wizard, укажите имя для нового представления источника данных (для

нашего примера это будет BI_View) и нажмите кнопку Finish.

После нажатия кнопки Next и небольшого времени обработки в окне Data Source View

Designer будет отображено графическое представление выбранных таблиц в

определенной нами схеме данных, как это показано на рис. 22.4.

(Инструмент Data Source View Designer используется для отображения графического

представления схем данных.)

09.04.01-УММ-М.1.2.5-ПИС-ЛК04-Инструмент Microsoft Analysis Services в процессе анализа данных

Рис. 4. Отображение выбранных таблиц в окне Data Source View Designer

Инструмент Data Source View Designer предоставляет несколько полезных функций.

Для перемещения по объектам представления источника данных нужно навести указатель мыши на значок скрещенных двунаправленных стрелок в правой нижней

части окна. Когда форма указателя мыши сменится на подобную этому значку,

нажмите и удерживайте левую кнопку мыши. В правом нижнем углу панели просмотра

схемы откроется небольшое окно навигации, в котором можно перемещаться в любую часть диаграммы. Эта функциональность особенно полезна для диаграмм с большим

количеством объектов. Альтернативно, перемещаться по диа- грамме можно с помощью обычных полос прокрутки (горизонтальной и вертикальной), что более подходит

для диаграмм небольшого размера. Для просмотра данных таблицы щелкните требуемую таблицу правой кнопкой мыши и в контекстном меню выберите пункт

Explore Data. Содержимое таблицы отобразится в отдельном окне.

Можно также создавать именованные запросы, которые сохраняются на постоянной

основе, что позволяет обращаться к ним как к любой таблице. Чтобы создать

именованный запрос, выберите пункт меню Data Source View, а затем пункт New

Named Query. Откроется диалоговое окно Create Named Query, в котором можно

создавать любые запросы для выбранных таблиц.

1.6 Создание куба

Прежде чем создавать куб, нужно задать один или несколько источников данных и

создать представление источника данных, как было описано ранее в предшествую-

09.04.01-УММ-М.1.2.5-ПИС-ЛК04-Инструмент Microsoft Analysis Services в процессе анализа данных

щих разделах. После этого можно приступать к созданию куба.

Для этого в обозревателе решений щелкните правой кнопкой мыши папку Cubes

проекта BI_Project и в контекстном меню выберите пункт New Cube. Откроется страница приветствия мастера кубов. Нажмите кнопку Next. На странице Select Creation Method выберите переключатель Use Existing Tables, поскольку представление источника данных уже существует и его можно использовать для созда-

ния куба. Нажмите кнопку Next.

На странице Select Measure Group Tables выбираются меры из таблиц фактов. Выберите

здесь таблицу Fact Internet Sales и нажмите кнопку Next. Мастер отберет все

возможные меры из указанной таблицы фактов и отобразит их на странице Select

Measures. Установите только флажок столбца Total Product Costs таблицы Fact Internet

Sales только для одной меры (рис. 22.5) и нажмите кнопку Next.

Рис. 5. Таблица мастера Select Measures

На странице Select New Dimensions выберите все три измерения (Dim Date, Dim

Product и Dim Customer), которые нужно создать на основе имеющихся таблиц, и

нажмите кнопку Next. На последней странице мастера Completing the Wizard ото-

бражается сводная информация по всем выбранным мерам и измерениям. Введите имя

создаваемого куба (в данном примере BI_Cube) и, чтобы создать этот куб, нажмите кнопку Finish.

1.7 Проектирование агрегирования для хранилища

Как упоминалось в главе 21, базовые данные из таблицы фактов можно суммировать

наперед и сохранять результаты в постоянных таблицах. Этот процесс называется

агрегированием и может существенно повысить скорость выполнения запросов, поскольку сканирование миллионов строк по ходу выполнения запроса для вычисления агрегатного значения может занять очень длительное время.

09.04.01-УММ-М.1.2.5-ПИС-ЛК04-Инструмент Microsoft Analysis Services в процессе анализа данных

Существует прямая взаимосвязь между требованиями дискового пространства для хранения агрегированных значений и процентом всех возможных агрегирований, которые вычисляются и сохраняются. Создание всех возможных агрегированных значений куба и сохранение их на диске позволяет получить наилучшее время выполнения всех запросов. Недостатком этого подхода являются значительные требования процессорных ресурсов для вычисления агрегированных значений и диско-

вого пространства для их хранения.

С другой стороны, если не вычислять наперед и не сохранять никаких агрегаций, не

будет требоваться дополнительного дискового пространства, однако выполнение

запросов, содержащих агрегатные функции, будет медленным, вследствие необхо-

димости вычисления каждого агрегатного значения в ходе выполнения запроса. Для разработки оптимальных агрегаций службы SSAS предоставляют мастер

Aggregation Design Wizard. Чтобы запустить этот мастер, сначала нужно запустить

средство Cube Designer. (Средство Cube Designer применяется для редактирования

разных свойств существующих кубов, включая группы мер и отдельные меры, измерения куба и взаимосвязи между измерениями.) Для этого щелкните правой кнопкой требуемый куб в обозревателе решений и в контекстном меню выберите пункт Open

или View Designer. В открывшемся окне средства Cube Designer откройте вкладку

Aggregations. В отображенной таблице (Fact Internet Sales) щелкните правой кнопкой

ячейку в столбце Aggregations и в контекстном меню выберите пункт Design Aggregations. Будет запущен мастер Aggregation Design Wizard.

На первой странице мастера, Review Aggregation Usage, можно просмотреть и от-

корректировать параметры агрегирования. В частности, можно включить или отключить атрибуты, отображенные на этой странице. Оставьте параметры как они есть

и нажмите кнопку Next.

На следующей странице, Specify Object Counts, нужно указать количество членов в

каждом атрибуте. Прежде чем мастер может начать создать и сохранять выбранные

агрегации, для каждого выбранного объекта куба требуется предоставить чис ло значений или число секций. Эту задачу можно выполнить с помощью мастера, нажав

кнопку Count. На рис. 22.6 показана страница Specify Object Counts с результатами

этих вычислений мастера. Нажмите кнопку Next.

09.04.01-УММ-М.1.2.5-ПИС-ЛК04-Инструмент Microsoft Analysis Services в процессе анализа данных

Рис.6. Страница мастера Specify Object Counts после подсчета мастером объектов

На предпоследней странице, Set Aggregation Options, для указания точки, до которой нужно проектировать агрегации (или не проектировать их вообще), выберите одну из

четырех следующих опций:

Estimated storage reaches_MB (предполагаемый объем хранилища достигнет_Мбайт) — задает максимальный объем дискового хранилища, который сле-

дует использовать для вычисленных наперед агрегаций. Чем больше это значение, тем большее количество вычисленных наперед агрегаций будет создано;

Performance gain reaches_% (прирост производительности достигнет %) — задает прирост производительности, которую требуется получить. Чем больше

процентное значение вычисленных наперед агрегаций, тем лучше будет произ-

водительность запросов;

I click Stop (я нажму кнопку Stop) — позволяет пользователю остановить про-

цесс проектирования в любой момент по своему желанию;

Do not design aggregation (0%) (не проектировать агрегирование) — указывает не создавать вычисляемые наперед агрегации.

На рис. 7 показан результат выбора второй опции, для которой было установлено значение 80%.

09.04.01-УММ-М.1.2.5-ПИС-ЛК04-Инструмент Microsoft Analysis Services в процессе анализа данных

Рис. 7. Результат выбора проектирования агрегаций для получения 80% прироста

производительности

Система создала шесть агрегаций и использует 243,4 Кбайт для их хранения.

Чтобы перейти к странице Completing the Wizard, нажмите кнопку Next. На этой

странице можно выбрать метод применения полученных агрегаций: немедленно (переключатель Deploy and process now) или позже (переключатель Save the aggregations but do not process them). Выберите второй переключатель и нажмите

кнопку Finish.

1.8 Обработка куба

Если в предшествующем разделе вы выбрали рекомендованную опцию Save the aggregations but do not process them, то теперь нужно выполнить обработку куба.

Куб требуется обрабатывать после его создания и после каждого его изменения.

Если куб содержит большой объем данных и вычисляемых наперед агрегаций, его обработка может занимать очень длительный промежуток времени. Чтобы начать

обработку куба, в папке Cubes обозревателя решений щелкните правой кнопкой мыши

требуемый куб и в контекстном меню выберите пункт Process. Система начинает

обработку куба, отображая ход выполнения этого процесса (рис. 8).

09.04.01-УММ-М.1.2.5-ПИС-ЛК04-Инструмент Microsoft Analysis Services в процессе анализа данных

Рис. 8. Окно обработки куба с индикатором хода выполнения

1.9 Просмотр куба

Для просмотра куба, щелкните правой кнопкой мыши требуемый куб и в контекстном меню выберите опцию Browse. Откроется окно просмотра куба Browse. Здесь в запрос можно вставить любое измерение, щелкнув правой кнопкой имя требуемого

измерения в левой панели и выбрав в контекстном меню опцию Add to Query. Таким же образом к запросу добавляются и меры. (Меры рекомендуется добавлять первыми.) На

рис. 22.9 показано табличное представление общей стоимости продуктов для

продаж типа Internet Sales для разных клиентов и продуктов.

Для вычисления значений мер для определенных измерений и их иерархий приме-

няется другой подход. Предположим, например, что нам нужно предоставить клиентам с идентификаторами 11008 и 11741 информацию об общей стоимости всех

09.04.01-УММ-М.1.2.5-ПИС-ЛК04-Инструмент Microsoft Analysis Services в процессе анализа данных

Рис. 9. Общая стоимость продаж типа Internet Sales для разных клиентов и продуктов

продуктов, которые они заказали в период между 1/03/2006 и 31/08/2006. Для этого мы сначала перетаскиваем меру Total Product Cost с левой панели в панель редак-

тирования, а затем в расположенной выше панели выбираем значения, чтобы огра-

ничить условия для каждого измерения (рис. 22.10).

Сначала в столбце Dimension выбираем таблицу Dim Customer, а в столбце Hierarchy

первичный ключ этой таблицы: Customer Key. Затем в столбце Operator выбираем

Equal, а в столбце Filter Expression — значения 11008 и 11741.

Таким же образом задаются условия для таблицы измерений Dim Product с единст-

венной разницей, что вместо указания только двух значений, выбирается опция All с

помощью установки соответствующего флажка в столбце Filter Expression. (Корень

каждого измерения представляется значением All.) Наконец, для таблицы измерения Dim Date выбирается столбец Order Date с соответствующим ключом. В этом случае в столбце Operator выбирается значение Range (Inclusive), а в столбце Filter Expression

— начальная и конечная дата требуемого периода. Общая сумма продаж по заданным

фильтрам составляет 2171.2942, как это можно видеть на рис. 10.

09.04.01-УММ-М.1.2.5-ПИС-ЛК04-Инструмент Microsoft Analysis Services в процессе анализа данных

Рис. 10. Вычисление общей стоимости продаж продуктов определенным клиентам за

определенный период времени

1.10 Извлечение и доставка данных

Теперь, когда мы знаем, как создавать и просматривать куб с помощью средства BIDS, можем перейти к рассмотрению того, как извлекать из куба данные и доставлять их пользователям. Основной целью средства Development Studio является разработка проектов бизнес-аналитики, а не извлечение данных и доставка их пользователям. Для этой задачи существует много других интерфейсов, включая следующие:

надстройка PowerPivot for Excel;

язык запросов Multidimensional Expressions (MDX);

среда Management Studio;

инструментальный набор OLE DB for OLAP;

инструменты сторонних разработчиков;

поставщик данных ADOMD.NET.

Надстройка PowerPivot for Excel и язык запросов MDX рассматриваются каждый

отдельно в последующих двух разделах, а остальные средства, из ранее приведенного списка, рассмотрены здесь вкратце. Этим двум средствам уделено большое

внимание, чем остальным по той причине, что надстройка PowerPivot for Excel яв- ляется самым важным интерфейсом для конечных пользователей, а язык запросов

MDX используется во многих SSAS-решениях сторонних разработчиков.

Для просмотра куба в среде Management Studio запустите этот инструмент и подключитесь к серверу служб SSAS, на котором развернут требуемый куб. В

обозревателе объектов разверните папку Database, а в ней разверните папку Cube,

которая содержит все кубы, созданные для данной базы данных. Щелкните правой

кнопкой мыши требуемый куб и, в появившемся контекстном меню, выберите пункт

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]