Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
книги хакеры / DAMA_DMBOK_Свод_знаний_по_управлению_данными.pdf
Скачиваний:
17
Добавлен:
19.04.2024
Размер:
13.88 Mб
Скачать

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

функционирования организации. По сути, метаданные являются путеводителем по всем дан ным, имеющимся в распоряжении организации. Следовательно, управление метаданными должно быть безупречным. Плохо управляемые метаданные приводят к следующим негатив ным последствиям:

появление избыточных данных и бессмысленных процессов управления ими;

дублирующие друг друга избыточные, устаревшие или вовсе не используемые словари, репо зитории и иные хранилища метаданных;

противоречивые определения объектов и элементов данных;

неверные и противоречивые оценки рисков, соответствующих различным категориям дан ных, в том числе проистекающих от их нецелевого использования или утечки;

конфликтующие между собой источники и версии метаданных и, как следствие, подрыв дове рия пользователей к любым определениям данных, используемых в организации.

Хорошо организованное управление метаданными обеспечивает полное и согласованное представ ление об информационных ресурсах организации и способствует эффективному налаживанию взаимодействия между организациями при проведении совместной разработки приложений.

1.2 Цели и принципы

Основные цели управления метаданными:

управление задокументированными на уровне организации знаниями о данных в привязке к бизнес-терминологии с целью обеспечения единообразной трактовки данных всеми, кто их использует;

сбор и интеграция метаданных из различных источников с целью обеспечения понимания пользователями сходств и различий между данными, поступающими из различных частей организации;

обеспечение качества, согласованности, актуальности и защищенности метаданных;

предоставление стандартных каналов доступа к метаданным всем потребителям данных (пользователям, системам, приложениям и процессам);

выработка и утверждение собственных или контроль соблюдения предписываемых стандар тов технических метаданных с целью обеспечения возможности обмена данными.

Руководящие принципы успешного внедрения решения по управлению метаданными таковы:

Приверженность со стороны организации. Высшее руководство организации должно пони мать необходимость адекватного управления метаданными для эффективного распоряжения корпоративными информационными активами, рассматривать его как часть стратегии рабо ты с данными и выделять достаточные объемы финансирования.

Управление метаданными

523

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

Стратегия работы с метаданными должна описывать общеорганизационный план создания, сопровождения, интеграции и использования метаданных. На основе стратегии вырабатыва ются требования, которые будут предъявляться к создаваемым ИТ-решениям или приобре таемым программным продуктам по управлению метаданными. Стратегия работы с метадан ными должна соответствовать бизнес-приоритетам.

Корпоративная перспектива. Осуществление управления метаданными в масштабах орга низации позволяет гарантировать возможность расширений и дополнений в будущем, но внедряться оно в любом случае должно поэтапно, чтобы обеспечить получение ощутимой финансовой отдачи за счет оптимизации после первых циклов внедрения.

Социализация. Проводите разъяснительную работу, доказывайте и обосновывайте необ ходимость и назначение метаданных каждого типа; донесение до всеобщего понимания цен ности метаданных послужит стимулом к их использованию бизнес-подразделениями и, что не менее важно, позволит привлечь к работе экспертов в различных предметных областях.

Доступность. Не забывайте удостоверяться в том, что все сотрудники знают порядок доступа к метаданным и умеют их использовать.

Качество. Важно понимать, что метаданные часто возникают в качестве побочного продук та различных процессов (моделирования данных, проектирования систем, определения биз нес-процессов и т. п.); необходимо сделать так, чтобы лица, отвечающие за эти процессы, несли персональную ответственность и за качество метаданных, порождаемых этими процессами.

Аудит. Установите стандарты метаданных и строго контролируйте их соблюдение.

Совершенствование. Создайте механизмы обратной связи и обрабатывайте поступающие от потребителей сигналы об ошибочных или устаревших метаданных.

1.3 Основные понятия и концепции

1.3.1 Метаданные как особая категория данных

Как уже было заявлено во введении к настоящей главе, метаданные — это разновидность дан ных, и, подобно любым другим данным, метаданные нуждаются в управлении. Некоторые орга низации сталкиваются с затруднениями как раз в вопросах проведения четкой границы между метаданными и всеми прочими данными. Теоретически эта граница соответствует переходу от абстракции к конкретике. Например, в докладе, предавшем огласке факты массового прослуши вания телефонов граждан США Агентством национальной безопасности, данные о номерах те лефонов и времени звонков как ни в чем не бывало называются «метаданными», и это как бы подразумевает, что к «настоящим» данным относится лишь содержание телефонных разгово ров. Однако здравый смысл подсказывает, что номера телефонов граждан, хронология звонков и продолжительность соединений также должны классифицироваться как просто данные, без приставки «мета-»1

1 Cole, David. «We kill people based on metadata». New York Review of Books. 10 May 2014, http://bit.ly/2sV1ulS

524

Г Л А В А 12

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

Возможно, «золотое правило» состоит в том, чтобы выделять пограничный слой данных, которые могут являться метаданными или информативными данными в различных контек стах, в частности в зависимости от степени осведомленности лица, получающего к ним доступ. Нечто, внешне выглядящее точь-в-точь как метаданные (например, список имен полей или на званий столбцов), на поверку может оказаться фактическими данными, — если, например, этот список названий используется для сравнительного анализа терминов, используемых различ ными организациями, с целью разобраться с фактическим содержанием данных, имеющихся у каждой из них.

Впрочем, для управления собственными метаданными организации ни к чему вдаваться в тонкости. Лучше сосредоточить усилия на своевременном определении дополнительно требую щихся метаданных для грядущих нужд в зависимости от того, для чего эти новые метаданные будут использоваться (для создания новых данных, углубленного анализа имеющихся, кроссплат форменной интеграции, управления доступом, публикации/распространения данных и т. п.), и источников данных, удовлетворяющих этим требованиям.

1.3.2 Виды метаданных

Обычно метаданные подразделяют на три основные категории:

бизнес-метаданные;

технические метаданные;

операционные метаданные.

Так людям понятнее, насколько широкий спектр информации и явлений оказывается «под одним зонтом» метаданных, и проще разбираться с функциями определения метаданных. К слову, эта же троичная классификация способна привнести в умы и немало путаницы, особенно если люди залипают на вопросах типа «К какой именно категории относится этот набор метаданных?» или «Кто отвечает за ведение этого набора метаданных и кто имеет право вносить в него изменения?». Лучше решать подобные вопросы, исходя из места происхождения метаданных, а не места или порядка их использования. Кстати, в процессе использования метаданных грани между тремя описанными типами оказываются весьма размытыми и не столь уж и значимыми. Техническому персоналу приходится иметь дело и с «бизнес-метаданными», и с «операционными метаданны ми»; то же самое касается и двух других категорий пользователей.

Впрочем, за пределами информационных технологий могут использоваться другие классы ме таданных. Например, в библиотечном деле стандартными категориями метаданных считаются:

описательные метаданные (автор, заглавие, предмет и т. д.), которые помогают идентифици ровать ресурсы и извлекать их из хранилищ;

структурные метаданные, которые описывают связи между ресурсами и внутреннюю компо новку и строение ресурсов (число томов, частей, глав, страниц и т. п.).

Управление метаданными

525

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

административные метаданные (номера версий, датировки архивных копий и т. п.), используе мые для управления ресурсами на протяжении их жизненного цикла.

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-x cha

 

 

 

 

Главное назначение всех подобных категорий — обеспечивать полезной дополнительной инфор мацией тех, кто отвечает за определение и проработку требований к метаданным.

1.3.2.1 БИЗНЕС-МЕТАДАННЫЕ

Бизнес-метаданные описывают, по большому счету, содержание и состояние данных, а также детали, необходимые для реализации функций распоряжения данными. К бизнес-метаданным относятся нетехнические наименования и определения понятий, названия и атрибуты предмет ных областей; типы данных и иные свойства атрибутов; описания диапазонов данных; расчетные формулы; алгоритмы и бизнес-правила; области допустимых значений данных и их определения. Примерами бизнес-метаданных могут служить:

определения и описания наборов, таблиц и столбцов данных;

бизнес-правила, правила преобразований, расчетные и логические формулы;

модели данных;

правила и результаты измерения показателей качества данных;

расписания обновления данных;

первоисточники и происхождение данных;

стандарты данных;

условные обозначения, используемые в системе записи и учета элементов данных;

ограничения по допустимым значениям;

контактная информация ответственных (например, владельцев или распорядителей данных);

классы секретности/конфиденциальности данных;

известные проблемы с данными;

примечания по использованию данных.

1.3.2.2 ТЕХНИЧЕСКИЕ МЕТАДАННЫЕ

Технические метаданные детально описывают всевозможные технические характеристики дан ных, систем их хранения и процессов перемещения данных между системами. Примеры:

названия таблицы и столбцов таблицы, используемые в физической модели данных;

свойства столбца;

свойства объекта БД;

права доступа;

правила создания, замены, обновления и удаления записей (create, replace, update and delete; CRUD);

физические модели данных, включая имена таблиц данных, ключи и индексы;

526

Г Л А В А 12

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

задокументированные связи между моделями данных и физическими ресурсами;

детализация операций по извлечению/передаче/загрузке данных (ETL);

определения схем данных в файловых форматах;

карты соотнесения данных между системами-источниками и адресатами;

документация, описывающая происхождение данных, включая влияние изменений на ин формацию выше и ниже по потоку обработки;

названия и описания используемых программ и приложений;

расписания заданий по загрузке/обновлению контента и зависимостей между ними;

правила резервного копирования и восстановления данных из резервных копий;

права доступа, группы и роли пользователей.

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-x cha

 

 

 

 

1.3.2.3 ОПЕРАЦИОННЫЕ МЕТАДАННЫЕ

Операционные метаданные детально описывают процессы обработки данных и управления до ступом к ним. Примеры:

журналы выполнения заданий пакетной обработки данных;

история и результаты выгрузки выборок данных;

сбои в расписаниях;

результаты аудита, балансировки и контрольных измерений;

журналы ошибок;

структура, частота и время/скорость обработки запросов данных и отчетов;

планы-графики исправлений, обновлений и выпуска новых версий и степень их соблюдения;

правила резервного копирования, периодичности и сроков хранения резервных копий, поря док активации плана аварийного восстановления и т. п.;

требования и условия соглашений об уровнях обслуживания;

схемы регистрации и распределения потоковой нагрузки;

правила архивирования данных, сроки хранения архивов, правила обеспечения связности архивных данных;

критерии окончательного удаления (утилизации) архивных данных;

правила совместного доступа к данным;

технические роли и обязанности, контактные данные.

1.3.3 Стандарт ISO/IEC 11179

Стандарт ISO/IEC 11179 предоставляет рамочную структуру для организации регистра мета данных (Metadata Registry, MDR). Он разработан для того, чтобы обеспечить обмен данными, управляемый на основе метаданных (metadata-driven) и базирующийся на точных определениях данных, начиная с их отдельных элементов. Стандарт состоит из следующих частей1:

1 Данные приведены по состоянию на 05.06.19 (стандарты находятся в состоянии динамической доработки). Для справки добавлены ссылки на соответствующие национальные стандарты РФ. — Примеч. пер.

Управление метаданными

527

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

Часть

Последняя версия ISO/IEC

Соответствующий ГОСТ

ISO/IEC 11179 IT — MDR

ГОСТ Р ИСО/МЭК 11179 ИТ. РМД

 

1.

ISO/IEC 11179-1:2015 Framework

ГОСТ Р ИСО/МЭК 11179-1-2010 Основные положения

2.

ISO/IEC TR 11179-2:2019 Classification

ГОСТ Р ИСО/МЭК 11179-2-2012 Классификация

3.

ISO/IEC 11179-3:2013 Registry metamodel and basic attributes

ГОСТ Р ИСО/МЭК 11179-3-2012 Метамодель регистра

и основные атрибуты

 

 

4.

ISO/IEC 11179-4:2004 Formulation of data definitions

ГОСТ Р ИСО/МЭК 11179-4-2012 Формулировка определений

данных

 

 

5.

ISO/IEC 11179-5:2015 Naming principles

ГОСТ Р ИСО/МЭК 11179-5-2012 Принципы наименования

и идентификация

 

 

6.

ISO/IEC 11179-6:2015 Registration

Регистрация

7.

ISO/IEC DIS 11179-7 Metamodel for data set registration*

Метамодель регистрации набора данных

 

* на финальной стадии согласования

информация о статусе в открытом доступе отсутствует

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-x cha

 

 

 

 

1.3.4 Метаданные, используемые для описания неструктурированных данных

По своей природе все данные имеют какую-то структуру, хотя не все из них могут быть отструк турированы в виде привычных строк и столбцов реляционных баз данных. Любые данные, пред ставленные не в виде баз данных или упорядоченных файлов данных, а в другой форме, вклю чая зафиксированные на различных носителях документы, рисунки, фото, аудио- и видеозаписи и т. д., относятся к неструктурированным (см. главы 9 и 14).

Метаданные для управления неструктурированными данными, вероятно, необходимы даже в большей мере, чем для управления структурированными данными. Возвращаясь к умозритель ной аналогии с библиотечным делом из вводной части главы: книги и периодика — хороший при мер неструктурированных данных. Главное назначение метаданных в этом случае — упорядоче ние картотеки-каталога этих изданий, чтобы каждый владелец читательского билета мог найти искомые материалы вне зависимости от их формата.

Метаданные, используемые для учета и систематизации неструктурированных данных, включают:

описательные метаданные (рубрики каталога, ключевые слова и т. п.);

структурные метаданные (теги, поля, форматы и т. п.);

административные метаданные (источники, расписания обновлений, права доступа, навига ционная информация и т. п.);

библиографические метаданные (записи в каталоге библиотеки и т. п.);

учетные метаданные (сроки и правила хранения и т. п.);

метаданные о порядке долговременного хранения (архив, условиях хранения, правила архи вирования и т. п.; подробнее см. в главе 9).

528

Г Л А В А 12

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

Большинство вышеперечисленных утверждений о метаданных для неструктурированных дан ных относятся к области традиционного управления контентом. Что касается всплеска инте реса к управлению неструктурированными большими данными, накапливаемыми в так назы ваемых озерах данных на платформах типа Hadoop, то тут, как выясняется, не обойтись без автоматизированной каталогизации обрабатываемых данных с целью обеспечения возможно сти последующего доступа к ним. В большинстве подобных платформенных решений преду смотрены процедуры сбора метаданных в процессе приема данных. Каждому объекту при его размещении в озере присваивается минимальный набор атрибутов метаданных (имя, формат, источник, версия, дата поступления и т. п.). По этим данным и выстраивается каталог содер жимого озера данных.

1.3.5 Источники метаданных

Одного взгляда на список типов метаданных достаточно, чтобы понять, что они собираются из множества различных источников. Кроме того, если управление метаданными отлажено и ве дется на уровне всех приложений по отдельности, собрать эти метаданные воедино, согласовать и интегрировать не составит труда. Увы, во многих организациях управлением метаданными не занимаются и на уровне отдельных приложений, тогда как приложения имеют свойство генери ровать метаданные автоматически в качестве побочного, но никак не конечного продукта (то есть метаданные с указанием автора, названия, даты и т. п. создаются и сохраняются, но никак не заточены под нужды потребителя). В результате, как и в случае с данными других категорий, интеграция метаданных требует больших объемов подготовительной работы.

Операционные метаданные так или иначе генерируются по мере обработки данных. Тут клю чевая задача состоит в том, чтобы наладить их сбор в удобной для использования форме, назна чить ответственных за их интерпретацию, формализацию и сопровождение — и обеспечить их всеми необходимыми для этого инструментами. Стоит отметить, что для интерпретации данных из таких источников, как, например, журналы регистрации ошибок, требуются метаданные, опи сывающие записи в журналах. Значительную часть технических метаданных также можно соби рать из системных источников — например, объектов баз данных.

Немало бизнес-метаданных можно получить методом декомпиляции существующих систем, а также из сопроводительных глоссариев, моделей и документации процессов (Loshin, 2001; Aiken, 1995). Однако такой подход следует признать весьма рискованным, прежде всего из-за не возможности точно выяснить степень тщательности и добросовестности исходных определений. Если разработчики действующих систем в свое время что-то не учли или недоработали, то и по лученные на основе их определений метаданные окажутся неточными или неоднозначными, то есть не будут выполнять своей функции, заключающейся в разъяснении потребителям точного смысла используемых ими данных.

Так что лучше целенаправленно выработать определения с нуля самостоятельно, чем полагаться на существующие. Для формулировки определений требуется немало времени

Управление метаданными

529

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

и определенные навыки (как минимум, владение языком технических описаний и умение пе реводить их на общедоступный язык). Именно поэтому разработка бизнес-метаданных долж на осуществляться под опекой ответственных распорядителей данных бизнес-подразделений (см. главу 3).

Значительная часть технических метаданных для СУБД и бизнес-метаданных для пользова тельских приложений может оперативно собираться в процессе их проектирования и при необ ходимости дорабатываться. Например, при моделировании данных так или иначе обсуждается точный смысл каждого элемента данных и связей между ними. Высказанные мнения должны документироваться, а потом их можно обобщить и взять за основу определений, используемых

всловарях данных, бизнес-глоссариях и прочих хранилищах метаданных. Сами по себе модели данных также служат немаловажным источником детализированных сведений о физических ха рактеристиках данных. Важно не жалеть времени на обеспечение наличия в сопроводительной документации к каждому проекту тщательно проработанных метаданных как артефакта, пол ностью соответствующего стандартам предприятия и готового к последующему использованию

винтеграционных решениях.

Качественно определенные наборы бизнес-метаданных можно использовать без каких-либо изменений, перенося из проекта в проект и лишь дополняя новыми определениями по мере по явления новых понятий и уточняя связанные определения. Такой подход весьма способствует выработке устойчивого и согласованного понимания отображения стандартных для бизнеса понятий в различных представлениях, описываемых различными наборами данных. По мере выработки универсальных метаданных многоцелевого назначения организации можно на чать задумываться и о планировании проекта интеграции метаданных. Для начала, например, можно составить опись всех используемых систем с указанием всех метаданных, относящихся

к каждой из них, и промаркировать все элементы метаданных тегами систем, в которых они используются.

Но помните, что создание метаданных — не самоцель. В большинстве организаций руко водство едва ли согласится финансировать проекты по созданию метаданных ради метаданных, а не ощутимого экономического эффекта от них, — а если и согласится, то на финансирование эксплуатационных расходов на поддержание в рабочем состоянии систем, не приносящих отда чи, в долгосрочной перспективе можно не рассчитывать. В этом отношении метаданные ничем не отличаются от любых других данных — как, впрочем, и во всех иных отношениях. Любые данные должны создаваться как продукт тщательно определенного процесса и с использова нием средств обеспечения их в целом высокого качества. Распорядители данных и специали сты по управлению данными должны следить за наличием и надлежащим функционированием механизмов ведения метаданных, относящихся к подконтрольным им процессам. Например, если организация собирает критически важные метаданные из моделей данных, нужно сделать так, чтобы процесс управления изменениями гарантировал перенос изменений в любой модели в метаданные, и наоборот.

530

Г Л А В А 12

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

Для иллюстрации широты диапазона и глубины проникновения метаданных в жизнь любой организации ниже приводятся примеры систем выступающих в роли источников метаданных1

1.3.5.1 РЕПОЗИТОРИИ МЕТАДАННЫХ ПРИЛОЖЕНИЙ

Репозиторием метаданных называют набор физических таблиц, в которых хранятся метаданные. Таблицы метаданных часто встраиваются в средства моделирования данных, BI и иные приложе ния. По мере созревания организации появляется естественное желание интегрировать метадан ные из репозиториев различных приложений в единый комплекс хранения метаданных, чтобы у потребителей была возможность получить целостное представление обо всем спектре имею щейся информации.

1.3.5.2 БИЗНЕС-ГЛОССАРИЙ

Назначение бизнес-глоссария — документирование и хранение используемых в деловой практи ке организации терминов и определений, а также связей между ними.

Во многих организациях бизнес-глоссарий ведется в формате простой электронной таблицы. Однако в зрелых организациях часто используются имеющиеся в продаже или разрабатываемые собственными силами глоссарии сложной иерархической структуры, содержащие надежно про веренную информацию и поддерживающие управление изменяющимися со временем термина ми, определениями и связями. Подобно любым системам, ориентированным на работу с данны ми, бизнес-глоссарии должны проектироваться таким образом, чтобы они были архитектурно согласованы с аппаратным и программным обеспечением, базами данных, процессами и челове ческими ресурсами, распределенными по различным ролевым функциями и сферам ответствен ности. Приложение, реализующее бизнес-глоссарий, должно строиться таким образом, чтобы функционально оно отвечало потребностям трех основных целевых аудиторий.

Бизнес-пользователи: аналитики данных, бизнес-аналитики, исследователи, руководите ли и менеджеры всех уровней используют бизнес-глоссарий для правильного понимания и истолкования терминологии и данных.

Распорядители данных используют бизнес-глоссарий для управления жизненным циклом терминов и определений, а также для развития всестороннего понимания знаний, накоплен ных на уровне предприятия, посредством сопоставления со всеми без исключения элемен тами данных терминов, определяемых в глоссарии; а со всеми терминами — компонентов, к которым они относятся: например, рабочих метрик, отчетов, аналитических показателей ка чества данных или технологических процессов. Распорядители данных также выявляют про блемы рассогласованности терминов и определений, используемых на различных участках

1 В англоязычном оригинале DMBOK2 источники метаданных (и подразделы с их описаниями) представлены просто в алфавитном порядке, а не в соответствии со степенью важности источника для организации (поскольку для от дельных организаций приоритеты могут быть разными). В данном издании сохранен порядок следования подразделов оригинала. — Примеч. науч. ред.

Управление метаданными

531

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

организации, и координируют выработки устраивающих все стороны решений по приведе

нию терминологии организации к общему знаменателю.

Технические пользователи: все, кто использует бизнес-глоссарий в процессе решения те кущих задач архитектурного и системного проектирования, развития ИТ-инфраструктуры, проведения анализа последствий планируемых изменений и т. д. и т. п.

В бизнес-глоссарии должны фиксироваться свойства каждого термина, включая, например:

термин (слово или словосочетание) и его определение, допустимые сокращения или аббревиа туры и синонимы (если таковые имеются);

бизнес-подразделение и/или приложение, управляющее данными, к которым относится термин;

лицо, ответственное за сопровождение термина, и дата последнего обновления определения;

классификационная или таксономическая принадлежность термина (или соответствую щая ему бизнес-функция);

определения, противоречащие определению термина, с описанием характера противоре

чий, плана и сроков их разрешения/устранения;

распространенные неверные трактовки термина с разъяснением сути ошибок;

технические алгоритмы выработки определения;

происхождение данных;

источник данных описываемых термином (официальный или авторитетный).

Любой бизнес-глоссарий на практике должен дополняться базовым набором отчетов, предна значенных для использования в административных процессах. Организациям настоятельно рекомендуется реализовывать глоссарии в виде электронных справочных ресурсов, а не в пе чатной форме, поскольку содержание глоссариев динамично меняется. За составление, ведение, использование, обработку и учет глоссариев обычно отвечают распорядители данных. Функция учета включает отслеживание новых терминов и определений, нуждающихся в рецензировании и утверждении, мониторинг статуса терминов и определений, находящихся в процессе согласо вания, и ведение отдельного сводного отчета с проблемными терминами, у которых отсутствуют определения или иные обязательные атрибуты (см. раздел 6.4).

Структура и функциональность бизнес-глоссариев могут варьироваться в широких пределах. Чем проще дается пользователям поиск по бизнес-глоссарию, тем выше вероятность обращения к его контенту. Однако ради простоты в обращении нельзя жертвовать самым главным качеством бизнес-глоссария, а именно — четкостью, полнотой и однозначностью трактовок определений.

1.3.5.3 ИНСТРУМЕНТЫ БИЗНЕС-АНАЛИТИКИ (BI)

Инструменты бизнес-аналитики генерируют собственные наборы метаданных, относящихся к бизнес-аналитическим моделям, включая описания обзорной информации, классов, объектов,

532

Г Л А В А 12

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

производных и рассчитываемых величин, фильтров, отчетов, полей и структуры отчетов, катего рий пользователей, которым адресованы отчеты, периодичности публикации и каналов распространения отчетов.

1.3.5.4 СРЕДСТВА УПРАВЛЕНИЯ КОНФИГУРАЦИЯМИ

Средства управления конфигурациями или базы данных управления конфигурациями (Configuration Management Databases, CMDB1), обеспечивают функциональную возможность ве дения метаданных в привязке к конкретным ИТ-ресурсам, включая управление связями между ними и деталями договоров, регулирующих доступ к каждому ресурсу. В CMDB каждый ИТресурс называется элементом конфигурации (Configuration Item, CI). В стандартной архитектуре CMDB сбор метаданных и управление ими реализованы на уровне типов CI. Многие организа ции практикуют интеграцию CMDB с процессами управления изменениями, что позволяет вы являть связанные между собой CI (ресурсы и/или приложения) и обеспечивать согласованное изменение настроек остальных связанных CI при изменении какой-либо настройки одного из CI. При этом архитектура хранилищ предусматривает механизмы привязки ресурсов репозитория метаданных к элементам физической реализации CMDB, что обеспечивает возможность получения полной картины распределения данных по платформам.

1.3.5.5 СЛОВАРИ ДАННЫХ

Словари определяют структуру и содержание наборов данных, используемых чаще всего

вотдельно взятой базе данных, приложении или хранилище. Словарь можно использовать для управления именами/названиями, описаниями, структурой, характеристиками, сроками и правилами хранения, значениями по умолчанию, связями/отношениями и/или ссылками, свойствами уникальности и иными атрибутами на уровне элементов данных модели. Также словарь должен содержать определения таблиц или файлов данных. Функции управления словарями данных встраиваются также и в программные средства создания, сопровождения и/или обработки различных массивов данных. В любом случае, чтобы сделать эти метаданные доступными потребителям данных, их нужно извлечь из источников — баз данных или средств моделирования. Словари данных могут также описывать на языке бизнес-терминологии, ка кие элементы данных доступны сообществу пользователей, какие ограничения по их выдаче предусмотрены требованиями информационной безопасности и защиты данных, применимых к различным бизнес-процессам. Для экономии времени, которое будет впоследствии затрачи ваться на определение, публикацию и ведение словарных статей, полезно изначально включить

впроект еще на уровне логической модели семантический слой с поддержкой анализа и учета контента. Однако, как уже отмечалось, полагаться на существующие определения весьма ри скованно, особенно в организации, пребывающей на зачаточном уровне понимания смысла и процессов управления метаданными.

1 сокр. от англ. Configuration management database. — Примеч. пер.

Управление метаданными

533

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

Многие ключевые бизнес-процессы, связи и термины выявляются и определяются на стадии разработки модели данных. При этом значительная часть этой бесценной информации часто утеривается при переходе от логической модели к физической или при реализации физической модели в производственной среде. Словарь данных помогает обеспечить сохранность этой ин формации, которая может очень и очень пригодиться организации на последующих этапах при ведения физической модели в соответствие с логической и согласования с ними решений, развер нутых в производственной среде.

1.3.5.6 СРЕДСТВА ИНТЕГРАЦИИ ДАННЫХ

Многие средства интеграции данных используются также и в качестве исполняемых программ для переноса данных из системы в систему или между различными модулями одной и той же системы. При этом они обычно генерируют промежуточные временные файлы, содержащие копии переноси мых данных или производные от них. Подобные средства способны загружать в свою рабочую об ласть данные из самых разнообразных источников и проводить над ними всевозможные операции: группировать, исправлять, переформатировать, объединять, фильтровать и т. п., — а полученные на выходе результаты распространять по целевым адресам. При этом средства интеграции обяза тельно ведут учет движения данных между системами и попутных преобразований, обеспечивая полное документирование их происхождения. Любое успешное решение по управлению метадан ными должно опираться на использование метаданных, описывающих происхождение и полную цепь преобразований данных в процессе интеграции, чтобы всегда можно было проследить полный и единственный путь каждого элемента данных от первоисточника до конечного пункта назначения.

Средства интеграции данных дают возможность внешним хранилищам метаданных собирать данные о происхождении информации и получать доступ к временным файлам метаданных че рез интерфейсы приложений (API). После завершения сбора всей необходимой информации хра нилищем метаданных некоторые средства позволяют генерировать целостные диаграммы проис хождения любого элемента данных. Средства интеграции данных также поддерживают ведение метаданных об исполнении различных задач по интеграции данных, включая данные о послед нем успешном запуске, продолжительности обработки и статусе исполнения задания. Некоторые хранилища метаданных способны также извлекать статистику последней обработки метаданных и отображать ее рядом с элементами данных (см. главы 6 и 8).

1.3.5.7 КАТАЛОГИ БАЗ ДАННЫХ И СУБД

Каталоги баз данных — один из важнейших источников исходной информации, требующейся для определения и обеспечения актуальности метаданных. В каталогах описывается наполнение баз данных и содержатся сведения о форматах, свойствах и длине полей, версиях и статусе разверты вания ПО, времени доступности сетевой инфраструктуры, систем и данных для пользователей, а также множество других атрибутов операционных и технических метаданных. Традиционно самая распространенная модель данных — реляционная. Системы управления реляционными базами дан ных рассматривают данные как набор связанных таблиц с различным числом столбцов, в которых

534

Г Л А В А 12

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

содержатся значения различных свойств или атрибутов строчных элементов данных, которые могут индексироваться, фильтроваться, запрашиваться для просмотра или обработки (см. главу 5). Реше ние по управлению метаданными должно «уметь» подключаться к базам данных различной архи тектуры и наборам данных под управлением различных приложений с целью считывания всех без исключения метаданных, которые можно вытянуть из каждой базы данных. Некоторые средства управления хранилищем метаданных поддерживают интеграцию метаданных, извлеченных из раз личных СУБД и репозиториев приложений, что бывает весьма полезно для получения более целост ной картины о фактически имеющихся у организации на физическом уровне ресурсах данных.

1.3.5.8 ИНСТРУМЕНТЫ УПРАВЛЕНИЯ МЭППИНГОМ ДАННЫХ

Инструменты управления мэппингом данных используются на стадии анализа структуры и про ектирования архитектуры данных предприятия для перевода проектных требований на язык спецификаций мэппинга, после чего полученные спецификации могут использоваться либо про граммным средством интеграции, либо программистами для написания утилит, используемых для преобразования данных на стыках между системами с целью их интеграции. Документация, описывающая мэппинг, часто ведется в масштабе организации в формате электронных таблиц, например Excel. В последнее время поставщики платформенных решений стали использовать ва риант корпоративной архитектуры данных предприятия с централизованным хранилищем спе цификаций мэппинга, поддерживающим контроль и сравнение версий. Модули мэппинга часто включаются в пакеты интеграционных решений, что позволяет автоматизировать программи рование решений по интеграции данных, а зачастую и обмен данными с хранилищами других метаданных и справочных данных (см. главу 8).

1.3.5.9 ИНСТРУМЕНТЫ ОЦЕНКИ И КОНТРОЛЯ КАЧЕСТВА ДАННЫХ

Инструменты проверки данных позволяют оценивать качество данных, определяя и фикси руя степень их соответствия установленным критериям точности, достоверности, актуально сти и т. п. Большинство подобных средств поддерживают функции обмена балльными оценка ми и профилями качества данных с репозиториями других метаданных, что позволяет системе управления главным репозиторием метаданных присваивать оценки качества соответствующим ресурсам физических данных.

1.3.5.10 CПРАВОЧНИКИ И КАТАЛОГИ

Словари и глоссарии данных содержат детальную информацию о терминологии, таблицах и по лях, а справочники и каталоги — сведения технического характера о системах, использующих данные, их источниках и местах хранения внутри организации. Справочник метаданных особен но полезен разработчикам и суперпользователям (администраторам, распорядителям и аналитикам данных), поскольку позволяет составить полное представление обо всем спектре данных, имеющихся в распоряжении организации, и очертить круг потенциальных источников проблем или входных данных для новых приложений.

Управление метаданными

535

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

1.3.5.11 СРЕДСТВА ОБМЕНА СООБЩЕНИЯМИ О СОБЫТИЯХ

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-x cha

 

 

 

 

Средства обмена сообщениями используются для передачи данных из системы в систему без необходимости какой-либо интеграции самих систем. Соответственно, для понимания смысла таких сообщений требуется множество метаданных на обеих сторонах канала передачи сообще ний. Средства передачи сообщений генерируют метаданные, описывающие структуру и порядок их передачи, а средства обработки входящих сообщений их интерпретируют и регистрируют со ответствующие события в своей системе. Подобные инструменты обычно включают графиче ские интерфейсы управления логикой перемещения данных. Детали реализации интерфейсов, алгоритмов и статистического учета движения и обработки сообщений они могу экспортировать в другие репозитории метаданных.

1.3.5.12 ИНСТРУМЕНТЫ И РЕПОЗИТОРИИ ДЛЯ МОДЕЛИРОВАНИЯ ДАННЫХ

Инструменты моделирования данных используются для построения моделей данных различ ного уровня — концептуальных, логических и физических. В процессе моделирования эти программные средства производят метаданные, описывающие компоненты архитектуры про ектируемого приложения или системы, такие как предметные области, логические сущности и атрибуты, связи между сущностями и их атрибутами, родительские типы и подтипы, табли цы, столбцы, индексы, первичные и внешние ключи, ограничения по целостности и прочие свойства, которые предусмотрены выбранными моделями данных. Данные о параметрах всех разрабатываемых моделей сохраняются в репозиториях метаданных соответствующих инстру ментов моделирования, а затем импортируются и интегрируются в корпоративное хранилище метаданных. Кроме того, средства моделирования часто служат источником терминов и опре делений для словарей данных.

1.3.5.13 РЕПОЗИТОРИИ СПРАВОЧНЫХ ДАННЫХ

Справочные данные документируют описания и значения различных данных, требующихся для бизнеса. Эти данные классифицируются по типам и контекстам (областям) использования в си стеме. Средства управления справочными данными позволяют также определять связи между различными кодифицированными величинами как внутри области, так и в более широком кон тексте. Эти наборы инструментов обычно поддерживают отправку подборок справочных данных в хранилище метаданных, где, в свою очередь, могут быть предусмотрены механизмы включе ния полученных справочных данных в бизнес-глоссарий и соответствующие столбцы таблиц или поля записей физических моделей, где эти данные используются.

1.3.5.14 РЕЕСТРЫ СЕРВИСОВ

При использовании сервис-ориентированной архитектуры (SOA) вся техническая информа ция о запущенных сервисах, потоках обработки и конечных адресатах данных хранится в рее стре сервисов, с помощью которого осуществляются все конфигурационные настройки систем и приложений. Через реестр с могут задаваться, например, определения, интерфейсы, операции,

536

Г Л А В А 12

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

параметры ввода/вывода, политики, версии и типовые сценарии использования служб данных. Важнейшими метаданными о любом сервисе являются: номер версии, местонахождение, ЦОД, статус доступности, дата подключения, сервисный порт, IP-адрес, порт статистики, время ожи дания подключения, повторного подключения и число попыток подключения до выдачи сообще ния об ошибке, и т. п. Имеется возможность адресовать запросы к реестрам сервисов на предмет получения интересующих данных: например, перечня всех активных или доступных сервисов, информации о текущих версиях, списка устаревших сервисов или детальной информации о ка ком-то конкретном сервисе. Также можно анализировать имеющиеся в реестре данные о серви сах на предмет выбора подходящего кандидата для повторного использования. Информация из подобных источников нередко позволяет выявлять важные факты, касающиеся данных и схем их перемещения между системами и/или приложениями. Метаданные, извлекаемые из реестров сервисов, можно интегрировать с метаданными, полученными из других источников, для полу чения полной картины обмена данными между всевозможными системами.

1.3.5.15 ПРОЧИЕ ХРАНИЛИЩА МЕТАДАННЫХ

Метаданные могут обнаруживаться в самых разных хранилищах, документах и источниках, включая специализированные перечни, такие как журналы регистрации событий, списки источ ников или интерфейсов, наборы кодов, всевозможные словари, пространственные и временные схемы, картографические привязки, наборы цифровых данных, распределенных по географиче скому признаку, архивы репозиториев, бизнес-правила и т. д.

1.3.6 ТИПЫ АРХИТЕКТУРЫ МЕТАДАННЫХ

Как и любые другие данные, метаданные имеют жизненный цикл. Поэтому все решения по управ лению метаданными включают следующие архитектурные уровни, соответствующие различным фазам жизненного цикла метаданных:

создание или получение метаданных;

хранение метаданных в одном или нескольких репозиториях;

интеграция метаданных;

доставка метаданных потребителям;

использование метаданных;

контроль и управление метаданными.

Для подключения к источникам, а также для сбора, хранения, интеграции и сопровождения мета данных и управления доступом к ним могут использоваться различные архитектурные подходы.

1.3.6.1 ЦЕНТРАЛИЗОВАННАЯ АРХИТЕКТУРА МЕТАДАННЫХ

Централизованная архитектура предусматривает единое хранилище метаданных, копируе мых туда из различных источников. Организациям с ограниченными ИТ-ресурсами, как

Управление метаданными

537

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

и стремящимся к максимально возможной автоматизации управления метаданными, такой вариант архитектуры, как правило, противопоказан. А вот организации, стремящиеся к согла сованности метаданных, извлекают максимальную пользу от хранения их в централизованном хранилище.

Преимущества централизованного репозитория метаданных:

Высокая доступность вследствие автономности от систем-источников.

Высокая скорость обработки запросов на извлечение метаданных, поскольку все запросы об рабатываются без обращений за пределы центрального репозитория.

Структуры баз данных представлены в хорошем разрешении и не зависят от сторонних или коммерческих систем.

Извлеченные из хранилища метаданные допускают преобразование, настройку или дополне ние метаданными из других источников с целью повышения их качества.

Недостатки централизованного подхода:

Сложность процессов оперативного воспроизведения изменений в метаданных систем-источ ников в хранилище метаданных.

Дороговизна оборудования и эксплуатационного сопровождения централизованного хра нилища.

Возможная потребность в разрабатываемых под заказ модулях сопряжения или межплатфор менном ПО для обмена метаданными между хранилищем и системами.

Проверка корректности работы и техническое сопровождение компонентов ПО, разрабаты ваемого под заказ, повышает потребность в высококвалифицированных ИТ-специалистах — как в штате организации, так и на стороне поставщика ПО.

Рисунок 85 иллюстрирует реализацию сбора метаданных в отдельном централизованном храни лище, заполняемом посредством импорта метаданных из различных источников (стрелки). Ко нечным же пользователям предлагается адресовать запросы к центральному репозиторию через портал доступа к метаданным. При такой конфигурации пользователь лишен возможности за прашивать метаданные напрямую у программных средств, которые их генерируют. Зато поддер живается глобальный поиск по всем метаданным, собранным в хранилище.

1.3.6.2 РАСПРЕДЕЛЕННАЯ АРХИТЕКТУРА МЕТАДАННЫХ

Полностью распределенная архитектура предусматривает единую точку доступа к метаданным через портал, обеспечивающий извлечение запрашиваемых данных систем-источников в режиме, близком к реальному времени. Центральное хранилище при такой архитектуре отсутствует; вме сто него в среде портала управления метаданными ведутся каталоги данных, содержащихся в си стемах-источниках, и действуют общие правила оптимизации обработки запросов, а обращение

538

Г Л А В А 12

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

Портал метаданных

КОРПОРАТИВНЫЙ РЕПОЗИТОРИЙ МЕТАДАННЫХ

Инструменты

Средства

Средства

Реестры

Средства

Справочные

Средства

Средства

Управление

BI

создания

ETL

сервисов

СУБД

данные

контроля

обмена

конфигура-

моделей

качества

сообщениями

циями

 

 

 

 

 

Рисунок 85. Централизованная архитектура метаданных

непосредственно к системам-источникам осуществляется посредством протоколов, используе мых промежуточным ПО, — например, с помощью брокера объектных запросов (ORB1).

Преимущества распределенной архитектуры метаданных:

Метаданные не требуют обновления и проверки актуальности, поскольку всякий раз запра шиваются из первоисточника.

Запросы, обращенные к распределенным источникам, сразу же распределяются по множе ственным каналам обмена данными и, как следствие, могут обрабатываться оперативнее.

Метаданные из проприетарных систем так или иначе ничего, кроме отправки запроса и полу чения ответа, не предусматривают, поскольку структура данных в таких системах защищена патентами; следовательно, ничего свыше этого минимума реализовывать и не требуется.

Обработка запросов к метаданным упрощается еще и за счет автоматизации.

Минимизируются потребности в пакетной обработке, поскольку метаданные при такой архи тектуре не требуют ни тиражирования, ни синхронизации.

Минусы распределенных архитектур:

Отсутствие всякой возможности реализовать поддержку пользовательских определений или добавлений записей метаданных за отсутствием какого бы то ни было буферного хранилища между порталом доступа и системами-источниками.

Стандартизированное представление метаданных из различных систем без учета их специфики.

Недоступность метаданных, описывающих данные из систем-источников, в случае отсут ствия связи с последними.

Качество метаданных всецело зависит от контроля качества на стороне систем-источников.

1 сокр. от англ. Object Request Broker. — Примеч. пер.

Управление метаданными

539

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

Рисунок 86 иллюстрирует распределенную архитектуру метаданных. Централизованный репо зиторий метаданных в данном случае отсутствует, а портал переадресует пользовательские за просы напрямую программным средствам управления источниками, которые их и исполняют. За неимением централизованного хранилища для сбора метаданных из различных источников каждый запрос приходится переадресовывать соответствующей системе-источнику; как след ствие, отсутствует возможность реализации функций глобального поиска метаданных по всем доступным источникам.

Портал метаданных

Инструменты

Средства

Средства

Реестры

Средства

Справочные

Средства

Средства

Управление

создания

контроля

обмена

конфигура-

BI

ETL

сервисов

СУБД

данные

моделей

качества

сообщениями

циями

 

 

 

 

 

Рисунок 86. Распределенная архитектура метаданных

1.3.6.3 ГИБРИДНАЯ АРХИТЕКТУРА МЕТАДАННЫХ

Из самого ее названия явствует, что гибридная архитектура метаданных сочетает в себе элементы, свойства и характеристики как централизованной, так и распределенной архитектур. Метадан ные всё так же поступают в центральный репозиторий непосредственно из систем-источников, вот только сохраняются они там выборочно. Обычно система управления таким хранилищем предусматривает сохранение критически важных стандартизованных элементов метаданных из систем-источников и последующее добавление дополнительных элементов по запросу пользова телей, в том числе в ручном режиме из сторонних источников.

Преимущества подобной архитектуры включают получение запрашиваемых метаданных из систем-источников в режиме, близком к реальному времени, и возможность эффективной про работки расширенных метаданных, когда это нужно пользователю. Гибридный подход способ ствует снижению потребности во вмешательстве ИТ-специалистов с целью ручной настройки и программирования межплатформенных интерфейсов доступа к проприетарным системам, когда такой доступ требуется. Актуальность метаданных гарантируется регулярными обновле ниями базового набора и запросом пользователями остальных элементов по мере надобности из первоисточников.

А вот в плане доступности метаданных из систем-источников гибридная архитектура насле дует все минусы распределенной: поскольку запросы обрабатываются удаленными системами, повлиять на их доступность и производительность со стороны портала метаданных нереально. Кроме того, минусом гибридной архитектуры является и дополнительный расход вычислитель ных ресурсов на привязку слоя текущих метаданных, полученных по оперативному запросу из

540

Г Л А В А 12

 

 

 

 

hang

e

 

 

 

 

 

 

 

C

 

E

 

 

 

 

X

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

F

 

 

 

 

 

 

t

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

r

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

to

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

.

 

 

 

 

 

.c

 

 

 

p

 

 

 

 

g

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

-xcha

 

 

 

 

 

 

 

 

 

hang

e

 

 

 

 

 

 

 

 

C

 

E

 

 

 

 

 

X

 

 

 

 

 

 

 

-

 

 

 

 

 

d

 

 

 

F

 

 

 

 

 

 

t

 

 

 

D

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

r

 

P

 

 

 

 

 

NOW!

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BUY

 

 

 

 

 

 

 

to

 

 

 

 

 

 

w Click

 

 

 

 

 

m

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

.c

 

 

 

 

p

 

 

 

 

g

 

 

 

 

 

 

df

 

 

n

e

 

 

 

 

 

 

-x cha

 

 

 

 

системы-источника, к стационарному слою метаданных централизованного хранения перед вы дачей сводного набора запрошенных метаданных конечному пользователю портала.

Для многих организаций, однако, преимущества гибридной архитектуры перевешивают не достатки. В целом, показаниями к использованию гибридной архитектуры служат: частое вне сение изменений в операционные метаданные; необходимость полагаться исключительно на актуальные, но при этом согласованные, консолидированные и унифицированные метаданные; ситуации быстрого роста объемов и числа источников метаданных.

Организациям с относительно статичными метаданными, не планирующим в обозримом бу дущем резкого расширения профилей метаданных, подобный вариант архитектуры не то чтобы не подходит, а может не оправдать ожиданий, ничего не добавив по сравнению со стандартной централизованной архитектурой и практически не раскрыв своего потенциала.

1.3.6.4 ДВУНАПРАВЛЕННАЯ АРХИТЕКТУРА МЕТАДАННЫХ

Другим усовершенствованным вариантом архитектуры метаданных является двунаправленная (bi-directional) архитектурная модель, допускающая изменение метаданных на любом участ ке (источник, среда интеграции, пользовательский интерфейс) с последующим согласованием изменений системой управления хранилищем (брокером) и передачей результата в системуисточник.

Такой подход сопряжен со множеством всевозможных трудностей. Само проектное решение требует, чтобы в главном хранилище содержались исключительно новейшие версии метаданных из систем-источников, а в случае рассогласованности вынуждает вносить изменения еще и в ис ходные метаданные на уровне источников. Все изменения подлежат систематической регистра ции и последующему согласованию. Как следствие, приходится выстраивать целый промежуточ ный слой с наборами интерфейсов сопряжения репозитория с источниками с прямой и обратной связью, обеспечивающих двунаправленное согласование данных между ними, которые также требуют настройки и управления.

Рисунок 87 иллюстрирует порядок сбора общих метаданных, предназначенных для обеспе чения совместного доступа к данным. Из различных систем-источников они поступают в про фильные разделы централизованного хранилища метаданных. Пользователи адресуют запросы к порталу метаданных; портал передает пользовательский запрос в центральный репозиторий; система управления центрального репозитория пытается выполнить запрос, используя мета данные в совместном доступе, ранее собранные в тематические разделы хранилища из различ ных систем-источников. Если же запрос оказывается слишком специфическим или требующим более детализированных метаданных, нежели те, что имеются на уровне централизованного репозитория, он перенаправляется на самый нижний уровень и адресуется системе-перво источнику, которая и пытается разыскать в своих недрах запрашиваемые специфические де тали. Благодаря наличию набора общих метаданных в централизованном репозитории такая архитектура обеспечивает возможность глобального поиска с использованием всего спектра доступных средств.

Управление метаданными

541