|
|
|
Решения по управлению жизненным циклом информации
Управление Жизненным циклом Информации (Information Lifecycle Management – ILM) – Процесс управления информацией на протяжении всего жизненного цикла: от создания до уничтожения, причем таким образом, чтобы хранение и доступ были оптимизированы по цене при соблюдения согласованного уровня обслуживания.
Классификация информации
Основная идея лежащая в основе ILM заключается в том, что не вся информация одинаково полезна. Например, устаревшая информация не полезна, MP3 файлы не полезны, временные файлы не полезны, дублированные файлы не всегда полезны.
Для определения полезности информации, следует ее классифицировать с точки зрения бизнес-ценности.
Легче всего классифицировать информацию на уровне приложений. Так, например, если предприятие ведет финансовый учет в системе SAP, то очевидным представляется целесообразность отнесения информации SAP-системы к важной или даже критической для бизнеса. Чтобы легче было перенести подобную классификацию на язык IT, можно оперировать прикладным окружением SAP-системы, например, каталогом данных (/sap), расширением файлов, системным пользователем, от имени которого создаются файлы, и прочими атрибутами файловой системы, записями систем Records Management или систем управления контентом (ECM).
Также можно классифицировать информацию на уровне файлов. Примером такой классификации может быть разделяемый ресурс «Проекты» на файловом сервере. Для такой классификации тоже следует воспользоваться атрибутами файловой системы, такими как путь, расширение файла, создатель, дата создания, дата последнего доступа или такими специальными, как «сирота» (файл созданный пользователем, чья учетная запись удалена) или дублированный в других местах.
Для классов информации следует задать уровень обслуживания с точки зрения производительности (количество операций ввода/вывода в секунду IOPS), доступности (например, 99.999%, ежедневный backup, ежечасное создание «снимков» — snapshot), катастрофоустойчивости или специальных требований как WORM (WriteOnce Read Many – не стираемый архив).
Помимо уровня обслуживания указывается политика жизненного цикла информации. Важно отметить, что подобную классификацию следует производить с участием заинтересованных пользователей-специалистов в предметной сфере, так как только они могут определить ценность информации для компании и требуемые уровни ее обслуживания.
С другой стороны, пользователи могут переоценить предъявляемые требования. В этом случае лучше провести статистический анализ с помощью инструментов класса Storage Resource Management (Управление ресурсами хранения). Например, сотрудники финансового департамента просят предоставить скорость доступа к финансовым отчетам за последний год не ниже 1 сек реакции приложения, мотивируя необходимостью в частом использовании данных за текущий финансовый год, в то время как статистика их доступа показывает, что около 70% их доступа приходится на данные текущего квартала и лишь 20% доступа – на другие кварталы финансового года. В описанной ситуации лучше разделить данное требование на два класса информации в зависимости от даты последнего доступа. Пример классификации информации приведен в таблице 1.
В этой таблице учтена классификация по приложениям (SAP, DB2, Lotus Domino), файлам, а также определена ненужная информация (временные файлы, дублированные). Также указана политика по отношению к классам информации с точки зрения жизненного цикла: так, например, одни и те же файлы Microsoft Excel созданные бухгалтерами могут относится к классу «критичных данных» или к классу «важных» в зависимости, был ли к ним доступ за последние 6 месяцев, или нет.
Таблица 1. Пример классификации информации, уровня обслуживания и политики жизненного цикла.
Классификация инфраструктуры
Следующим этапом внедрения практик ILM является инвентаризация имеющейся инфраструктуры, на основе которой будет построено решение, удовлетворяющее введенным классам информации. Инвентаризовать следует серверы, сеть хранения данных, системы хранения данных, ленточные библиотеки, а также наличие необходимых функций и решений, например, функции создание мгновенных «снимков» (snapshot) или синхронной репликации систем хранения данных.
На основе полученных данных инвентаризации IT-специалисты формируют классы инфраструктуры для удовлетворения классам обслуживания. Необходимость в такой классификации есть не только у заказчиков, эксплуатирующих несколько систем хранения, но и у тех у кого единственная система хранения, но в которой можно создавать RAID-группы с разными характеристиками производительности и надежности. Примером такой классификации может служить таблица 2.
| Класс инфраструктуры |
Производительность |
Доступность (Operational Recovery) |
(Disaster Recovery) |
|
| Платиновый |
очень высокая (DS8300 или RAID-10) |
очень высокая (noSPoF, FlashCopy) |
высокая (PPRC) |
TSM Continuous Data Protection на диски |
| Золотой |
очень высокая (DS8300 или RAID-10) |
очень высокая (noSPoF, FlashCopy) |
высокая (PPRC) |
TSM tape pools, TSM HSM |
| Серебрянный |
высокая (ESS Shark или RAID-5) |
высокая (noSPoF) |
средняя (tape shipping) |
TSM tape pools, TSM HSM |
| Бронзовый |
низкая (FAStT200 или RAID-5) |
средняя (noSPoF) |
- |
TSM tape pools |
| Архив |
низкая (FAStT200 или RAID-5) |
средняя (noSPoF) |
- |
WORM | Таблица 2. Пример классификации инфраструктуры.
В этой таблице перечислены классы инфраструктуры, например, для уровня «платиновый» выделена высокопроизводительная система хранения без единой точки отказа (No Single Point of Failure – NoSPoF), с регламентом ежечасного создания мгновенных «снимков» (snapshot), синхронной репликацией на другой массив (PPRC) и непрерывным резервным копированием данных (TSM Continuous Data Protection) на дисковый массив нижнего уровня.
Выстраивание классов информации к классам инфраструктуры.
Последним этапом создания модели ILM является привязка классов информации к классам инфраструктуры. В качестве примера подобной связки можно привести Рисунок 1. На этом примере критическая информация привязывается к платиновому уровню инфраструктуры, временная и дублированная к бронзовому, а ненужная информация не имеет привязки, поскольку в соответствии с разработанным регламентом удаляется. Важно отметить, что привязка является «живым» организмом в том смысле, что с течением времени информация меняет свою актуальность и в этой связи перемещается по классам инфраструктуры.
Процессы и программное обеспечение, которое будет ответственно за эти перемещения, может функционировать на разных уровнях: аппаратном (виртуализация систем хранения), уровне файловой системы (HSM — иерархическое хранение или виртуализация на уровне файловой системы), уровне прикладных систем (в данном случае за перемещение отвечают системы ECM или Records Management).
Рисунок 1. Выравнивание ценности информации и наиболее подходящей инфраструктуры.
Задачи, стоящие перед ILM-подходом, не новы, более того, они успешно решались и ранее с помощью следующих технологий:
- Управление архивными данными на основе регламента
- Сохранение и дислокация записей
- Автоматизированное управление подсистемой хранения
- Нестираемый архив
- Иерархическое хранение
- Поиск и классификация неструктурированной информации
Однако решались они порознь, для ограниченного набора данных, определенных в конкретной системе. Задача, решаемая перед ILM – поиск общих подходов, прозрачных для действующих систем и ранее написанных приложений.
|