Структура файлов NTFS


Каждый файл и каталог па томе NTFS состоит из набора атрибутов. Важно отметить, что имя файла и его данные также рассматриваются как атрибуты файла, то есть, в трактовке NTFS кроме атрибутов у файла нет никаких других компо­нентов.

Каждый атрибут файла NTFS состоит из полей:

  • тип атрибута,
  • длина атрибута,
  • имя атрибута.
  • значение атрибута

Тип атрибута, длина и имя обра­зуют заголовок атрибута.

Имеется системный набор атрибутов, определяемых структурой тома NTFS. Сис­темные атрибуты имеют фиксированные имена и коды их типа, а также опреде­ленный формат. Могут применяться также атрибуты, определяемые пользова­телями. Их имена, типы и форматы задаются исключительно пользователем. Атрибуты файлов упорядочены по убыванию кода атрибута, причем атрибут од­ного и того же типа может повторяться несколько раз. Существуют два способа хранения атрибутов файла — резидентное хранение в записях таблицы MFT и нерезидентное хранение вне ее, во внешних отрезках. Таким образом, резидент­ная часть файла состоит из резидентных атрибутов, а нерезидентная — из нере­зидентных атрибутов. Сортировка может осуществляться только по резидентным атрибутам.

Системный набор включает следующие атрибуты:

  • Attribute List (список атрибутов) — список атрибутов, из которых состоит файл; содержит ссылки на номер записи MFT, где расположен каждый атри­бут; этот редко используемый атрибут нужен только в том случае, если атри­буты файла не умещаются в основной записи и занимают дополнительные за­писи MFT;
  • File Name (имя файла) — этот атрибут содержит длинное имя файла в форма­
    те Unicode, а также номер входа в таблице MFT для родительского каталога;
    если этот файл содержится в нескольких каталогах, то у него будет несколько
    атрибутов типа File Name; этот атрибут всегда должен быть резидентным;
  • MS-DOS Name (имя MS-DOS) — этот атрибут содержит имя файла в форма­те 8.3;
  • Version (версия) - атрибут содержит номер последней версии файла;
  • Security Descriptor (дескриптор безопасности) — этот атрибут содержит ин­формацию о защите файла: список прав доступа ACL (права доступа к файлу рассматриваются ниже в разделе «Контроль доступа к файлам») и поле ауди­та, которое определяет, какого рода операции над этим файлом нужно регист­рировать:
  • Volume Version (версия тома) — версия тома, используется только в систем­ных файлах тома;
  • Volume Name (имя тома) — имя тома;
  • Data (дачные) — содержит обычные данные файла;
  • MFT bitmap (битовая карта MFT) — этот атрибут содержит карту использо­-
    вания блоков на томе;
  • Index Root (корень индекса) — корень В-дерева, используемого для поиска фай­лов в каталоге;
  • Index Allocation (размещение индекса) — нерезидентные части индексного списка В-дерева;
  • Standard Information (стандартная информация) — этот атрибут хранит всю остальную стандартную информацию о файле, которую трудно связать с ка­ким-либо из других атрибутов файла, например, время создания файла, вре­мя обновления и другие.

Файлы NTFS в зависимости от способа размещения делятся на небольшие, боль­шие, очень большие и сверхбольшие.

Небольшие файлы (small). Если файл имеет небольшой размер, то он может цели­ком располагаться внутри одной записи MFT, имеющей, например, размер 2 Кбайт. Небольшие файлы NTFS состоят по крайней мере из следующих атри­бутов (рис. 7.20):

  • стандартная информация (SI — standard information);
  • имя файла (FN — file name);
    данные (Data);
  • дескриптор безопасности (SD — security descriptor).

Из-за того что файл может иметь переменное количество атрибутов, а также из-за переменного размера атрибутом нельзя наверняка утверждать, что файл уме­стится внутри записи. Однако обычно файлы размером менее 1500 байт помеща­ются внутри записи MFT (размером 2 Кбайт).

Большие файлы (large). Если данные файла не помещаются в одну запись MFT, то этот факт отражается в заголовке атрибута Data, который содержит признак того, что этот атрибут является нерезидентным, то есть находится в отрезках вне таблицы MFT. В этом случае атрибут Data содержит адресную информацию (LCN, VCX, к) каждого отрезка данных

Сверхбольшиефайлы (extremely huge). Для сверхбольших файлов в атрибуте Attribute List можно указать несколько атрибутов, расположенных в дополни­тельных записях MFT . Кроме того, можно использовать двойную косвенную адресацию, когда нерезидентный атрибут будет ссылаться на другие

нерезидентные атрибуты, поэтому в NTFS не может быть атрибутов слишком большой для системы длины.

 

Очень большие файлы (huge). Если файл настолько велик, что его атрибут дан­ных, хранящий адреса нерезидентных отрезков данных, не помещается в одной записи, то этот атрибут помещается в другую запись MFT, а ссылка на такой ат­рибут помещается в основную запись файла. Эта ссылка содержится в атрибуте Attribute List. Сам атрибут данных по-прежнему содержит адреса не­резидентных отрезков данных.

 


Каталоги NTFS

Каждый каталог NTFS представляет собой один вход в таблицу MFT, который содержит атрибут Index Root. Индекс содержит список файлов, входящих в ката­лог. Индексы позволяют сортировать файлы для ускорения поиска, основанного на значении определенного атрибута. Обычно в файловых системах файлы сор­тируются по имени. NTFS позволяет использовать для сортировки любой атри­бут, если он хранится в резидентной форме.

Имеются две формы хранения списка файлов.

Небольшие каталоги (small indexes). Если количество фаллов в каталоге невели­ко, то список фаллов может быть резидентным в записи в MFT, являющейся ка­талогом . Для резидентного хранения списка используется единствен­ный атрибут — Index Root. Список файлов содержит значения атрибутов файла. По умолчанию —
 
 

это имя файла, а также номер заилен MTF, содержащей на­чальную запись файла.

Большие каталоги (large indexes). По мере того как каталог растет, список фай­лов может потребовать нерезидентной формы хранения. Однако начальная часть списка всегда остается резидентной в корневой записи каталога в таблице MFT . Имена файлов резидентной части списка файлов являются узлами так называемого В-дерева (двоичного дерева). Остальные части списка файлов размещаются вне MFT. Для их поиска используется специальный атрибут Index Allocation, представляющий собой адреса отрезков, хранящих остальные части спи­ска файлов каталога. Одни части списков являются листьями дерева, а другие являются промежуточными узлами, то есть содержат наряду с именами файлов атрибут Index Allocation, указывающий на списки файлов более низких уровней. Узлы двоичного дерена делят весь список файлов на несколько групп. Имя каж­дого файла-узла является именем последнего файла в соответствующей группе. Считается, что имена файлов сравниваются лексикографически, то есть сначала принимаются во внимание коды первых символов двух сравниваемых имен, при этом имя считается меньшим, если код его первого символа имеет меньшее арифметическое значение, при равенстве кодов первых символов сравниваются коды вторых символов имен и т. д. Например, файл f1.exe, являющийся первым узлом двоичного дерева, показанного на рис., имеет имя, лексикографиче­ски большее имен avia.exe, az.exe, ... , emax.exe, образующих первую группу спис­ка имен каталога. Соответственно файл ltr.exe имеет наибольшее имя среди всех имен второй группы, а все файлы с именами, большими ltr.exe, образуют третью и последнюю группу.

Поиск в каталоге уникального имени файла, которым в NTFS является номер основной записи о файле в MFT, по его символьному имени происходит следую­щим образом. Сначала искомое символьное имя сравнивается с именем первого узла в резидентной части индекса. Если искомое имя меньше, то это означает, что его нужно искать в первой нерезидентной группе, для чего из атрибута Index Allocation извлекается адрес отрезка (VCN,, LCN,, К,), хранящего имена файлов первой группы. Среди имен этой группы поиск осуществляется прямым перебором имен и сравнением до полного совпадения всех символов искомого имени с хранящимся в каталоге именем. При совпадении из каталога извлекается помер основной записи о файле в MFT и остальные характеристики файла берутся уже оттуда.


Если же искомое имя больше имени первого узла резидентной части индекса, то его сравнивают с именем второго узла, и если искомое имя меньше, то описанная процедура применяется ко второй нерезидентной группе имен, и т. д. В результате вместо перебора большого количества имен (в худшем случае — всех имен каталога) выполняется сравнение с гораздо меньшим количеством имен узлов и имен в одной из групп каталога.

Если одна из групп каталога становится слишком большой, то ее также делят на группы, последние имена каждой новой группы оставляют в исходном нерези­дентном атрибуте Index Root, а все остальные имена новых групп переносят в но­вые нерезидентные атрибуты типа Index Root (на рисунке этот случай не показан). К исходному нерезидентному атрибуту Index Root добавляется атрибут размеще­ния индекса, указывающий на отрезки индекса новых групп. Если теперь при поиске искомого имени в нерезидентной части индекса первого уровня какое-либо сравнение показывает, что искомое имя оказывается меньше, чем одно из хранящихся там имен, то это говорит о том, что в данном атрибуте точного срав­нения имени уже быть не может и нужно перейти к подгруппе имен следующего уровня дерева.



Дата добавления: 2016-06-05; просмотров: 4262;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.01 сек.