Информация, информатика, информационное общество 6 глава
Главным отличием многопользовательских систем от однопользовательских является наличие средств защиты информации каждого пользователя от несанкционированного доступа других пользователей. Следует заметить, что не всякая многозадачная система является многопользовательской, и не всякая однопользовательская ОС является однозадачной.
Разрядность ОС определяется разрядностью процессора (CPU), с которым может работать эта операционная система. Процессор большей разрядности всегда может работать в режиме меньшей разрядности или эмулировать такую работу. Поэтому, например, 16-разрядная ОС может быть установлена на компьютере с 32-разрядным процессором, но эффективность работы будет при этом весьма низкой – все преимущества процессора окажутся незадействованными. Верно и обратное – ОС большей разрядности, как правило, может работать с процессором меньшей разрядности, но при этом окажутся неиспользуемыми возможности операционной системы, хотя под эти возможности будут задействованы компьютерные ресурсы (RAM, дисковое пространство). Из сказанного следует, что для эффективной работы компьютера разрядность операционной системы должна соответствовать разрядности процессора.
В последние годы фактическим стандартом стал графический многооконный интерфейс (GUI), где любые объекты представляются в виде графических образов, а требуемые действия выбираются из оконных и контекстных меню или нажатием экранных кнопок. Однако иногда возникает необходимость пользоваться и командным интерфейсом , при котором управление компьютером осуществляется набором соответствующих команд на клавиатуре. Как правило, современные ОС обеспечивают обе эти возможности.
В настоящее время широкое распространение получили два типа ОС для ПК.
К первому типу относятся достаточно похожие ОС семейства Windows компании Microsoft. Они многозадачные и имеют многооконный графический интерфейс. Операционная система Windows выросла из системы MS DOS и долгое время использовала MS DOS в качестве своей основы. До 1995 года Windows собственно и не была операционной системой, т.к. она не загружалась, а запускалась из-под MS DOS в качестве задачи. Эра ОС Windows началась с появления Windows-95 в 1995 г. – это уже была полноценная многозадачная операционная система. На смену Windows-95 в 1998 г. пришла Windows-98, а затем - не получившая распространения Windows Millennium. Одновременно с Windows-95 для ПК компания Microsoft разработала ОС Windows NT для серверов. Windows NT не использовала MS DOS в качестве основы, поэтому была достаточно надежной и производительной системой. В ней впервые была реализована высокопроизводительная файловая система NTFS. Однако Windows NT была слишком ресурсоемкой для ПК того времени и плохо поддерживала многие важные для пользователя интерфейсные функции (преобразование шрифтов, работа с периферийным оборудованием и т.д.). Важным этапом в развитии ОС семейства Windows стало появление Windows-2000 в 2000г., совместившей преимущества Windows-98 и Windows NT. Хотя ресурсоемкость Windows-2000 возросла по сравнению с Windows NT, эта система начала активно устанавливаться на ПК – производительность ПК росла гораздо быстрее. На смену Windows-2000 пришли Windows XP (наиболее распространенная в настоящее время ОС для ПК) и серверная ОС Windows 2003 Server.
Операционные системы семействаWindows представляет собой 32-разрядные операционные системы, обеспечивающую многозадачную и многопоточную обработку приложений. Они поддерживает удобный графический пользовательский интерфейс, возможность работы в защищенном режиме, совместимость с программами реального режима и сетевые возможности. В Windows реализована технология поддержки самонастраивающейся аппаратуры Plug and Play, допускаются длинные имена файлов и обеспечиваются повышенные характеристики устойчивости.
На рынке персональных компьютеров с Windows конкурируют ОС типа UNIX. Это также многозадачная многопользовательская ОС. В настоящее время разработаны расширения UNIX, обеспечивающие многооконный графический интерфейс. UNIX развивалась в течение многих лет разными компаниями, но до недавнего времени она не использовалась на персональных компьютерах, т.к. требует очень мощного процессора, весьма дорога и сложна, её установка и эксплуатация требуют высокой квалификации. В последние годы ситуация изменилась. Компьютеры стали достаточно мощными, появилась некоммерческая, бесплатная версия системы UNIX для персональных компьютеров - система Linux. По мере роста популярности этой системы в ней появились дополнительные компоненты, облегчающие установку и эксплуатацию. Немалую роль в росте популярности Linux сыграла мировая компьютерная сеть Internet. Хотя освоение Linux гораздо сложнее освоения систем типа Windows, Linux - более гибкая и в то же время бесплатная система, что и привлекает к ней многих пользователей.
Существуют и другие ОС. Известная компания Apple производит компьютеры Macintosh с современной ОС MacOS X. Эти компьютеры используются преимущественно издателями и художниками. Фирма IBM производила ОС OS/2, во многом похожую на Windows NT.
Глава 3.3. Хранение данных. Файлы.
Физическая и логическая структура файловой системы.
3.3.1. Файлы. Физическая файловая система.
Любые данные хранятся на любом носителе в виде файлов.
Файл – это именованная (имеющая имя) область памяти носителя, в которую записана определенная совокупность данных, так что для переноса этих данных в оперативную память или на другой носитель достаточно знать только имя файла. Область памяти, в которой расположен файл не обязательно непрерывная – она может состоять из многих частей, находящихся в разных частях носителя. В этом случае говорят, что файл фрагментирован. Однако независимо от того, фрагментирован файл или нет, обращение к файлу по имени дает доступ ко всем его данным.
Возможность работать с файлами – записывать, хранить, копировать в память или на другой носитель, удалять – обеспечивает файловая система.
Файловая система – это часть операционной системы, назначение которой состоит в том, чтобы поддерживать определенный порядок создания, хранения, копирования, изменения и удаления файлов. Файловая система призвана обеспечить пользователю удобный интерфейс при работе с данными, хранящимися на диске, обеспечить совместное использование файлов несколькими пользователями и процессами.
В широком смысле понятие "файловая система" включает следующие компоненты.
· Совокупность всех файлов на диске.
· Специальные структуры данных, обеспечивающие определенный порядок размещения файлов на диске и возможности доступа к файлам.
· Комплекс системных программ, обеспечивающих создание, уничтожение, чтение, запись, именование, поиск и другие операции над файлами.
· Способы доступа к файлам в рамках межпрограммных и пользовательских интерфейсов.
Первые 2 компонента являются базовыми, они составляют так называемую физическую основу файловой системы. Последний компонент наиболее важен для пользователя, он составляет логическую организацию файловой системы.
Та или иная физическая организация файловой системы устанавливается процедурой форматирования носителя данных. Процедура форматирования уничтожает все данные на носителе (если они там были) и превращает носитель в «чистый лист», на который можно записывать файлы.
По способу физической организации существует несколько различных файловых систем. Рассмотрим наиболее распространенные из них.
Файловая система FAT (File Allocations Table) – это одна из наиболее старых файловых систем для ПК, разработанная Биллом Гейтсом и Марком МакДональдом в 1977г. Система FAT может реализовываться на логических дисках HDD, на FDD и на других аналогичных носителях. При использовании системы FAT все пространство данного диска делится на равные последовательно расположенные области – кластеры. Как было указано ранее, существует минимальный объем данных, называемый сектором (блоком), который может быть записан на жесткий диск или прочитан с жесткого диска. Объем кластера должен составлять целое число секторов. Каждый файл может состоять из одного или из нескольких кластеров в зависимости от своего размера. Минимальный размер файла на диске – один кластер. Весь диск делится на 5 разделов - загрузочный сектор (1-й сектор 1-й дорожки), область FAT-таблицы, область копии FAT-таблицы, область каталога, область файлов. Первые 4 раздела занимают небольшой объем и содержат системную информацию.
В загрузочном секторе находится загрузочная запись, указывающая системе BIOS местонахождение на данном носителе загружаемой операционной системы. Если загрузочная запись отсутствует или в ней есть ошибка, BIOS считает, что на данном носителе загружаемая операционная система отсутствует.
В FAT-таблице хранится информация обо всех кластерах логического диска. Каждому кластеру в FAT соответствует отдельная запись, которая показывает, свободен ли он, занят ли данными файла, или помечен как сбойный (испорченный). Если кластер занят под файл, то в соответствующей записи в таблице размещения файлов указывается адрес следующего кластера этого файла. В записи, соответствующей последнему кластеру данного файла, вместо адреса следующего кластера ставится специальная метка. Отметим, что в FAT-таблице не содержатся имена файлов. Копия FAT-таблицы идентична самой FAT-таблице. Она используется для восстановления файлов в случае сбоев.
Каталог (корневая папка) содержит все имена файлов и подкаталогов (вложенных папок) со ссылкой на запись в FAT-таблице, указывающей на первый кластер данного файла. Кроме того, в каталоге указываются дополнительные характеристики (атрибуты) файла: дата и время создания, размер, дополнительные атрибуты (архивный, скрытый, системный, “только для чтения”).
Поскольку FAT изначально проектировалась для однопользовательской операционной системы DOS, то она не предусматривает хранения такой информации, как сведения о владельце или полномочия доступа к файлу/каталогу. Кроме того, т. к. DOS – 16-разрядная операционная система, то, соответственно, FAT – также 16-разрядная файловая система. Это означает, что максимальное количество кластеров на диске составляет 216 (примерно 64000 тыс.). Это совсем немного. Еще один недостаток FAT-системы – сильное уменьшение скорости поиска файлов, при увеличении объема носителей. Наконец, FAT не может поддерживать диски объемом более 2 ГБ.
В настоящее время FAT используется в основном для магнитных дискет (FDD).
Файловая система VFAT (Virtual FAT), реализованная в Windows 95/98 - это система FAT, дополненная поддержкой длинных имен файлов в кодировке UNICODE (каждый символ имени кодируется 2 байтами). VFAT использует ту же самую схему распределения дискового пространства, что и файловая система FAT. В VFAT имя может быть длиной до 255 символов, в имя можно включать несколько пробелов и точек, текст после последней точки рассматривается как расширение, регистр символов в именах не различается, но сохраняется. Длинные имена по частям хранятся в специальных записях каталога. Для каждого файла и подкаталога в VFAT хранится два имени: длинное и короткое. Короткое имя генерируется файловой системой автоматически в формате 8.3 (имя из 8 символов, точка, расширение из 3-х символов).
Файловая система FAT32 - это 32-разрядная файловая система, которая пришла на смену VFAT, сохранив основные черты и принципы организации последней. FAT32 поддерживает жесткие диски объемом до 2 терабайт. Впервые файловая система FAT32 была включена в состав ОС Windows 95 OSR 2. В FAT32 были расширены атрибуты файлов, позволяющие теперь хранить время и дату создания, модификации и последнего доступа к файлу или каталогу. В FAT32 адрес каждого кластера стал 32 разрядным, что позволило иметь на диске до 232 = 4 млрд. кластеров. В FAT32 объем кластера должен быть не менее 4 кБ, а объем диска – не менее 512 МБ. Корневой каталог в FAT32 больше не располагается в определенном месте, вместо этого хранится указатель на начальный кластер корневого каталога. В результате снимается ранее существовавшее ограничение на число записей в корневом каталоге. Кроме того, для учета свободных кластеров, в зарезервированной области на разделе FAT32 имеется сектор, содержащий число свободных кластеров и номер самого последнего использованного кластера. Это позволяет системе при выделении следующего кластера не перечитывать заново всю таблицу размещения файла. FAT32 поддерживается в Windows 98, Windows ME, Windows 2000 и Windows XP.
Файловая система NTFS (New Technology File System) - наиболее предпочтительная файловая система при работе с ОС Windows 2000 и Windows XP.
Каждый файл на томе NTFS представлен записью в специальном файле – главной файловой таблице - метафайле MFT (Master File Table). В отличие от файловой таблицы и каталога FAT метафайл является иерархической базой данных, позволяющей очень быстро осуществлять поиск нужного файла
NTFS является 64-разрядной файловой системой, что дает возможность иметь 264 кластеров, каждый размером до 64 Кбайт. Как и в FAT размер кластера может меняться, но необязательно возрастает пропорционально размеру диска. NTFS позволяет хранить файлы размером до 16 эксабайт (264 байт).
Файловая система NTFS является журналируемой – все изменения в файловой системе записываются в специальный журнал транзакций (log file), что позволяет восстанавливать файловую систему после сбоев системы.
В NTFS значительно расширены возможности по управлению доступом к отдельным файлам и каталогам, введено большое число атрибутов, реализована отказоустойчивость, средства динамического сжатия файлов. NTFS позволяет использовать имена файлов длиной до 255 символов, при этом она использует тот же алгоритм для генерации короткого имени, что и VFAT. .Начиная с NTFS 5.0 введена возможность динамического шифрования файлов и каталогов, повышающая надежность хранения информации.
Файловые системы UFS (Unix File System) – это семейство файловых систем для операционных систем UNIX. Существует много различных версий ОС UNIX, разработанных разными фирмами, соответственно существуют и различные виды UFS, в том числе 32-разрядные и 64-разрядные USF. Так же как и в других файловых системах, в UFS файл записывается в один или несколько (а может быть и в несколько сотен тысяч) кластеров. Особенностью USF является иерархическая кластерная структура файла, включающая кластеры, содержащие адреса других кластеров данного файла. Еще одной особенностью UFS является очень мощная и разветвленная система защиты файлов от несанкционированного доступа – для этого файловая система содержит большое количество атрибутов. Классическая UFS поддерживает 14-буквенные имена файлов, современные UFS позволяют создавать длинные имена (до 255 символов).
Перечислим еще несколько современных файловых систем, близких по принципам построения к NTFS и USF.
Файловая система HPFS (High Performance File System) была разработана вместе с операционной системой OS/2. По структуре и возможностям близка к NTFS. В настоящее время используется редко.
Файловые системы Linux ext, Linux ext2, Linux ext3 (extended file system) специально разработаны под операционную систему Linux. Они обладают высокой надежностью и производительностью. Начиная с ext3 файловая система становится журналируемой.
Файловая система XFS — высокопроизводительная 64-разрядная журналируемая файловая система, созданная компанией Silicon Graphics и поддерживаемая операционными системами Linux (начиная с версии 2.4.25) и. FreeBSD. Позволяет эффективно работать с данными на RAID-массивах и других носителях очень большого объема.
Для персональных компьютеров Mac под Mac OS X используются файловые системы HFS (Hierarchical File System), HFS Plus. Недавно для этих компьютеров была разработана высокопроизводительная 64- битная сетевая файловая система Xsan.
Одной из неприятностей, возникающих при работе с файловой системой, является фрагментация файлов – в процессе удаления файлов (очистки кластеров) и записи новых файлов (заполнения кластеров) неизбежно оказывается, что многие файлы состоят из кластеров, находящихся в разных частях диска. В результате сильно понижается скорость работы с диском (для чтения или записи фрагментированного файла магнитной головке необходимо последовательно перемещаться на все дорожки, содержащие кластеры этого файла). Для избежания этого необходимо периодически проводить процедуру дефрагментации диска – запускать специальную утилиту, которая собирает данные из всех кластеров каждого файла и записывает их в компактную область диска (насколько это возможно). Для эффективной работы процедуры дефрагментации необходимо, чтобы диск не был полностью занят, желательно, чтобы не менее 20 – 30% диска было свободно. Особенно это важно для файловой системы NTFS. Процедуру дефрагментации лучше проводить, не дожидаясь сильной фрагментации диска, т.к. время на эту процедуру резко возрастает с увеличением фрагментации. Для сильно фрагментированного диска процедура дефрагментации может потребовать несколько часов. Для проведения дефрагментации в состав ОС Windows входит утилита, которая так и называется Дефрагментация диска.
Некоторые из современных файловых систем не требуют запуска процедуры дефрагментации, а поддерживают возможность постоянной дефрагментации операционной системой в автоматическом режиме (дефрагментация «на лету»). Такая возможность предусмотрена, например, в файловой системе XFS.
3.3.2. Логическая файловая система.
Логическая файловая система – это файловая структура с точки зрения прикладных программ и пользователя. Пользователю не очень важно как именно физически расположен файл на диске, из каких кластеров он состоит и как к этим кластерам получить доступ – ему нужно просто получить данные, находящиеся в файле или записать туда новые данные. На жестком диске современного ПК может храниться много тысяч файлов и, если бы не было четкой логики их размещения, разобраться в этом наборе данных было бы невозможно. Такая логика и обеспечивается логической файловой структурой.
С этой точки зрения файловая система представляет собой иерархическую структуру, состоящую из файлов и контейнеров – папок (каталогов, директорий). Каждая папка может включать в себя файлы и другие папки, которые в этом случае называются вложенными. Каждая папка, кроме одной, самой верхней папки, называемой корневой папкой (корневым каталогом), оказывается вложенной в какую-либо другую папку. Логическая иерархия папок повторяет логическую иерархию каталогов, заложенную на уровне физической файловой системы.
Логическая файловая структура приводит к понятию полного имени файла (пути к файлу) – символьному имени, уникальному для каждого файла. Полные имена любых двух файлов диска не могут совпадать (в отличие от просто имен).
Полное имя файла формируется следующим образом. Корневой каталог обозначается идентификатором диска с двоеточием после него, например c:, d:, e: и т.д. Далее указывается вся цепочка имен вложенных папок, приводящая к данному файлу, в конце указывается имя файла. Для отделения имени файла от имени папки и имен папок в цепочке друг от друга используется разделитель. В Windows это обратный слеш \, в UNIX – просто слеш / (впрочем, сейчас многие оболочки допускают оба этих разделителя). Таким образом, запись c:\Windows\System32\cmd.exe означает, что файл с именем cmd.exe находится в папке System32, которая вложена в папку Windows, которая, в свою очередь, вложена в корневую папку диска c: (находится в корневом каталоге диска c:). При этом запись c:\Windows\System32\cmd.exe можно рассматривать как одно уникальное имя – полное имя файла cmd.exe.
Кроме структуры вложенных папок и формирования полного имени, логическая файловая структура включает в себя обработку атрибутов и расширений файлов. Например, для файла могут быть указаны атрибуты «системный», «скрытый», «только для чтения». Расширение файла обозначает его тип: txt – простой текстовой документ, doc – документ MS Word, mp3 – мультимедийный файл и т.д. В функцию логической файловой системы входит установка, обработка и интерпретация всех этих значений в соответствии с командами пользователя или запросами программ.
Глава 3.4. Интерфейс пользователя. Графическая оболочка Windows 95/98/ME/NT/2000/XP.
Одна из важнейших задач, возникающих при работе с компьютером – обеспечение удобного и эффективного взаимодействия компьютера и пользователя. Эту задачу решает пользовательский интерфейс, включающий, во-первых, набор соглашений о представлении входной и выходной информации, а во-вторых, набор программ, обеспечивающих эти соглашения.
В настоящее время фактическим стандартом стал многооконный графический пользовательский интерфейс (GUI – Graphic User Interface), управляемый мышью. В рамках этого интерфейса каждый информационный объект представляется на экране в виде некоторого графического образа. Графический образ меняется в зависимости от состояния объекта. Существует 2 основных типа стандартных графических образов объектов – значок и окно. Значок обычно используется для неактивных объектов, а окно – для активных, работающих в данный момент и ведущих диалог с пользователем. Структура окна такова, чтобы наиболее эффективно обеспечить диалог объекта с пользователем.
Программы, обеспечивающие пользовательский интерфейс, называются программами-оболочками. В состав большинства современных операционных систем входят встроенные оболочки. Однако не обязательно пользоваться именно встроенной оболочкой операционной системы – можно и любой другой программой-оболочкой, если для данной операционной системы такая программа существует.
Рассмотрим кратко реализацию GUI в оболочке ОС Windows.
Основное управляющее устройство при работе с GUI – это мышь. При работе с мышью в рамках GUI действуют следующие соглашения. Если поместить курсор мыши попал в область, занятую графическим образом какого-либо объекта, то становятся доступными свойства этого объекта и методы, связанные с этим объектом. Для каждого объекта выделяется основной метод (запуск), который для большинства объектов реализуется двойным щелчком левой кнопки мыши. Для тех объектов, у которых основной метод является единственным (например, для пунктов меню) достаточно одиночного нажатия левой кнопкой. Дополнительные свойства и методы реализуются при помощи контекстного меню, которое запускается нажатием правой кнопки мыши. Для перемещения графического образа объекта по экрану используется перемещение мыши с нажатой левой или правой клавишей. При этом графический образ как бы «прилипает» к курсору мыши. Если в процессе перемещения графический образ оказался в области, занятой графическим образом другого объекта, то реализуется «вставка» первого объекта во второй (если такая операция определена). Для изменения размеров графического образа объекта (если такое возможно) также используется перемещение мыши с нажатой левой клавишей, но при этом курсор мыши должен быть установлен в строго определенное место – на маркер изменения размеров или на границу. Доступные действия при нахождении курсора мыши в данном месте можно определить по изменению вида курсора (простая белая стрелка, двойная тонкая черная стрелка, перекрестие черных стрелок и т.д.).
Базовый объект GUI – Рабочий стол, он занимает весь экран и представляет собой поле, на котором расположены графические образы наиболее важных объектов (значки и ярлыки) и Панель задач с кнопкой Пуск.
Панель задач предназначена для отображения (в виде значков) всех активных в данный момент прикладных информационных объектов, т.е. на ней отображаются все открытые документы, запущенные приложения и т.д. Обычно, на панели задач находится ярлыки панелей настройки системных часов и переключения раскладки клавиатуры (RU – русская, EN – английская). Следует отметить, что большинство системных программ и процессов не отображается на Панели задач – для того, чтобы их увидеть, необходимо запустить Диспетчер задач комбинацией клавиш Ctrl+Alt+Delete и перейти во вкладку Процессы. На Панели задач можно также организовать панель быстрого запуска, расположив на ней наиболее часто использующиеся объекты. Обычно Панель задач расположена в нижней части экрана, но можно передвинуть мышью и в другое место.
Кнопка Пуск (Start), расположена на Панели задач, при ее нажатии вызывается главное меню Windows, через которое возможен доступ к любым программам, документам и другим ресурсам компьютера.
Окно – это один из основных элементов графического интерфейса. При запуске любой программы, открытии любого документа и вообще при активизации любого прикладного объекта, использующего GUI, появляется соответствующее окно. Обычно окно приложения состоит из заголовка (верхняя панель, содержащая название окна; за эту панель можно окно переместить в другое место), кнопок сворачивания, развёртывания и закрытия окна (справа от заголовка), значка системного меню (слева от заголовка), границ окна (двигая которые можно изменять его размер), главного меню (под заголовком), панели инструментов (под главным меню), строки состояния (нижняя строчка окна). Остальное – рабочая область окна. В рабочей области отображается в текстовом и графическом виде вся необходимая пользователю информация. Если пользователю необходимо ввести текстовые данные в программу, это также делается через рабочую область окна. Рабочая область может также содержать дополнительные меню и панели, она может быть разбита на автономные области – фреймы и включать в себя вложенные окна. Окно, с которым пользователь работает в данный момент, является активным, и выделено другим цветом заголовка и кнопки на панели задач.
Меню – тоже часть графического интерфейса. Меню состоит из списка команд, представленного в виде набора пунктов меню. Нужный пункт меню выбирается мышью. Меню может включать команды, которые сами являются списками команд, выбор соответствующего пункта приводит к появлению нового (вложенного) меню.
Контекстные меню вызываются нажатием правой кнопки мыши на какой-нибудь объект (например, рабочий стол или файл). С их помощью можно изменять свойства объектов и запускать связанные с ними программы и команды.
Диалоговые панели - специальные окна, позволяющие пользователю вводить информацию. Могут состоять из нескольких страниц – вкладок. Могут содержать кнопки, раскрывающиеся списки, ползунки, флажки, переключатели, текстовые поля и счётчики.
Папки представляют элементы логической файловой системы. В исходном виде папка представляется в виде значка. Если папку открыть (двойным щелчком мыши), то она представится в виде окна, в рабочей области которого будут отображены, находящиеся в этой папке файлы и вложенные папки. Любую из вложенных папок можно открыть аналогично.
Ярлык объекта – это указатель на данный объект. Ярлык можно создать в любой папке (или на Рабочем столе) для того, чтобы получить доступ к объекту из этой папки. Двойной щелчок по ярлыку позволяет запустить объект. Ярлык – это графический образ специального маленького файла, содержащего адрес (полное имя) объекта
Более подробно работа с графическим интерфейсом Windows рассмотрена в разделе 4.
Глава 3.5. Кодирование текста, цвета и звука.
При формировании информационных объектов весьма важным является ответ на вопрос как те или иные свойства объекта представляются в виде данных. Например, объект представляет текст, состоящий из символов (букв, цифр, знаков препинания). Как этот текст представить в виде набора данных, т.е. набора чисел? Аналогичные вопросы можно задать и по поводу изображения, и по поводу и звука.
Рассмотрим сначала пример с текстом. Текст состоит из символов, но сами символы уже ни из чего не состоят – они являются элементарными объектами. Причем символов конечное количество. Например, в русском языке 33 заглавных и 33 строчных буквы, вместе со знаками препинания – чуть больше 70 символов. Самый простой способ превратить символы в числа (данные) – просто перенумеровать их, т.е. поставить в соответствие каждому числу его порядковый номер и далее работать с этими номерами. Более общий способ – поставить в соответствие каждому символу какое-либо число (код) с одним обязательным условием – разным символам должны соответствовать разные коды. Это и есть кодировка символов.
Вообще, представление однородной группы элементарных объектов или элементарных свойств объекта в виде чисел (кодов), так что каждый объект (или свойство) представляется одним кодом и разным объектам (или свойствам) соответствуют разные коды, называется кодированием этой группы объектов.
3.4.1. Кодирование текста.
Для кодирования символов применяются две основных кодировки (системы кодирования):
· ASCII (однобайтовая кодировка)
· UNICODE (двухбайтовая кодировка).
Исторически сложилось, что сначала текст начали кодировать, присваивая символам номера от 0 до 255 (256 значений). При этом код любого символа укладывается в один байт, поэтому такая кодировка была названа однобайтовой. Таблица соответствия символов и кодов, называется кодировочной таблицей. Для однобайтовой кодировки символов кодировочную таблицу считают состоящей из двух частей – нижней (символы с кодами от 0 до 127) и верхней (символы с кодами от 128 до 255). Нижняя часть кодировочной таблицы соответствует стандарту ASCII (American Standard Code for Information Interchange).
Дата добавления: 2017-02-13; просмотров: 994;