Разновидности файлов
В языке Pascal имеется возможность работы с тремя видами файлов:
· текстовыми;
· типизированными;
· нетипизированными.
Последние два типа объединяются под названием бинарные, информация в них записывается по байтам и потому не доступна для просмотра или редактирования в удобных для человека текстовых редакторах; зато такие файлы более компактны, чем текстовые.
В отличие от бинарных, текстовые файлы возможно создавать, просматривать и редактировать "вручную" - в любом доступном текстовом редакторе. Кроме того, при считывании данных из текстового файла нет необходимости заботиться об их преобразовании: в языке Pascal имеются средства автоматического перевода содержимого текстовых файлов в нужный тип и формат, и это позволяет сэкономить немало времени и сил.
Описание файлов
В разделе var переменные, используемые для работы с файлами (файловые переменные), описываются следующим образом:
var f1,f2: text; {текстовые файлы}
g: file of <тип_элементов_файла>; {типизированные файлы}
Файловая переменная не может быть задана константой.
Текстовые файлы. Оперирование файлами
Здесь мы ограничимся рассмотрением только текстовых файлов, а о типизированных расскажем позже.
С этого момента и до конца лекции под словом "файл" мы будем подразумевать "текстовый файл" (разумеется, если специально не оговорено обратное). Однако многие описываемые ниже команды пригодны не только для текстовых, но и для бинарных файлов.
Назначение файла
Процедура assign(f,'<имя_файла>'); служит для установления связи между файловой переменной fи именем того файла, за действия с которым эта переменная будет отвечать.
На разных этапах работы программы одной и той же файловой переменной можно присваивать разные значения. Например, если в начале программы мы напишем
assign(f,'input.txt');
то переменной f будет соответствовать файл, из которого производится считывание входных данных, вплоть до того момента, когда в программе встретится, скажем, команда
assign(f,'output.txt');
после которой переменной f будет уже соответствовать тот файл, куда выводятся результаты.
Строка '<имя_файла>' может содержать полный путь к файлу. Если путь не указан, файл считается расположенным в той же директории, что и исполняемый модуль программы. Именно этот вариант обычно считается наиболее удобным.
Открытие файла
В зависимости от того, какие действия ваша программа собирается производить с открываемым файлом, возможно троякое его открытие:
reset(f); | - открытие файла для считывания из него информации; если такого файла не существует, попытка открыть его вызовет ошибку и аварийную остановку работы программы. Эта же команда служит для возвращения указателя на начало файла; |
rewrite(f); | - открытие файла для записи в него информации; если такого файла не существует, он будет создан; если файл с таким именем уже есть, вся содержащяся в нем ранее информация исчезнет; |
append(f); | - открытие файла для записи в него информации (указатель помещается в конец этого файла). Если такого файла не существует, он будет создан; а если файл с таким именем уже есть, вся содержащаяся в нем ранее информация будет сохранена, потому что запись будет производиться в его конец. |
Закрытие файла
После того, как ваша программа закончит работу с файлом, очень желательно закрыть его:
close(f);
В противном случае информация, содержащаяся в этом файле, может быть потеряна.
Считывание файла
Чтение данных из файла, открытого для считывания, производится с помощью команд read() и readln(). В скобках сначала указывается имя файловой переменной, а затем - список ввода. Например:
read(f,a,b,c); | - читать из файла f три переменные a, b и c. После выполнения этой процедуры указатель в файле передвинется за переменную с; |
readln(f,a,b,c); | - читать из файла f три переменные a, b и c, а затем перевести указатель ("курсор") на начало следующей строки; если кроме уже считанных переменных в строке содержалось еще что-то, то этот "хвост" будет проигнорирован. |
Если вспомнить, что в памяти компьютера любой файл записывается линейной последовательностью символов и никакой разбивки на строки там реально нет, то действия процедуры readln() можно пояснить так: читать все указанные переменные, а затем игнорировать все символы вплоть до ближайшего символа "конец строки" или "конец файла". Указатель при этом перемещается на позицию непосредственно за первым найденным символом "конец строки".
Если же символ конца строки встретится где-нибудь между переменными, указанными в списке ввода, то обе процедуры его просто проигнорируют.
Считывать из текстового файла можно только переменные простых типов: целых, вещественных, символьных, а также строковых. Численные переменные, считываемые из файла, должны разделяться хотя бы одним пробельным символом. Типы вводимых данных и типы тех переменных, куда эти данные считываются, обязаны быть совместимыми. Здесь действуют все те же правила, что и при считывании с клавиатуры.
Считываемые переменные могут иметь различные типы. Например, если в файле fзаписана строка
1 2.5 с
то командойread(f,a,b,c,c); можно прочитать одновременно значения для трех переменных, причем все разных типов:
a: byte;
b: real;
c: char;
Замечание: Обратите внимание, что символьную переменную c пришлось считывать дважды, так как после числа "2.5" сначала идет символ пробела и только затем буква "c".
Из файла невозможно считать переменную составного типа (например, если а - массив, то нельзя написать read(f,a), можно ввести его только поэлементно, в цикле.
Особенно внимательно нужно считывать строки (string[length]и string): эти переменные "забирают" из файла столько символов, сколько позволяет им длина (либо вплоть до ближайшего конца строки). Если строковая переменная неопределенной длины (тип данных string) является последней в текущей строке файла, то никаких проблем с ее считыванием не возникнет. Но в случае, когда необходимо считывать переменную типа string из начала или из середины строки файла, это придется делать с помощью цикла - посимвольно. Аналогичным образом - посимвольно, от пробела до пробела - считываются из текстового файла слова.
Есть еще один (гораздо более трудоемкий) способ: считать из файла всю строку целиком, а затем "распотрошить" ее - разобрать на части специальной процедурой выделения подстрок copy(). После этого (где необходимо) применить процедуру превращения символьной записи числа в само число, применяя стандартную процедуру val(). Кроме того, совсем не очевидно, что длина вводимой строки не будет превышать 256 символов, поэтому такой способ приходится признать неудовлетворительным.
Запись в файл
Сохранять переменные в файл, открытый для записи командами rewrite(f) или append(f), можно при помощи команд write() и writeln(). Так же, как в случае считывания, первой указывается файловая переменная, а за ней - список вывода:
write(f,a,b,c); | - записать в файл f переменные a,b и c; |
writeln(f,a,b,c); | - записать в файл fпеременные a, b и c, а затем записать туда же символ "конец строки". |
Выводить в текстовый файл можно переменные любых базовых типов (вместо значений логического типа выведется их строковый аналог TRUE или FALSE) или строки.
Структурированные типы данных можно записывать только поэлементно.
Пробельные символы
К пробельным символам (присутствующим в файле, но невидимым на экране) относятся:
· символ горизонтальной табуляции (#9);
· символ перевода строки (#10) (смещение курсора на следующую строку, в той же позиции);
· символ вертикальной табуляции (#11);
· символ возврата каретки (#13) (смещение курсора на начальную позицию текущей строки; в кодировке UNIX один этот символ служит признаком конца строки);
· символ конца файла (#26);
· символ пробела (#32).
Замечание: Пара символов #13 и #10 является признаком конца строки текстового файла (в кодировках DOS и Windows).
В (текстовом) файле границами чисел служат пробельные символы; при считывании чисел эти пробельные символы игнорируются, сколько бы их ни было. Таким образом, если ввод многих чисел производится с помощью командыread(), то нет никакой разницы, как именно записаны эти числа: в одну строку, в несколько строк или вовсе в один столбик. В любом случае считывание пройдет корректно и завершится только по достижении конца файла.
Если же считывание тестового файла производится посимвольно, то нужно аккуратно отслеживать пробельные (особенно концевые) символы.
Поиск специальных пробельных символов (нас интересуют в основном #10, #13 и #26) можно осуществлять при помощи стандартных функций:
eof(f) – возвращает значение TRUE, если уже достигнут конец файла f (указатель находится сразу за последним элементом файла), и FALSE в противном случае;
seekeof(f) – возвращает значение TRUE, если «почти» достигнут конец файла f (между указателем и концом файла нет никаких символов, кроме пробельных), и FALSE в противном случае;
eoln(f) – возвращает значение TRUE, если достигнут конец строки в файле f (указатель находится сразу за последним элементом строки), и FALSE в противном случае;
seekeoln(f) – возвращает значение TRUE, если «почти» достигнут конец строки в файле f (между указателем и концом строки нет никаких символов, кроме пробельных), и FALSE в противном случае.
Ясно, что в большинстве случаев предпочтительнее использовать функции seekeof(f) и seekeoln(f): они предназначены специально для текстовых файлов, игнорируют концы строк (и вообще все пробельные символы) и потому позволяют автоматически обработать сразу несколько частных случаев.
Например, если по условию задачи файл входных данных может содержать только одну строку, то правильнее всего будет написать программу, обрабатывающую все возможные варианты:
· одна строка, заканчивающаяся символом конца файла;
· одна строка, заканчивающаяся несколькими концевыми пробелами, а затем символом конца файла;
· одна строка, заканчивающаяся символом конца строки, а затем – символом конца файла (на самом деле получается, что в файле содержится не одна, а две строки, но вторая – пустая);
· одна строка, заканчивающаяся несколькими концевыми пробелами, затем символом конца строки, а затем – символом конца файла.
Поскольку функции seekeof() и seekeoln() при каждой проверке пытаются проигнорировать все пробельные символы, то и результаты их работы отличаются от результатов работы функций eof() и eoln(). Эти различия нужно учитывать.
Дата добавления: 2017-01-26; просмотров: 1256;