Компьютерные технологии подготовки текстовых документов
В этом параграфе будут рассмотрены основные понятия, задачи и методы обработки текстовой информации с помощью персональных компьютеров.
Задачи обработки текстовой информации
Выделим несколько этапов обработки документов:
– ввод текста;
– редактирование;
– сохранение документа;
– публикация;
– поиск и открытие созданного документа.
Рассмотрим практическую реализацию этих этапов.
Ввод текста
Набор текста при помощи клавиатуры.
Этот способ в настоящее время является самым распространенным. В зависимости от вида последующей публикации следует правильно выбрать шрифт, который будет использоваться при наборе.
В операционной системе Windows основными являются шрифты стандарта TrueType, так как они не нуждаются в специальных преобразователях и могут применяться в большинстве приложений.
Рис. 8.3.1. Диалоговое окно настройки шрифтов
Программное обеспечение, предназначенное для обработки документов с помощью компьютера, условно разделяют на две категории: текстовые редакторы и текстовые процессоры. Формально будем различать их следующим образом.
Текстовые редакторы представляют собой простейшие программы, предназначенные для самого примитивного редактирования текста. Как правило, они не имеют развитых средств форматирования. Классическим примером текстового редактора является, например, Windows Notepad. Текстовые процессоры содержат гораздо более развитые средства создания и оформления документов. В качестве примеров рассмотрим наиболее широко применяемые на данный момент в мировой практике, и особенно в российской экономической науке, текстовые процессоры.
Если говорить об общемировой практике, то основными инструментами для подготовки текстовых документов являются процессоры Word компании Microsoft; Word Perfect фирмы Corel; а также пакет Star Office, разработанный немецкой компанией Star Division GMBH.
Осуществлять настройку шрифтов, идущих в комплектации с ОС Windows, можно следующим образом: в главном меню Windows через Start (Пуск) выберите команду Settings (Настройки) > Control Panel (Панель управления) и в появившемся окне щелкните двойным щелчком левой кнопки мыши на значке Fonts (Шрифты). В окне (рис. 8.3.1) появится список шрифтов, из которого вы можете выбирать наиболее подходящие для работы. По мере того, как вы выбираете какой-либо из шрифтов, вам автоматически предлагается посмотреть, как он выглядит на экране, в зависимости от размера. Вы можете ознакомиться с тем, как выглядят печатные и прописные буквы, цифры, знаки препинания, набираемые с использованием этого шрифта, а также принять к сведению характеристики шрифта и то, к какому стандарту он относится. Эта информация также может пригодиться для предсказания возможного "поведения" данного шрифта в рамках подготавливаемой публикации.
Перевод бумажных документов в электронную форму
Необходимость такого преобразования обусловлена тем, что многие текстовые документы имеют вид бумажных изданий: бланки платежных поручений, деловые письма, финансовая документация и многое другое. Для того чтобы иметь возможность быстро и правильно редактировать такие документы, а также публиковать их в дальнейшем в разном виде, и возникает потребность в программном обеспечении, обеспечивающем создание электронного образа бумажного документа, а также в соответствующих устройствах.
На сегодняшний день такими устройствами являются сканеры.
Непосредственным результатом работы сканеров является так называемый графический образ информации. Таким образом, в случае работы с текстами мы на выходе процесса сканирования получаем не структурированные данные, логически разбивающиеся на фразы, слова и символы, несущие самостоятельную смысловую нагрузку, а всего лишь переведенную в электронную форму информацию о внешнем виде отсканированного текстового фрагмента. В результате возникает чрезвычайно сложная задача восстановления смыслового содержания текста по его изображению. Для ее решения предназначен специальный класс программного обеспечения, получивший название программ распознавания образов – OCR (от англ, optical character recognizer). На рынке ПО присутствует немало пакетов данного назначения. В России явным лидером выступает пакет Fine Reader
Редактирование
Под редактированием понимается изменение набранного текста и придание ему надлежащего вида, будь то простое удаление ошибочных символов, вставка текстовых массивов либо так называемое форматирование, связанное в основном с изменением параметров шрифта и абзацев. Рассмотрим конкретные приемы и средства редактирования применительно к Microsoft Word 2000.
Дата добавления: 2020-12-11; просмотров: 353;