Получение информации из Интернета
Интернет – всемирная компьютерная сеть. Если два компьютера, находящиеся на разных континентах, обмениваются данными в Интернете, это совсем не значит, что между ними действует одно прямое или виртуальное соединение. Данные, которые они посылают друг другу, разбиваются на пакеты, и даже в одном сеансе связи пакеты одного сообщения могут пройти разными маршрутами. При этом данные, отправленные позже, могут приходить раньше, но это не помешает правильно собрать документ, поскольку каждый пакет имеет свою маркировку. Таким образом, Интернет – "пространство", внутри которого осуществляется непрерывная циркуляция данных. Информация в Интернете перемещается между компьютерами, составляющими узлы сети, и хранится на жестких дисках. Для работы в Интернете необходимо:
- физически подключить компьютер к одному из узлов
Всемирной сети*3;
- получить IP-адрес на постоянной или временной основе *2;
- установить и настроить программное обеспечение (программы-
клиенты).
Основными службами Интернета являются:
- WWW (World Wide Web*4);
- электронная почта (E-Mail*5);
- терминальный режим (Telnet*6);
- служба передачи файлов (FTP*7);
- IRC (Internet Relay Chat*8);
В Интернет обращаются за определённой информацией. Чтобы открыть нужную Web-страницу, надо иметь либо её адрес, либо другую страницу с ссылкой на неё. Если нет ни того ни другого, обращаются к поисковым системам. Поисковая система представляет собой специализированный Web-узел. Пользователь сообщает поисковой системе данные о содержании искомой Web-страницы, а поисковая система выдаёт список гиперссылок на страницы, на которых упоминаются соответствующие сведения. Поисковые системы классифицируют по методам поиска.
Поисковые каталоги предназначены для поиска по темам. Пользователь «погружается» в иерархическую структуру разделов и подразделов, на нижнем уровне которой располагается относительно небольшое число ссылок, заслуживающих внимания. Поисковый каталог обеспечивает высокое качество поиска.
Поисковый индекс обеспечивает поиск по заданным ключевым словам. В результате поиска формируется набор гиперссылок на Web-страницы, содержащие указанные термины. Поисковые индексы предоставляют грандиозную широту поиска.
Многие поисковые системы сочетают в себе оба вышеуказанных метода поиска и позволяют использовать наиболее подходящий. На рис.40 приведён пример такой системы.
Рис.40. Окно поисковой системы Google
*1
Протоколы определяют характер аппаратного взаимодействия компонентов сети (аппаратные протоколы) и характер взаимодействия программ и данных (программные протоколы). Физически функции поддержки протоколов исполняют аппаратные устройства (интерфейсы) и программные средства (программы поддержки протоколов). Программы, выполняющие поддержку протоколов, также называют протоколами.
*2
Протокол IP (Internet Protocol) – адресный. Он принадлежит к сетевому уровню и определяет, куда происходит передача. Каждый участник Интернета имеет уникальный IP-адрес (четыре байта, например, 195.38.46.11.). По этим четырем числам определяется, кому из ближайших "соседей" надо переслать пакет, чтобы он оказался "ближе" к получателю.
Решением вопросов, что считать "ближе", а что "дальше", занимаются специальные средства - маршрутизаторы (либо специализированный компьютер, либо специальная программа, работающая на узловом сервере).
*3
Организации, предоставляющие возможность подключения к своему узлу и выделяющие IP-адреса, называются поставщиками услуг Интернета (провайдер).
Физическое подключение может быть выделенным или коммутируемым. Для выделенного соединения необходимо проложить новую или арендовать готовую физическую линию связи (кабельную, оптоволоконную и т.п.). От типа линий зависит ее пропускная способность (бит в секунду). Коммутируемое соединение – временное. Оно может быть осуществлено, например, по телефонной линии (не требует специальной линии). Коммутацию (подключение) выполняет автоматическая телефонная станция (АТС) по сигналам, выданным в момент набора телефонного номера. Различают аналоговые и цифровые телефонные линии. Пропускная способность цифровых в несколько раз выше.
Телефонные линии связи никогда не предназначались для передачи цифровых сигналов. Поэтому для передачи цифровой информации сигналы звуковой частоты модулируют по амплитуде, фазе и частоте. Такое преобразование выполняет специальное устройство – модем (модулятор и демодулятор).
*4
Служба World Wide Web – это единое информационное пространство, состоящее из сотен миллионов взаимосвязанных электронных документов, хранящихся на Web-серверах. Отдельные документы, составляющие пространство Web, называют Web-страницами.
Группы тематически объединенных Web-страниц называют Web-узлами (сайтами). Один физический Web-сервер может содержать много Web-узлов, каждому из которых отводится отдельный каталог на жестком диске сервера. От обычных текстовых документов Web-страницы отличаются тем, что они оформлены без привязки к конкретному носителю. Они предназначены для просмотра на экране компьютера, причем заранее не известно, на каком. Web-документы не могут иметь "жесткого" форматирования. Оформление выполняется непосредственно во время их воспроизведения на компьютере клиента и происходит в соответствии с настройками программы, выполняющей просмотр. Программы для просмотра Web-страниц называют браузерами. Браузер выполняет отображение документа на экране, руководствуясь командами, которые автор документа внедрил в его текст. Такие команды называют тегами (текст, заключенный в угловые скобки).
Обычно используют: открывающий тег и закрывающий. Правила записи тегов содержатся в спецификации языка разметки гипертекста - HTML (Hyper Text Markup Language *12). Таким образом, Web-документ – обычный текстовый документ, размеченный тегами HTML.
*5
Электронная почта – служба, которая является одной из наиболее ранних. Её обеспечением в Интернете занимаются специальные почтовые серверы. (Здесь и далее под сервером может пониматься программное обеспечение).
Почтовые серверы получают сообщения от клиентов и пересылают их по цепочке к почтовым серверам адресатов, где эти сообщения накапливаются. При установлении соединения между адресатом и его почтовым сервером происходит автоматическая передача поступивших сообщений на компьютер адресата.
Почтовая служба основана на двух прикладных протоколах: SMPT и POP3. По первому происходит отправка корреспонденции с компьютера на сервер, а по второму – приём поступивших сообщений. Существует большое разнообразие клиентских программ. К ним относятся, например, Microsoft Outlook Express, Microsoft Outlook 2000, The Bat, Eudora Pro и др.
*6
Исторически одной из ранних является служба удалённого управления компьютером Telnet. Подключившись к удалённому компьютеру по протоколу этой службы, можно управлять его работой. Такое управление ещё называют консольным или терминальным. В прошлом эту службу широко использовали для проведения сложных математических расчётов на удалённых вычислительных центрах. В наши дни в связи с быстрым увеличением мощности персональных компьютеров необходимость в подобной услуге сократилась, но, тем не менее, службы Telnet в Интернете продолжают существовать. Часто протоколы Telnet применяют для дистанционного управления техническими объектами, например, телескопами, видеокамерами, промышленными роботами.
*7
FTP – служба передачи данных. Прием и передача файлов составляют значительный процент от прочих Интернет-услуг. Необходимость в передаче файлов возникает, например, при приеме файлов программ, при пересылке крупных документов (например, книг), а также при передаче архивных файлов, в которых запакованы большие объёмы информации.
Служба FTP имеет свои серверы в мировой сети, на которых хранятся архивы данных. Со стороны клиента для работы с серверами FTP может быть установлено специальное программное обеспечение, хотя в большинстве случаев броузеры WWW обладают встроенными возможностями для работы по протоколу FTP.
Протокол FTP работает одновременно с двумя TCP-соединениями между сервером и клиентом. По одному соединению идёт передача данных, а второе соединение используется как управляющее. Протокол FTP также предоставляет серверу средства для идентификации обратившегося клиента.
*8
Служба IRC (Internet Relay Chat) предназначена для прямого общения нескольких человек в режиме реального времени. Иногда эту службу называют чат-конференциями или просто чатом. В отличие от системы телеконференций, в которой общение между участниками обсуждения темы открыто всему миру, в системе IRC общение происходит только в пределах одного канала, в работе которого принимают участие обычно лишь несколько человек. Каждый пользователь может создать собственный канал и пригласить в него участников «беседы» или присоединиться к одному из открытых в данный момент каналов.
*9
При отображении HTML-документа теги не показываются, однако оформление текста (выравнивание, цвет, размер и прочее) выполняется в соответствии тем, какие теги имплантированы в текст документа.
Существуют специальные теги для внедрения графических и мультимедийных объектов (звук, музыка, видеоклипы). Встретив такой тег, браузер делает запрос к серверу на доставку файла, связанного с тегом, и воспроизводит его в соответствии с заданными параметрами.
Наиболее важной чертой Web-страниц являются гипертекстовые ссылки. С любым фрагментом текста или рисунком с помощью тегов можно связать другой Web-документ, т.е. установить гиперссылку. В этом случае при щелчке левой кнопкой мыши на гиперссылке отправляется запрос на доставку нового документа, который в свою очередь тоже может иметь гиперссылки. Целенаправленное перемещение по Web-документам называют Web-навигацией (выполняется с целью поиска нужной информации). Каждый документ обладает уникальным адресом. Он определяется унифицированным указателем ресурса – URL.Адрес URL состоит из трех частей.
1. Указания службы, которая осуществляет доступ к данному ресурсу. (Так для службы WWW указывается протокол http [HyperText Transfer Protocol – протокол передачи гипертекста]). После имени протокола ставится двоеточие (:) и два знака (/ /). http://...
2. Указание доменного имени компьютера (сервера), на котором хранится данный ресурс: http://www.abcde.com...
3. Указание полного пути доступа к файлу на данном компьютере. В качестве разделителя используется символ (/):
http://www.abcde.com/Files/New/abcdef.zip
При записи URL-адреса важно точно соблюдать регистр символов (строчные и прописные).
Именно в форме URL и связывают адрес ресурса с гиперссылками на Web-страницах. Т.о. существуют две разные формы записи адреса одного и того же сетевого компьютера. Человеку неудобно работать с числовым представлением IP-адреса (четыре байта), а доменное имя запоминается легко (например, Web-сервер компании Microsoft имеет имя www.microsoft.com). Переводом доменных имен в связанные с ними IP-адреса занимаются специальные серверы DNS.
Дата добавления: 2016-09-26; просмотров: 4756;