В 1961 году Defence Advanced Research Agensy (DARPA) по заданию министерства обороны США приступило к проекту по созданию экспериментальной сети передачи пакетов. Эта сеть, названная ARPANET, предназначалась первоначально для изучения методов обеспечения надежной связи между компьютерами различных типов. Многие методы передачи данных через модемы были разработаны в ARPANET. Тогда же были разработаны и протоколы передачи данных в сети - TCP/IP. TCP/IP - это множество коммуникационных протоколов, которые определяют, как компьютеры различных типов могут общаться между собой. Эксперимент с ARPANET был настолько успешен, что многие организации захотели войти в нее, с целью использования для ежедневной передачи данных. И в 1975 году ARPANET превратилась из экспериментальной сети в рабочую сеть. Ответственность за администрирование сети взяло на себя Defence Communication Agency (DCA), в настоящее время называемое Defence Information Systems Agency (DISA). Но развитие ARPANET на этом не остановилось; Протоколы TCP/IP продолжали развиваться и совершенствоваться. В 1983 году вышел первый стандарт для протоколов TCP/IP, вошедший в Military Standarts (MIL STD), т.е. в военные стандарты, и все, кто работал в сети, обязаны были перейти к этим новым протоколам. Для облегчения этого перехода DARPA обратилась с предложением к руководителям фирмы Berkley Software Design - внедрить протоколы TCP/IP в Berkeley(BSD) UNIX. С этого и начался союз UNIX и TCP/IP. Спустя некоторое время TCP/IP был адаптирован в обычный, то есть в общедоступный стандарт, и термин Internet вошел во всеобщее употребление. В 1983 году из ARPANET выделилась MILNET, которая стала относиться к Defence Data Network (DDN) министерства обороны США. Термин Internet стал использоваться для обозначения единой сети: MILNET плюс ARPANET. И хотя в 1991 году ARPANET прекратила свое существование, сеть Internet существует, ее размеры намного превышают первоначальные, так как она объединила множество сетей во всем мире. Диаграмма 1 иллюстрирует рост числа хостов, подключенных к сети Internet с 4 компьютеров в 1969 году до 3,2 миллионов в 1994. Хостом в сети Internet называются компьютеры, работающие в многозадачной операционной системе (Unix, VMS), поддерживающие протоколы TCP\IP и предоставляющие пользователям какие-либо сетевые услуги. В настоящее время в сети Internet используются практически все известные линии связи от низкоскоростных телефонных линий до высокоскоростных цифровых спутниковых каналов. Операционные системы, используемые в сети Internet, также отличаются разнообразием. Большинство компьютеров сети Internet работают под ОС Unix или VMS. Широко представлены также специальные маршрутизаторы сети типа NetBlazer или Cisco, чья ОС напоминает ОС Unix. Фактически Internet состоит из множества локальных и глобальных сетей, принадлежащих различным компаниям и предприятиям, связанных между собой различными линиями связи. Internet можно представить себе в виде мозаики сложенной из небольших сетей разной величины, которые активно взаимодействуют одна с другой, пересылая файлы, сообщения и т.п. Примером топологии сети Internet может служить сеть Х-Атом, состоящая из нескольких подсетей, и в то же время являющаяся фрагментом всемирной сети Internet. На сегодняшний день в мире существует более 130 миллионов компьютеров и более 80 % из них объединены в различные информационно-вычислительные сети от малых локальных сетей в офисах до глобальных сетей типа Internet. Всемирная тенденция к объединению компьютеров в сети обусловлена рядом важных причин, таких как ускорение передачи информационных сообщений, возможность быстрого обмена информацией между пользователями, получение и передача сообщений ( факсов, E - Mail писем и прочего ) не отходя от рабочего места, возможность мгновенного получения любой информации из любой точки земного шара, а так же обмен информацией между компьютерами разных фирм производителей работающих под разным программным обеспечением. Такие огромные потенциальные возможности которые несет в себе вычислительная сеть и тот новый потенциальный подъем который при этом испытывает информационный комплекс, а так же значительное ускорение производственного процесса не дают нам право не принимать это к разработке и не применять их на практике. Поэтому необходимо разработать принципиальное решение вопроса по организации ИВС ( информационно-вычислительной сети ) на базе уже существующего компьютерного парка и программного комплекса отвечающего современным научно-техническим требованиям с учетом возрастающих потребностей и возможностью дальнейшего постепенного развития сети в связи с появлением новых технических и программных решений. Сегодня множество людей неожиданно для себя открывают для себя существование глобальных сетей, объединяющих компьютеры во всем мире в единое информационное пространство, которое называется Internet. Что это такое, определить непросто. С технической точки зрения Internet - это объединение транснациональных компьютерных сетей, работающих по различным протоколам, связывающих всевозможные типы компьютеров, физически передающих данные по всем доступным типам линий - от витой пары и телефонных проводов до оптоволокна и спутниковых каналов. Большая часть компьютеров в Internet связано по протоколу TCP/IP. Можно сказать, что Internet- это сеть сетей, опутывающая весь земной шар. Протокол TCP/IP позволяет передавать информацию, а его используют разнообразные сетевые сервисы, по- разному обращающиеся с этой информацией. Internet не решила проблемы хранения и упорядочения информации, но решила проблему её передачи, дав возможность получать её когда и где угодно. Поскольку Сеть (здесь и далее Сеть- с большой буквы- будет означать Internet) децентрализована, то отключение даже значительной части компьютеров не повлияет на её функциональность. По оценкам аналитиков, в 1995 году число полноценно подключённых к Сети компьютеров составило около 7 миллионов и продолжает стремительно расти. По тем же оценкам, в начале следующего века Сеть может стать столь же доступна, как телефон или телевидение сегодня. В Сети существует большое число сервисов. Нас в дальнейшем будет интересовать WWW или просто Web (Word-Wide Web- всемирная паутина). Это самый популярный сервис Сети и удобный способ работы с информацией. Сегодня существует по меньшей мере 30 тыс. серверов WWW. Именно за счет WWW Сеть растёт так стремительно. Пользуясь несложным языком описания, можно составлять гипермедийные документы для их последующей публикации в Сети (под гипермедийным я подразумеваю документ, который может содержать все виды информации - от простого текста до мултимедийных роликов). Чтобы увидеть содержание документа так, как его представляет себе его автор нужно иметь на компьютере- клиенте программу просмотра- браузер. Наиболее популярен сегодня Netscape Navigator, поддерживающий многие расширения HTML (Hyper Text Markup Language- язык гипертекстовой разметки документов - именно с его помощью оформляется информация в WWW). Далее под словами браузер или программа просмотра я буду подразумевать именно эту программу, хотя и не исключено, что и какая- либо другая программа сможет отображать всё так, как было задумано. Теперь немного информации о технологии «клиент- сервер». Она известна уже довольно длительное время, но раньше чаще всего использовалась в крупных сетях масштаба предприятия. Сегодня, с развитием Internet, эта технология все чаще привлекает взоры разработчиков программного обеспечения. В мире накоплено огромное количество информации по различным вопросам. Чаще всего эта информация хранится в базах данных (БД). Чтобы опубликовать её в Сети приходилось экспортировать БД в HTML- документы, что требовало больших затрат и усложняло поиск информации. Сегодня имеется большой опыт подобных работ. Практически любой пользователь Сети не раз сталкивался с подобными БД. Например, главное в работе популярного поискового сервера Yahoo (адрес- http::\\www.yahoo.com)- это запросы к базе данных WWW- сервера по ключевым словам. Ответ сервера- список гипертекстовых ссылок на найденные в Сети страницы, содержащие нужную информацию. Именно сегодня проблема Web- интерфейса к БД как никогда актуальна. Internet - глобальная компьютерная сеть, охватывающая весь мир. Сегодня Internet имеет около 15 миллионов абонентов в более чем 150 странах мира. Ежемесячно размер сети увеличивается на 7-10%. Internet образует как бы ядро, обеспечивающее связь различных информационных сетей, принадлежащих различным учреждениям во всем мире, одна с другой. Если ранее сеть использовалась исключительно в качестве среды передачи файлов и сообщений электронной почты, то сегодня решаются более сложные задачи распределеного доступа к ресурсам. Около двух лет назад были созданы оболочки, поддерживающие функции сетевого поиска и доступа к распределенным информационным ресурсам, электронным архивам. Internet, служившая когда-то исключительно исследовательским и учебным группам, чьи интересы простирались вплоть до доступа к суперкомпьютерам, становится все более популярной в деловом мире. Компании соблазняют быстрота, дешевая глобальная связь, удобство для проведения совместных работ, доступные программы, уникальная база данных сети Internet. Они рассматривают глобальную сеть как дополнение к своим собственным локальной сетям. При низкой стоимости услуг (часто это только фиксированная ежемесячная плата за используемые линии или телефон) пользователи могут получить доступ к коммерческим и некоммерческим информационным службам США, Канады, Австралии и многих европейских стран. В архивах свободного доступа сети Internet можно найти информацию практически по всем сферам человеческой деятельности, начиная с новых научных открытий до прогноза погоды на завтра. Кроме того Internet предоставляет уникальные возможности дешевой, надежной и конфиденциальной глобальной связи по всему миру. Это оказывается очень удобным для фирм имеющих свои филиалы по всему миру, транснациональных корпораций и структур управления. Обычно, использование инфраструктуры Internet для международной связи обходится значительно дешевле прямой компьютерной связи через спутниковый канал или через телефон. Электронная почта - самая распространенная услуга сети Internet. В настоящее время свой адрес по электронной почте имеют приблизительно 20 миллионов человек. Посылка письма по электронной почте обходится значительно дешевле посылки обычного письма. Кроме того сообщение, посланное по электронной почте дойдет до адресата за несколько часов, в то время как обычное письмо может добираться до адресата несколько дней, а то и недель. В настоящее время Internet испытывает период подъема, во многом благодаря активной поддержке со стороны правительств европейских стран и США. Ежегодно в США выделяется около 1-2 миллионов долларов на создание новой сетевой инфраструктуры. Исследования в области сетевых коммуникаций финансируются также правительствами Великобритании, Швеции, Финляндии, Германии. Однако, государственное финансирование - лишь небольшая часть поступающих средств, т.к. все более заметной становится "коммерцизация" сети (ожидается, что 80-90% средств будет поступать из частного сектора). Пользователи решившиe подключить свой компьютер к сети должны обратить особое внимание на защиту информации. Строгие требования к защите информации связаны с тем, что подключенный к сети компьютер становится доступным из любой точки сети, и поэтому несравнимо более подвержен поражению вирусами и несанкциоированному доступу. Так несоблюдение режима защиты от несанкционированного доступа может привести к утечке информации, а несоблюдение режима защиты от вирусов может привести к выходу из строя важных систем и уничтожению результатов многодневной работы. Компьютеры работающие в многозадачных операционных системах (типа Unix, VMS) мало подвержены заражению вирусами, но их следует особо тщательно защищать от несанкционированного доступа. В связи с этим пользователи многозадачных операционных систем должны выполнять следующие требования. Каждый пользователь должен иметь свое индивидуальное имя входа в Unix-сервер и пароль. Установленный для него пароль пользователь не должен сообщать другим лицам. Смену пароля пользователь должен производить не реже одного раза в квартал, а также во всех случаях утечки информации о пароле. Администраторам и пользователям файл-серверов ЛВС NetWare необходимо также следовать приведенным выше требованиям в рамках своей ЛВС. Это связано с тем, что если в файл-сервере, подключенном к сети, загружена утилита Iptuunel, то файл-сервер также становится доступным из любой точки сети. ПЭВМ работающие в однозадачных операционных системах (типа MS-DOS), достаточно защищены от несанкционированного доступа (в силу их однозадачности), но их следует особенно тщательно защищать от поражения вирусами. Для защиты от вирусов рекомендуется применять программные средства защиты (типа aidstest), а также аппаратно-программные (типа Sheriff). В процессе дипломного проектирования были исследованы 15 пакетов абонентского программного обеспечения. В пакетах абонентского программного обеспечения изучались их возможности в операционных средах MS-DOS и MS-Windows, методы настройки, режимы работы, а также простота функционирования. По результатам исследований для каждого пакета абонентского программного обеспечения были даны рекомендации о возможности использования того или иного пакета в глобальной информационной сети работающей на базе протоколов TCP\IP. Для сравнения пакетов абонентского программного обеспечения между собой и выбора лучшего была написана программа экспертного выбора. На основании проведенных исследований можно сделать следующие выводы.Для операционной среды MS-DOS лучшим пакетом абонентского программного обеспечения с точки зрения пользователя является пакет Minuet, разработанный университетом Миннесоты (США). Пакет Minuet обладает полным спектром услуг сети Internet, а также отличным пользовательским интерфейсом. Minuet прост в использовании, может работать как по ЛВС так и по коммутируемым линиям и, самое главное, значительно дешевле своих аналогов. Без сомнения пакет Minuet в настоящее время является лучшим абонентским пакетом для ОС MS DOS. Он может быть рекомендован практически всем категориям абонентов сети.Для операционной среды MS-DOS лучшим пакетом абонентского программного обеспечения с точки зрения специалиста является пакет KA9Q. Пакет KA9Q распространяется вместе с исходными текстами и имеет в своем составе весь спектр сетевых услуг, он может быть рекомендован специалистам сети в качестве исходного материала при разработке нового пакета абонентского программного обеспечения.Для операционной среды MS-Windows лучшим пакетом абонентского прогрaммного обеспечения может быть признан пакет Chameleon, являющийся разработкой фирмы NetManage (CША). Пакет Chameleon обладает полным набором услуг сети Internet. Кроме этого Chameleon имеет в своем составе NFS-сервер, а также может работать маршрутизатором сети. На сегодняшний день Chameleon может быть признан лучшим пакетом для операционной среды MS Windows. Пакет Chameleon может быть рекомендован тем абонентам сети, которым необходим пакет абонентского программного обеспечения для MS-Windows. Он также может быть рекомендован в качестве маршрутизатора для связи небольшой ЛВС с сетью Лучшим почтовым пакетом для операционной среды MS-DOS является безусловно пакет MAIL2, разработанный фирмой PC-центр Техно (Россия). Пакет Mail2 обладает отличным пользовательским интерфейсом, прост в настройке и недорог. Он может работать как в ЛВС, так и по коммутируемым линиям. Он может рекомендоваться всем категориям пользователей сети. Лучшим почтовым пакетом для операционной среды MS-Windows можно считать пакет DMail for Windows, разработанный фирмой Демос (Россия). Пакет DMail может быть рекомендован к использованию тем абонентам, которые нуждаются в электронной почте и привыкли работать в среде Windows. Лучшим пакетом для наиболее полного использования информационных ресурсов сети Internet является пакет Mosaic, разработанный NCSA (National Centre of Supercomputing Applications) CША. Mosaic - наиболее мощный инструмент для путешествия по сети Internet. С помощью Mosaic пользователи могут получать доступ к гипертекстовым библиотекам WWW, к обычным базам данных сети Internet и системам поиска информации в них. В ходе дипломного пректирования для пакетов Minuet, Mail2 и были разработаны инструкции по установке и эксплуатации данных пакетов абонентского программного обеспечения. Пакеты Chameleon и Dmail продаются вместе с полным комплектом фирменной документации, пакет Mosaic распространяется свободно вместе с довольно полной документацией.
www.ronl.ru
1. Глобальная международная компьютерная сеть Internet стр. 2
1.1. Типы подключения. стр. 2
1.2. Доступ к информации. стр. 4
1.3. Программы просмотра. стр. 5
1.4. Типы сервисов в Internet. стр. 6
2. Поисковые системы в сети Internet стр. 10
2.1. Поиск информации в Internet. стр. 10
2.2. Работа с основными поисковыми системами. стр. 11
2.3. Поиск по рубрикам и тематическим разделам стр. 15
Список использованной литературы стр. 16
Международная сеть Internet. Internet - глобальная компьютерная сеть, охватывающая весь мир. Сегодня Internet имеет около 25 миллионов абонентов в более чем 175 странах мира. Ежемесячно размер сети увеличивается на 5-7%. Internet образует как бы ядро, обеспечивающее связь различных информационных сетей, принадлежащих различным учреждениям во всем мире, одна с другой. Доступ к Internet это доступ к громадному хранилищу информации. Свободный доступ к Internet позволяет использовать его в целях бизнеса, развлечения, образования и т.д. Internet, служившая когда-то исключительно исследовательским и учебным группам, чьи интересы простирались вплоть до доступа к суперкомпьютерам, становится все более популярной в деловом мире. Компании соблазняют быстрота, дешевая глобальная связь, удобство для проведения совместных работ, доступные программы, уникальная база данных сети Internet. Они рассматривают глобальную сеть как дополнение к своим собственным локальной сетям. При низкой стоимости услуг пользователи могут получить доступ к коммерческим и некоммерческим информационным службам России и многих стран мира. В архивах свободного доступа сети Internet можно найти информацию практически по всем сферам человеческой деятельности, начиная с новых научных открытий до телевизионных пограмм на завтра. Кроме того, Internet предоставляет уникальные возможности дешевой, надежной и конфиденциальной глобальной связи по всему миру. Это оказывается очень удобным для фирм имеющих свои филиалы по всему миру, транснациональных корпораций и структур управления. Кроме того Internet значительно увеличивает круг личных связей пользователя «всемирной паутины». Электронная почта - самая распространенная услуга сети Internet. В настоящее время свой адрес по электронной почте имеют приблизительно 75 миллионов человек. Посылка письма по электронной почте обходится значительно дешевле посылки обычного письма. Кроме того, сообщение, посланное по электронной почте дойдет до адресата за несколько часов, в то время как обычное письмо может добираться до адресата несколько дней, а то и недель. В настоящее время Internet испытывает период подъема, во многом благодаря активной поддержке со стороны государственных служб многих стран. Ежегодно в США выделяется около 5 миллиардов долларов на создание новой сетевой инфраструктуры. Исследования в области сетевых коммуникаций финансируются также практически всеми правительствами европейских стран. Однако, государственное финансирование - лишь небольшая часть поступающих средств, т.к. все большие средства в развитие Internet вкладывают коммерческие структуры .1.1.Типы подключения Для работы в Internet необходимо:* иметь необходимые для этого аппаратные средства – компьютер и модем* физически подключить компьютер к одному из узлов Всемирной сети;* получить IP-адрес на постоянной или временной основе;* установить и настроить программное обеспечение — программы-клиенты тех служб Internet, услугами которых предполагается пользоваться. Аппаратные средства должны соответствовать определенным требованиям. Практика показывает, что для эффективной работы в Internet компьютер как минимум должен иметь процессор 486 с тактовой частотой 100 МГц и 8 Мбайт оперативной памяти. Кроме того необходима видеокарта, поддерживающая как минимум 256 цветов. Для принятия и передачи данных необходим модем, имеющий скорость не менее 14,4 Кбит/с. Желательно иметь так же звуковую карту. Для более комфортной работы в Internet желательно иметь аппаратуру более высокого класса, чем описанная выше минимальная конфигурация. Как только будет приобретен компьютер и модем, можно подключаться к Internet с помощью поставщиков услуг Internet. Организации, предоставляющие возможность подключения к своему узлу и выделяющие IР-адреса, называются поставщиками услуг Internet (используется также термин сервис-провайдер). Они оказывают подобную услугу на договорной основе. Физическое подключение может быть выделенным или коммутируемым. Для выделенного соединения необходимо проложить новую или арендовать готовую физическую линию связи (кабельную, оптоволоконную, радиоканал, спутниковый канал). Такое подключение используют организации и предприятия, нуждающиеся в передаче больших объемов данных. От типа линии связи зависит ее пропускная способность (измеряется в единицах бит в секунду). В настоящее время пропускная способность мощных линий связи (оптоволоконных и спутниковых) составляет сотни мегабит в секунду (Мбит/с). В противоположность выделенному соединению коммутируемое соединение — временное. Оно не требует специальной линии связи и может быть осуществлено, например, по телефонной линии. Коммутацию (подключение) выполняет автоматическая телефонная станция (АТС) по сигналам, выданным в момент набора телефонного номера. Для телефонных линий связи характерна низкая пропускная способность. В зависимости от того, какое оборудование использовано на станциях АТС по пути следования сигнала, различают аналоговые и цифровые телефонные линии. Основную часть телефонных линий в городах России составляют устаревшие аналоговые линии. Их предельная пропускная способность немногим более 30 Кбит/с (одна-две страницы текста в секунду или одна-две фотографии стандартного размера в минуту). Пропускная способность цифровых телефонных линий составляет 60-120 Кбит/с, то есть в 2-4 раза выше. По аналоговым телефонным линиям связи можно передавать и видеоинформацию (что используется в видеоконференциях), но размер окна. в котором отображаются видеоданные, обычно невелик (порядка 150xl50 точек) и частота смены кадров мала для получения качественного видеоряда (1-2 кадра в секунду). Для сравнений: в обычном телевидении частота кадров — 25 кадров в секунду. Телефонные линии связи никогда не предназначались для передачи цифровых сигналов - их характеристики подходят только для передачи голоса, причем в достаточно узком диапазоне частот – 300 - 3000 Гц. Поэтому для передачи цифровой информации несущие сигналы звуковой частоты модулируют по амплитуде, фазе и частоте. Такое преобразование выполняет специальное устройство - модем (название образовано от слов модулятор и демодулятор). Еще одной технологией подключения является кабельный модем. С помощью его можно подключится к Internet через компанию кабельного телевидения по волоконно-оптическим линиям. Также одним из последних достижений подключения является подключение с помощью спутниковой антенны. Здесь существует два способа: более дешевый, когда прием информации осуществляется с помощью тарелки спутникового телевидения, а передача осуществляется обычным способом по телефонной линии, и более дорогой, когда и прием и передача информации осуществляется с помощью тарелки спутниковой связи. Оба последних способа подключения очень дороги и их могут себе позволить только богатые организации, нуждающиеся в обработке большого количества информации. После подключения вашей телефонной или иной связи к серверу провайдера необходимо настроить ваш модем и его программное обеспечение на работу в сети. По способу подключения различают внешние и внутренние модемы. Внешние модемы подключают к разъему последовательного порта, выведенному на заднюю стенку системного блока. Внутренние модемы устанавливают в один из разъемов расширения материнской платы. Как и другие устройства компьютера, модем требует не только аппаратной, но и программной установки. В операционной системе Windows 98 ее можно выполнить стандартными средствами установки оборудования или специальным средством установки модемов. После установки драйвера модема производится подключение компьютера к провайдеру. Для подключения к компьютеру поставщика услуг Internet надо правильно настроить программу Удаленный доступ к сети. При настройке программы необходимы данные, которые должен сообщить поставщик услуг:* номер телефона, по которому производится соединение;* имя пользователя;* пароль;* IР-адрес сервера. Этих данных достаточно для подключения к Internetу. Итак, для подключения к Internet одним из способов является программа Мастер подключения к Internet. Запускаем его и в процессе установки отвечаем на задаваемые вопросы.* устанавливаем способ подключения С помощью телефонной линии;* в окне Выбор модема устанавливаем тип модема;* в поле Сведения о подключении для учетной записи вводим телефонный номер поставщика услуг;* в поле Код страны вводим 7* в поле Сведения о входе в сеть для учетной записи вводим имя и пароль пользователя;* в окне Настройка компьютера вводим имя соединения* далее вводим адрес, серверы, имя и пароль электронной почты;* щелкаем на кнопке Готово и подключение закончено. После наладки подключение устанавливаем связь с Internet и можем работать. 1.2. Доступ к информации В Internet имеется огромное количество информации к которой имея определенное программное обеспечение (броузеры, программы скачки информации, программы электронной почты и т.д.) можно получить неограниченный доступ. Однако, зачастую возникает необходимость ограничить доступ некоторым пользователям к определенной информации. Например: ограничить доступ детей с сайтам содержащим информацию по тематикам: насилие, порнография и т.д. Всегда можно создать ограничение доступа к сайтам с нежелательной тематикой. Кроме того, можно создавать собственные списки сайтов, которые можно смотреть всегда, или же нельзя смотреть никогда. Чтобы установить ограничения при просмотре сайтов с помощью Internet Explorer 5.0 необходимо выполнить следующие действия.* выбрать Свойства обозревателя * в окне Свойства: Интернет выбрать вкладку Содержание * в группе Ограничение доступа нажать кнопку Включить * ввести пароль доступа* в окне Ограничение доступа выбрать вкладку оценки * по тем категориям, по которым необходимо установить ограничение доступа, хадать необходимый уровень ограничения. Вкладка Разрешенные узлы позволяет задавать Web-страницы, с которыми никогда нельзя работать или, наоборот можно работать всегда. Для этого необходимо * выйти на вкладку Разрешенные узлы * ввести Web-адрес сайта* щелкнуть на кнопке Всегда или Никогда* щелкнуть ОК Доступ к определенным телеконференциям, «комнатам для бесед» и Web-страницам можно ограничить так же с помощью других программ.Например, с помощью программ блокираторов:* Cyber Patrol ( фирмы Cyber Senty)* SurfWatch (фирмы Spyglass)* Net nanny (фирмы Net Nanny Software International) Каждая из этих программ ограничивает доступ примерно одними и теми же методами. Можно создать список паролей или типов страниц, после чего при попытке проникнуть на запрещенный участок, доступ к нему будет заблокирован.1.3. Программы просмотра. Документы Internet предназначены для отображения в электронном виде, причем автор документа не знает возможностей компьютера, на котором будут просматриваться документы. Поэтому был создан стандарт для описания и создания документов, расположенных на Web-страницах. Этот язык называется HTML (HyperText Markup Language – язык разметки гипертекста). Этот язык описывает логическую структуру документа, управляет форматированием текста и размещением вставных объектов. Форматирование и отображение документа, описанного с помощью HTML, на конкретном компьютере производится специальной программой – броузером. Проще говоря, броузер предназначен для просмотра содержимого Web-страниц. Основные функции броузеров следующие: * установка связи с Web-серевером , на котором хранится документ, и загрузка всех его компонентов;* интерпретация тегов языка HTML, форматирование и отображение Web-страниц в соответствии с возможностями компьютера, на котором броузер работает; * предоставление средств для отображения мультимедийных и других объектов входящих в состав Web-страниц, а так же механизма расширения, позволяющего настраивать программу на работу с новыми типами объектов;* обеспечение автоматизации поиска Web-страниц и упрощение доступа к страницам, посещавшимся раньше;* предоставление доступа к встроенным или автономным средствам для работы с другими службами Internet. В настоящее время наиболее распространенными в мире являются два броузера: Navigator навигатор фирмы Netscape и Internet Explorer фирмы Microsoft. Они предоставляют пользователям весьма схожий интерфейс и набор основных возможностей и ведут на этом рынке весьма жёсткую конкурентную борьбу, постоянно обновляя предыдущие версии. Ниже приводиться описание основных возможностей этих броузеров. Броузер Internet Explorer входит в состав пакета программ Internet Explorer 5.0 . Она обеспечивает работу с WWW, предоставляет идентичные средства работы с локальными папками компьютера и файловыми архивами FTP, дает доступ к средствам связи с Internet. Для запуска программы можно использовать значок Internet Explorer на Рабочем столе или Главного меню. Кроме того программа запускается автоматически при попытке открыть документ Internet или локальный документ в формате HTML. Если соединение с Internet отсутствует, то после запуска программы появиться диалоговое окно установки соединения. При невозможности установки соединения сохраняется возможность просмотра в автономном режиме ранее загруженных Web-документов. При наличии соединения после запуска программы на экране появится основная страница, выбранная при настройке программы. Далее можно работать с Web-страницами, просматривая их содержимое, сохраняя его на локальном диске и т.д. При этом можно открывать несколько окон, работая с несколькими Web-страницами. Для более эффективной работы в Internet необходима настройка Internet Explorer . Параметры оптимальной настройки зависят от * свойств видеосистемы компьютера;* производительности действующего соединения с Internet;* содержания текущего Web-документа;* личных предпочтений пользователя. Настроить Internet Explorer можно как из самой программы (Сервис->Свойства обозревателя), так и через Панель управления (значок Свойства обозревателя). Если броузер неспособен отображать файлы определенного типа (*.exe, *.zip и т.д.) инициируется процесс загрузки данного файла на компьютер. Программа Internet Explorer 5.0 запускает мастер загрузки файлов, на первом этапе работы которого требуется указать открывать ли файл или сохранить его на локальном диске. Чаще всего файл сохраняется. Это позволит использовать его в дальнейшей работе, не выходя в Internet. Этот процесс называется проще – скачать файл. Netscape Navigator – один из лучших Web-броузеров, главная программа пакета Netscape Communicator. С его помощью можно просматривать содержимое Web-страниц, копировать файлы, искать различного рода информацию, работать с текстом и мультимедийными файлами Internet. Оба броузера имеют свои преимущества и недостатки. Например:* Internet Explorer поставляется бесплатно в составе программного обеспечения фирмы Microsoft;* Internet Explorer имеет более широкие возможности при настройке на конкретные вкусы потребителя и большее количество выполняемых функций;* Netscape Navigator – имеет большую скорость при работе с Web-страницами. Но в принципе, оба броузера выполняют похожие задачи и полностью удовлетворяют запросы пользователей при работе с Internet. 1.4. Типы сервисов в Internet. Разные пользователи Internet нуждаются в разных услугах Internet. Поэтому для них было создано большое количество всевозможных служб, предназначенных для удовлетворения самых разнообразных запросов потребителей услуг Internet. В зависимости от конкретных целей и задач клиенты Internet используют те службы, которые им необходимы. Разные службы имеют разные протоколы. Они называются прикладными протоколами. Их соблюдение обеспечивается и поддерживается работой специальных программ. Таким образом, чтобы воспользоваться какой-то из служб Internet необходимо установить на компьютере программу, способную работать по протоколу данной службы. Такие программы называют клиентскими или просто клиентами. Так, например, для передачи файлов в Internet используется специальный прикладной протокол FTP (File Transfer Protocol). Соответственно, чтобы получить из Internet файл, необходимо:* иметь на компьютере программу, являющуюся клиентом FTP {FTP-клиент):* установить связь с сервером, предоставляющим услуги FTP (FTP-сервером) Другой пример: чтобы воспользоваться электронной почтой, необходимо соблюсти протоколы отправки и получения сообщений. Для этого надо иметь программу «почтовый клиент» и установить связь с почтовым сервером. Так же обстоит дело и с другими службами. Ниже будут перечислены наиболее распространенные службы Internet и их основные характеристики. Терминальный режим. Исторически одной из ранних является служба удаленного управления компьютером Telnet. Подключившись к удаленному компьютеру по протоколу этой службы, можно управлять его работой. Такое управление еще называют консольным или терминальным. В прошлом эту службу широко использовали для проведения сложных математических расчетов на удаленных вычислительных центрах. Так, например, если для очень сложных вычислений на персональном компьютере требовались недели непрерывной работы, а на удаленной супер-ЭВМ всего несколько минут, то персональный компьютер применяли для удаленного ввода данных в ЭВМ и для приема полученных результатов. В наши дни в связи с быстрым увеличением мощности персональных компьютеров необходимость в подобной услуге сократилась, но, тем не менее, службы Telnet в Internet продолжают существовать. Часто протоколы Telnet применяют для дистанционного управления техническими объектами, например телескопами, видеокамерами, промышленными роботами. Простейший клиент Telnet входит в состав операционной системы Windows 98 - telnet. Электронная почта (E-Mail). Эта служба также является одной из наиболее ранних. Ее обеспечением в Internet занимаются специальные почтовые серверы. Почтовые серверы получают сообщения от клиентов и пересылают их по цепочке к почтовым серверам адресатов, где эти сообщения накапливаются. При установлении соединения между адресатом и его почтовым сервером происходит автоматическая передача поступивших сообщений на компьютер адресата. Почтовая служба основана на двух прикладных протоколах: SMTP и РОРЗ. По первому происходит отправка корреспонденции с компьютера на сервер, а по второму — прием поступивших сообщений. Существует большое разнообразие клиентских почтовых программ. К ним относится, например, программа Microsoft Outlook Express, входящая в состав операционной системы Windows 98 как стандартная. Более мощная программа, интегрирующая в себе кроме поддержки электронной почты и другие средства делопроизводства, Microsoft Outlook 2000. входит в состав известного пакета Microsoft Office 2000. Из специализированных почтовых программ популярны программы The Bat! и Eudora Pro. Списки рассылки (Mail list). Обычная электронная почта предполагает наличие двух партнеров по переписке. Если же партнеров нет, то достаточно большой поток почтовой информации в свой адрес можно обеспечить, подписавшись на списки рассылки. Это специальные тематические серверы, собирающие информацию по определенным темам и переправляющие ее подписчикам в виде сообщений электронной почты. Темами списков рассылки может быть что угодно, например вопросы, связанные с изучением иностранных языков, научно-технические обзоры, презентация новых программных и аппаратных средств вычислительной техники и т.д. Большинство телекомпаний создают списки рассылки на своих узлах, через которые рассылают клиентам аннотированные обзоры телепрограмм. Списки рассылки позволяют эффективно решать вопросы регулярной доставки данных. Служба телеконференций (Usenet). Служба телеконференций похожа на циркулярную рассылку электронной почты, в ходе которой одно сообщение отправляется не одному корреспонденту, а большой группе (такие группы называются телеконференциями или группами новостей). Обычное сообщение электронной почты пересылается по узкой цепочке серверов от отправителя к получателю. При этом не предполагается его хранение на промежуточных серверах. Сообщения, направленные на сервер группы новостей, отправляются с него на все серверы, с которыми он связан, если на них данного сообщения еще нет. Далее процесс повторяется. На каждом из серверов поступившее сообщение хранится ограниченное время (обычно неделю), и все желающие могут в течение этого времени с ним ознакомиться. Распространяясь во все стороны, менее чем за сутки сообщения охватывают весь земной шар. Далее распространение затухает, поскольку на сервер, который уже имеет данное сообщение, повторная передача производиться не может. Ежедневно в мире создается порядка миллиона сообщений для групп новостей. Выбрать в этом массиве действительно полезную информацию практически невозможно. Поэтому вся система телеконференций разбита на тематические группы. Сегодня в мире насчитывают порядка 50000 тематических групп новостей. Они охватывают большинство тем, интересующих людей. Особой популярностью пользуются группы, посвященные вычислительной технике. Основной прием использования групп новостей состоит в том, чтобы задать вопрос, обращаясь ко всему миру, и получить ответ или совет от тех, кто с этим вопросом уже разобрался. При этом важно следить за тем, чтобы содержание вопроса соответствовало теме данной телеконференции. Многие квалифицированные специалисты мира регулярно просматривают сообщения телеконференций, проходящие в группах, касающихся их сферы деятельности. Такой просмотр называется мониторингом информации. Регулярный мониторинг позволяет специалистам точно знать, что нового происходит в мире по их специальности, какие проблемы беспокоят большие массы людей и на что надо обратить особое внимание в своей работе. При отправке сообщений в телеконференции принято указывать свой адрес электронной почты для обратной связи. Огромный объем сообщений в группах новостей значительно затрудняет их целенаправленный мониторинг, поэтому в некоторых группах производится предварительный «отсев» бесполезной информации (в частности, рекламной), не относящейся к теме конференции. Такие конференции называют модерируемыми. В качестве модератора может выступать не только человек, но и программа, фильтрующая сообщения по определенным ключевым словам. В последнем случае говорят об автоматической модерации. Для работы со службой телеконференций существуют специальные клиентские программы. Так, например, приложение Microsoft Outlook Express, позволяет работать также и со службой телеконференций. Для начала работы надо настроить программу на взаимодействие с сервером групп новостей, оформить «подписку» на определенные группы и периодически, как и электронную почту, получать все сообщения, проходящие по теме этой группы. В данном случае слово «подписка» не предполагает со стороны клиента никаких обязательств или платежей — это просто указание серверу о том, что сообщения по указанным темам надо доставлять, а по прочим — нет. Отменить подписку или изменить ее состав можно в любой удобный момент. Служба World Wide Web (WWW). Безусловно, это самая популярная служба современного Internet. WWW — это единое информационное пространство, состоящее из сотен миллионов взаимосвязанных электронных документов, хранящихся на Web-серверах. Отдельные документы, составляющие пространство Web, называют Web-страницами. Группы тематически объединенных Web-страниц называют Web-узлами (жаргонный термин — Web-сайт или просто сайт). Один физический Web-сервер может содержать достаточно много Web-узлов, каждому из которых, как правило, отводится отдельный каталог на жестком диске сервера. От обычных текстовых документов Web-страницы отличаются тем, что они оформлены без привязки к конкретному носителю. Например, оформление документа, напечатанного на бумаге, привязано к параметрам печатного листа, который имеет определенную ширину, высоту и размеры полей. Электронные Web-документы предназначены для просмотра на экране компьютера, причем заранее не известно на каком. Неизвестны ни размеры экрана, ни параметры цветового и графического разрешения, неизвестна даже операционная система, с которой работает компьютер клиента. Поэтому Web-документы не могут иметь «жесткого» форматирования. Оформление выполняется непосредственно во время их воспроизведения на компьютере клиента и происходит оно в соответствии с настройками программы, выполняющей просмотр. Программы для просмотра Web-страниц называют броузерами или обозревателями. Свойства и назначение броузеров были описаны выше. Произвольное перемещение между документами в Web-пространстве называют Web-серфингом (выполняется с целью ознакомительного просмотра). Целенаправленное перемещение между Web-документами называют Web-навигацией (выполняется с целью поиска нужной информации). Гипертекстовая связь между сотнями миллионов документов, хранящихся на физических серверах Internet, является основой существования логического пространства World Wide Web. Однако такая связь не могла бы существовать, если бы каждый документ в этом пространстве не обладал своим уникальным адресом. Каждый файл одного локального компьютера обладает уникальным именем, в которое входит собственное имя файла и путь доступа к файлу, начиная от имени устройства, на котором он хранится. Адрес любого файла во всемирном масштабе определяется унифицированным указателем ресурса -URL. Служба имен доменов (DNS). Адрес любого компьютера или любой локальной сети в Internet может быть выражен четырьмя байтами, например так:195.29.135.98Но так же, каждый компьютер имеет уникальное доменное имя, например: www.belgtts.ru Это две разных формы записи адреса одного и того же сетевого компьютера. Человеку неудобно работать с числовым представлением IР-адреса, зато доменное имя запоминается легко, особенно если учесть, что, как правило, это имя имеет содержание. Например, Web-сервер компании Microsoft имеет имя www.microsoft.com, а Web-сервер содержащий рефераты имеет имя www.referat.ru (суффикс .ru в конце имени говорит о том, что сервер компании принадлежит российскому сектору Internet). С другой стороны, автоматическая работа серверов сети организована с использованием четырехзначного числового адреса. Благодаря ему промежуточные серверы могут осуществлять передачу запросов и ответов в нужном направлении, не зная, где конкретно находятся отправитель и получатель. Поэтому необходим перевод доменных имен в связанные с ними IР-адреса. Этим и занимаются серверы службы имен доменов DNS. Служба передачи файлов (FTP). Прием и передача файлов составляют значительный процент от прочих Internet-услуг. Необходимость в передаче файлов возникает, например, при приеме файлов программ, при пересылке крупных документов (например, книг), а также при передаче архивных файлов, в которых запакованы большие объемы информации. Служба FTP имеет свои серверы в мировой сети, на которых хранятся архивы данных. Со стороны клиента для работы с серверами FTP может быть установлено специальное программное обеспечение, хотя в большинстве случаев броузеры WWW обладают встроенными возможностями для работы и по протоколу FTP. Протокол FTP работает одновременно с двумя TCP-соединениями между сервером и клиентом. По одному соединению идет передача данных, а второе соединение используется как управляющее. Протокол FTP также предоставляет серверу средства для идентификации обратившегося клиента. Этим часто пользуются коммерческие серверы и серверы ограниченного доступа, поставляющие информацию только зарегистрированным клиентам, — они выдают запрос на ввод имени пользователя и связанного с ним пароля. Однако существуют и десятки тысяч FTP-серверов с анонимным доступом для всех желающих. В этом случае в качестве имени пользователя надо ввести слово: anonymous, а в качестве пароля задать адрес электронной почты. В большинстве случаев программы-клиенты FTP делают это автоматически. IRC. Служба IRC (Internet Relay Chat) предназначена для прямого общения нескольких человек в режиме реального времени. Иногда службу IRC называют чат-конференциями или просто чатом. В отличие от системы телеконференций, в которой общение между участниками обсуждения темы открыто всему миру, в системе IRC общение происходит только в пределах одного канала, в работе которого принимают участие обычно лишь несколько человек. Каждый пользователь может создать собственный канал и пригласить в него участников «беседы» или присоединиться к одному из открытых в данный момент каналов. Существует несколько популярных клиентских программ для работы с серверами и сетями, поддерживающими сервис IRC. Одна из наиболее популярных — программа mIRC. ICQ. Эта служба предназначена для поиска сетевого IP-адреса человека, подключенного в данный момент к Internet. Необходимость в подобной услуге связана с тем, что большинство пользователей не имеют постоянного IP-адреса. Название службы является сокращением выражения I seek you — я тебя ищу. Для пользования этой службой надо зарегистрироваться на ее центральном сервере (http://www.icq.com) и получить персональный идентификационный номер UIN(Universal Internet Number). Данный номер можно сообщить партнерам по контактам, и тогда служба ICQ, приобретает характер Internet-пейджера. Зная номер UIN партнера, но не зная его текущий IР-адрес, можно через центральный сервер службы отправить ему сообщение с предложением установить соединение. Как было указано выше, каждый компьютер, подключенный к Internet, должен иметь четырехзначный IР-адрес. Этот адрес может быть постоянным или динамически временным. Те компьютеры, которые включены в Интернет на постоянной основе, имеют постоянные IР-адреса. Большинство же пользователей подключаются к Internet лишь на время сеанса. Им выдается динамический IР-адрес, действующий только в течение данного сеанса. Этот адрес выдает тот сервер, через который происходит подключение. В разных сеансах динамический IР-адрес может быть различным, причем заранее неизвестно каким. При каждом подключении к Internet программа ICQ, установленная на нашем компьютере, определяет текущий IP-адрес и сообщает его центральной службе, которая, в свою очередь, оповещает партнеров по контактам. Далее партнеры (если они тоже являются клиентами данной службы) могут установить с нами прямую связь. Программа предоставляет возможность выбора режима связи («готов к контакту»; «прошу не беспокоить, но готов принять срочное сообщение»,«закрыт для контакта» и т. п.). После установления контакта связь происходит в режиме аналогичном сервису IRC. 2. Поисковые системы в сети Internet2.1. Поиск информации в Internet. Основная задача Internet – предоставление необходимой информации. Чтобы найти нужную информацию необходимо знать адрес Web-страницы, на которой эта информация находится. Лучше всего искать в Сети необходимую информацию с помощью поисковых систем. Поисковая система представляет собой специализированный Web-узел. Поисковые системы классифицируют по методам поиска. Поисковые каталоги предназначены для поиска по темам. Обычно они построены по иерархическому принципу, т.е. каждый шаг поиска это выбор подраздела с более конкретной тематикой искомой информации. На нижнем уровне поиска пользователь получает относительно небольшой список ссылок на искомую информацию. Поисковый индекс обеспечивает поиск по заданным ключевым словам. Обычно ключевые слова вводятся при заполнении специальной формы поиска, после чего нажимается кнопка Поиск. В результате поиска формируется набор гиперссылок на Web-страницы, содержащий указанные термины. Обычно поисковые индексы выдают огромное количество искомых страниц. В этом списке представлены ссылки на различные Web-страницы, причем ссылки располагаются по степени убывания встреченных на данных страницах слов, совпадающих с ключевыми словами. При просмотре списка необходимо выбрать те страницы, которые нужно просмотреть. Некоторые системы составляют список ссылок по степени свежести страниц, другие же - по степени вероятности того, что данные страницы окажутся искомыми. Вычисление вероятности основывается на данных о том, как скоро на странице встречается искомое слово. Первыми в таком списке идут ссылки на те страницы, у которых ключевые слова встречаются уже в названии. Поисковые каталоги предоставляют доступ к меньшему количеству страниц, чем поисковые индексы, но они точнее указывают на основные ресурсы Сети. Поэтому при первичном поиске информации целесообразно использовать поисковые каталоги. А квалифицированным пользователям Internet более полезны поисковые индексы. Они позволяют разыскать малоизвестные и узкоспециализированные ресурсы. Многие современные поисковые системы сочетают в себе оба указанных метода. Программа Internet Explorer 5.0 имеет специальные средства организации поиска без явного обращения к поисковым системам. Можно получить доступ к одной из известных поисковых систем, просто щелкнув на кнопке Поиск броузер Internet Explorer. Если в Internet Explorer щелкнуть по кнопке Поиск, слева появится окно поиска. Далее можно набрать ключевые слова для поиска и выбрать поисковую систему. Результаты поиска будут отражены в правой части окна обозревателя. Если выбрать нужную ссылку, то в правом окне появится содержимое выбранной страницы. Чтобы скрыть окно поиска, необходимо щелкнуть на кнопке Поиск еще раз. При работе с Internet Ехр1orer можно проводить поиск прямо в поле Адрес. Для этого в адресную строку вводиться слово или фраза для поиска. Под адресной строкой откроется окно со словом Поиск: и искомой фразой. Internet Explorer начнет поиск с использованием заранее определенной системы поиска; при этом кнопка Поиск на панели инструментов нажмется сама. Можно осуществить поиск нажав кнопку Пуск и выбрав опцию меню Найти, а затем в Интернете. Окно Internet Explorer откроется само с уже нажатой кнопкой Поиск. Если удалось найти то, что искали, но все же не совсем то, то в этом случае пригодится механизм связанных ссылок. Для любой Web-страницы можно просмотреть список ссылок, имеющих к ней отношение, возможно, среди них окажется как раз то, что нужно. Чтобы просмотреть связанные ссылки, нужно сделать следующее. Необходимо выбрать в меню Сервис команду Показать связанные ссылки. После этого на панели инструментов нажать кнопку Поиск, и в левой части экрана полнится окно, содержащее список ссылок, связанных с данной страницей. Нужно щелкнуть на одной из ссылок, и просмотреть в правом окне соответствующую Web-страницу. Чтобы скрыть окно поиска, необходимо щелкнуть еще раз на кнопке Поиск.2.2. Работа с основными поисковыми системами. Существует огромное количество поисковых систем. Ниже приведено описание наиболее известных и популярных во всем мире систем поиска. Lycos. В Lycos используется следующий механизм индексации: * слова в заголовке имеют высший приоритет; * слова в начале страницы; * слова в ссылках; * если в его базе индекса есть сайты, ссылка с которых указывает на индексируемый документ - релевантность этого документа возрастает. Как и большинство систем, Lycos дает возможность применять простой запрос и более изощренный метод поиска. В простом запросе в качестве поискового критерия вводится предложение на естественном языке, после чего Lycos производит нормализацию запроса, удаляя из него так называемые stop-слова, и только после этого приступает к его выполнению. Почти сразу выдается информация о количестве документов на каждое слово, а позже и список ссылок на формально релевантные документы. В списке против каждого документа указывается его мера близости запросу, количество слов из запроса, попавших в документ, и оценочная мера близости, которая может быть больше или меньше формально вычисленной. Пока нельзя вводить логические операторы в строке вместе с терминами, но использовать логику через систему меню Lycos позволяет. Такая возможность применяется для построения расширенной формы запроса, предназначенной для искушенных пользователей, уже научившихся работать с этим механизмом. Таким образом, видно, что Lycos относится к системе с языком запросов типа "Like this", но намечается его расширение и на другие способы организации поисковых предписаний. AltaVista. Индексирование в этой системе осуществляется при помощи робота. При этом робот имеет следующие приоритеты: * слова содержащиеся в теге имеют высший приоритет; ключевые фразы в тэгах; * ключевые фразы, находящиеся в начале странички; * ключевые фразы в ALT - ссылках * ключевые фразы по количеству вхождений\присутствия слов\фраз; Если тэгов на странице нет, использует первые 30 слов, которые индексирует и показывает вместо описания (tag description) Наиболее интересная возможность AltaVista - это расширенный поиск. Здесь стоит сразу оговориться, что, в отличие от многих других систем AltaVista поддерживает одноместный оператор NOT. Кроме этого, имеется еще и оператор NEAR, который реализует возможность контекстного поиска, когда термины должны располагаться рядом в тексте документа. AltaVista разрешает поиск по ключевым фразам, при этом она имеет довольно большой фразеологический словарь. Кроме всего прочего, при поиске в AltaVista можно задать имя поля, где должно встретиться слово: гипертекстовая ссылка, applet, название образа, заголовок и ряд других полей. К сожалению, подробно процедура ранжирования в документации по системе не описана, но видно, что ранжирование применяется как при простом поиске, так и при расширенном запросе. Реально эту систему можно отнести к системе с расширенным булевым поиском. Yahoo. Данная система появилась в Сети одной из первых, и сегодня Yahoo сотрудничает со многими производителями средств информационного поиска, а на различных ее серверах используется различное программное обеспечение. Язык Yahoo достаточно прост: все слова следует вводить через пробел, они соединяются связкой AND либо OR. При выдаче не указывается степень соответствия документа запросу, а только подчеркиваются слова из запроса, которые встретились в документе. При этом не производится нормализация лексики и не проводится анализ на "общие" слова. Хорошие результаты поиска получаются только тогда, когда пользователь знает, что в базе данных Yahoo информация есть наверняка. Ранжирование производится по числу терминов запроса в документе. Yahoo относится к классу простых традиционных систем с ограниченными возможностями поиска. OpenText. Информационная система OpenText представляет собой самый коммерциализированный информационный продукт в Сети. Все описания больше похожи на рекламу, чем на информативное руководство по работе. Система позволяет провести поиск с использованием логических коннекторов, однако размер запроса ограничен тремя терминами или фразами. В данном случае речь идет о расширенном поиске. При выдаче результатов сообщается степень соответствия документа запросу и размер документа. Система позволяет также улучшить результаты поиска в стиле традиционного булевого поиска. OpenText можно было бы отнести к разряду традиционных информационно-поисковых систем, если бы не механизм ранжирования. Infoseek. В этой системе индекс создает робот, но он индексирует не весь сайт, а только указанную страницу. При этом робот имеет такие приоритеты: * слова в заголовке имеют наивысший приоритет; * слова в теге keywords, description и частота вхождений\повторений в самом тексте; * при повторении одинаковых слов рядом выбрасывает из индекса * Допускает до 1024 символов для тега keywords, 200 символов для тэга description; * Если тэги не использовались, индексирует первые 200 слов на странице и использует как описание; Система Infoseek обладает довольно развитым информационно-поисковым языком, позволяющим не просто указывать, какие термины должны встречаться в документах, но и своеобразно взвешивать их. Достигается это при помощи специальных знаков "+" - термин обязан быть в документе, и "-" - термин должен отсутствовать в документе. Кроме этого, Infoseek позволяет проводить то, что называется контекстным поиском. Это значит, что используя специальную форму запроса, можно потребовать последовательной совместной встречаемости слов. Также можно указать, что некоторые слова должны совместно встречаться не только в одном документе, а даже в отдельном параграфе или заголовке. Имеется возможность указания ключевых фраз, представляющих собой единое целое, вплоть до порядка слов. Ранжирование при выдаче осуществляется по числу терминов запроса в документе, по числу фраз запроса за вычетом общих слов. Все эти факторы используются как вложенные процедуры. Подводя краткое резюме, можно сказать, что Infoseek относится к традиционным системам с элементом взвешивания терминов при поиске. WAIS. WAIS является одной из наиболее изощренных поисковых систем Internet. В ней не реализованы лишь поиск по нечетким множествам и вероятностный поиск. В отличие от многих поисковых машин, система позволяет строить не только вложенные булевые запросы, считать формальную релевантность по различным мерам близости, взвешивать термины запроса и документа, но и осуществлять коррекцию запроса по релевантности. Система также позволяет использовать усечения терминов, разбиение документов на поля и ведение распределенных индексов. Не случайно именно эта система была выбрана в качестве основной поисковой машины для реализации энциклопедии "Британика" на Internet. В России также создано большое количество поисковых систем. Ниже приведена таблица сравнительных характеристик по определенной тематике. Большинство поисковых серверов позволяет достаточно быстро найти список сайтов соответствующих запросам пользователя. Искать информацию по тематике достаточно просто. Нужно зайти на сайт, который использует данный способ поиска (например list.ru) и выбрать высший уровень поиска. Далее выбирая следующий подуровень и щелкнув мышью на его названии пользователь опускается все ниже и ниже. И наконец получает список сайтов, который соответствует запросу пользователя. Например: Пользователь желает найти на поисковом сервере List.ru сайты с информацией о российских рок-музыкантах. Для этого он должен подключиться к Internet и набрать в адресной стоке адрес www.list.ru На экране появится список рубрик для поиска. Пользователь выбирает рубрику «Культура/Искусство». На экране появляется список тематик соответствующих выбранной рубрике. Выбираем тему «Музыка». Далее из появившегося на экране списка подтем выбираем тематику «Современная музыка». Из следующего уровня мы выбираем рубрику «Рок музыка». И наконец на экране появляется среди прочих тематик название «Русский рок». Щелкнув мышью на гиперссылке «Русский рок» выходи на следующий уровень сужающий объем нашего поиска. Мы выбираем тему «Классический рок». И наконец получаем список групп сайты которых есть в списке поискового сервера list.ru. После этого выбираем название группы – например «Аквариум» и получаем список сайтов содержащих информацию о рок-группе «Аквариум». Далее выбираем сайт, который нас интересует, и просматриваем информацию на нем. Можно ускорить поиск необходимой информации, если заранее известно, что необходимо найти. Например, если известно, что ищется сайт группы «Аквариум», то можно использовать комбинированный поиск по тематике «Музыка» и ключевому слову «Аквариум». Таким образом, опытный пользователь Internet может найти практически любую информацию по интересующей его теме. Список использованной литературы1. М. Пайк. Internet . СПб., 1996.2. Пол Гилстер. Навигатор Internet. М., 19953. Энциклопедия Интернет, СПб, 20014. Информатика. Базовый курс. Учебник для ВУЗов, СПб, 2001.1
www.ronl.ru
-1- America Online также энергично вступила в бой. Уже имея опыт в области электронной почты и UseNet, она быстро начала осваивать рынок услуг World Wide Web. Новая гипертекстовая среда, логически связавшая между собой данные, часто расположенные на разных континентах, стала самой лучшей приманкой для новых пользователей Internet. Рост числа абонентов World Wide Web происходит быстрее, чем рост самой Internet. На сегодняшний день доступны около 30 тыс. Web-серверов, а число новых Web-страниц ежемесячно увеличивается на 20%. В дальнейшем темпы роста числа пользователей не собираются снижаться, это справедливо как для коммерческих сетей, так и для провайдеров предоставляющих доступ в режиме shell (доступ через оболочку UNIX). Производят впечатление и перемены в методах доступа. По мере возрастания интереса к использованию в сеансах Internet графического интерфейса, позволяющего оперировать выпадающим меню и мышью, провайдеры стали снижать цены на соединение, позволяющие использовать данные программы. Цены на подключение по SLIP (Serial Line Internet Protocol – межсетевой протокол последовательного канала) и PPP стали снижаться, и основная масса пользователей поняли, что возможность применения тех или иных инструментальных средств зависит от того, каким способом они подключены к сети. Сегодня оба метода доступа существуют в Internet « на равных », а программы с графическим интерфейсом становятся все более популярны. Краткая история Internet Поначалу ничто не предвещало, что Internet станет общедоступной компьютерной сетью. Как и многие другие великие идеи, “сеть из сетей” возникла из проекта, предназначавшегося совершенно для других целей: сеть была разработана в 1969 г. управлением ARPA (Advanced Research Projects Agency – управление перспективных исследований и разработок) при министерстве обороны США и называлась ARPANET. ARPANET объединяла учебные заведения, оборонные организации и их подрядчиков; она была создана в помощь исследователям для совместного использования информации. Первоначально основатели ARPANET позволяли ученым только запускать программы на удаленных компьютерах. Но сеть росла, и скоро к этим возможностям прибавились передача файлов, электронная почта и списки почтовой рассылки, позволявшие исследователям обмениваться информацией по различным темам. Но по мере роста ARPANET развивались и другие сети, и вскоре стала очевидной потребность в новых средствах их связи. Еще в 1973 г., в эпоху мэйнфреймов, за десятилетие до начала бурного внедрения персональных
-2-
компьютеров, агентство ARPA под своим новым названием DARPA (Defense Advanced Project Agency – управление перспективных исследований и разработок Министерства обороны США) начало осуществлять программу Internetting Project (проект объединения сетей). Его целью было освоить коммутацию пакетов двух сетей, подключенных к ARPANET; используя при этом радио- и спутниковую связь. Главной проблемой при этом было различие методов передачи данных, использовавшихся каждой сетью, и решена она была путем создания так называемых шлюзов, позволяющих информации беспрепятственно перемещаться из одной сети в другую. Возникновение Internet В 1983 г. Агентство связи Министерства обороны США приняло решение использовать протоколы TCP/IP на всех узловых машинах ARPANET. Таким образом, был установлен стандарт, благодаря которому смогла развиваться сеть Internet. С этого момента стало возможным подключать новые сети и устанавливать шлюзы, сохраняя неименным при этом основное ядро сети. Многие считают что реальная дата возникновения Internet – 1983 г., когда ARPANET была разделена на MILNET, предназначавшуюся для использования в военных целях, и ARPANET – для продолжения исследований в области сетей. Но еще в 1980 г. агентство DARPA разрешило подключить к APRANET сеть CSNET, соединяющую компьютеры научных учреждений нескольких штатов. В 1989 г. CSNET была преобразована в BITNET, а в июне 1990 г. ARPANET прекратило свое существование, и ее функции перешли к Internet, отличающейся более развитой структурой. На этом этапе был окончательно принят основной принцип развития Internet: объединение сетей на базе использования общей системы протоколов, и поддержание постоянно растущей мета сети, подключая через шлюзы новые сети. Этот принцип был детально разработан National Science Foundation (Национальным научным фондом), практически применившим ARPANET при создании своей сети. Структура Internet Для того чтобы понять, что же такое Internet обратимся к его определению в литературе. В своей книге The Matrix; Computer Networks and Conferencing Systems World Wide (Digital PRESS, 1990) Джон С. Квотерман (Jon S. Quarterman) описывает Internet как « интерсеть, состоящую из многих сетей, которые работают на базе протоколов семейства TCP/IP…, объединены через шлюзы и используют единое адресное пространство и пространство имен ». Итак, по определению Internet базируется на TCP/IP. А как же тогда насчет -3- сетей, функционирующих под управлением других протоколов, с которыми можно связаться через Internet? Научная сеть BITNET, многие ресурсы которой доступны через Internet, использует свои собственные протоколы. Аналогично обстоит дело и с UUCP, с которой началось UseNet. Несмотря на то, что UseNet не использует TCP/IP, в ее телеконференциях обычно участвуют абоненты Internet. Как быть с такими несоответствиями? Чтобы понять, с чем мы имеем дело и получать от этого пользу, рассмотрим подробнее то, что Квотерман вслед за писателем-фантастом Вильямом Гибсоном (William Gibson) называет Matrix. « « Matrix – всемирная метасеть, соединяющая компьютерные сети и системы средств проведения телеконференций. Она предлагает все те услуги, которые обычно вы получаете с помощью своих телефонов, почтовых отделений и библиотек, и, кроме того, такие возможности, о которых вы даже не мечтали раньше » (Квотерман). Что это за метасеть, описанная Квотерманом: может быть это Internet? Что мы подразумеваем под доступом к Internet и другим сетям, подключенным к ней через шлюзы? Рассмотрим на примере BITNET. Несмотря на то, что структура BITNET далеко не соответствует принципам построения Internet, нам не потребуется специальное подключение к этой сети: технология Internet обеспечивает доступ примерно к трем четвертям списков почтовой рассылки BITNET. Но это еще не все. Основная часть трафика BITNET направляется по соединениям, работающим на базе протоколов TCP/IP, что значительно увеличивает скорость передачи. Если проанализировать ресурсы отдельных сетей, то можно увидеть, что диапазон применяемых инструментальных средств чрезвычайно широк. В частности, для чтобы найти нужные данные в Internet, можно использовать различные средства, однако поиск баз данных с помощью, например WAIS (Wide Area Information Servers – служба поиска распределенной информации) очень отличается от поиска файлов с применением протоколов BITNET. Нельзя этому удивляться; это неизбежный результат разнообразия сетей, составляющих Internet. Наша технология еще недостаточно развита, чтобы объединить различные методы получения информации под одним интерфейсом, и вряд ли это произойдет быстро, однако понятие URL в World Wide Web – определенный шаг в этом направлении. Три главных применения Internet Нам не надо знать тонкости функционирования TCP/IP. Как увидим далее, работать с пользовательскими программами Internet совсем не трудно. Пользователи, работающие с электронными досками объявлений (BBC) и -4- коммерческими диалоговыми службами, привыкли получать от своих поставщиков определенный набор услуг; Internet предоставляет их по-своему через протоколы TCP/IP. Ниже рассмотрим, как Internet реализует эти основные функции. Электронная почта Электронная почта – наиболее простая и зачастую самая полезная. Многие пользователи Internet имеют дело исключительно с электронной почтой, и все равно считают ее бесценным ресурсом. Вы можете отправлять сообщения одному или нескольким людям, пересылать текстовые файлы, получать информацию от автоматизированных компьютерных программ и т.д. Несмотря на то, что никто не откажется иметь полный доступ к Internet, бывают случаи, когда для удовлетворения самых насущных информационных потребностей вполне хватает одной электронной почты. Не так давно шлюзы для электронной почты были единственной формой доступа к Internet, предоставлявшейся крупными коммерческими диалоговыми системами. В те дни многими овладела захватывающая идея: работать с Internet через электронную почту. Выполнение этой задачи позволило бы получать реальные сетевые услуги, включая работу с WAIS, Gopher и World Wide Web, не имея ничего, кроме почтового ящика. Но нельзя недооценивать электронную почту в своей простейшей форме; это средство для обмена сообщениями или использования списков почтовой рассылки для людей, интересующихся общей тематикой. Если использовать электронную почту ежедневно, переписываясь с людьми, живущими на соседней улице или другом полушарии, то через месяц или два вы будете удивлены, как же вы раньше так долго могли обходиться без нее. По иронии судьбы в начале существования ARPANET электронная почта считалась незначительным приложением к тем возможностям, которые предоставляла сеть. Никто не ожидал возникновения огромного потока информации, появившегося в тот период, когда ученые стали обмениваться своими идеями с территориально отделенными коллегами. Сегодня наличие электронной почты воспринимается как нечто само собой разумеющееся всеми – от небольших компаний с офисными сетями до гигантских корпораций, имеющих свои отделения по всему миру. Таким же стремительным был рост электронной почты в коммерческих сетях, многие абоненты которых пользуются только этой услугой. Передача файлов Перемещение файлов между компьютерами – одна из самых лучших возможностей, которые мы получили благодаря сетевой революции. Если вы
-5-
можете отыскать что-то полезное, и если это, как тысячи компьютерных файлов в Internet, - общедоступная информация, то вы можете скопировать это на ваш компьютер. Средство, благодаря которому стал возможен этот процесс, называется протоколом передачи файлов (file transfer protocol), или FTP. Доступ к общедоступным материалам осуществляется через процедуру под названием анонимный FTP. Эта процедура позволяет вам регистрироваться на удаленных компьютерах и использовать источники информации в каталогах, открытых для общего доступа администраторами систем. Поиск программ в Internet с помощью FTP – непростая задача. Вместо того чтобы запросить каталог всех файлов объединенной библиотеки, как это происходит в America Online, вы сталкиваетесь с тысячами компьютерных архивов, предлагающих программы и текстовые файлы. Чтобы легко находить информацию нужно использовать инструменты поиска. С их помощью мы сможем находить программы, затем с использованием FTP загружать их в собственный компьютер. Удаленный доступ Удаленный доступ иначе называемый Telnet, обеспечивает возможность подключаться к удаленному компьютеру и работать с ним в интерактивном режиме. И здесь Internet открывает двери во всемирную компьютерную среду со множеством компьютеров, предлагающих программы, базы данных и другие ресурсы, которые мы можем просматривать или использовать в работе. Используя Telnet, мы можем посещать библиотечные каталоги далеких университетов, искать информацию о чем угодно – от образования далеких галактик до рецептов картофельного супа, просматривать решения Верховного Суда или тексты популярных песен. Все это время удаленный компьютер будет откликаться на команды, а собственный компьютер работать как терминал. Во многих случаях системы на базе меню, установленные на удаленных машинах, делают интерактивный сеанс работы интуитивно понятным, но разные системы различаются между собой как внешним оформлением, так и удобством в работе. Как движутся данные – среда передачи Легко вообразить себе компьютерную сеть в таком виде, как мы могли бы увидеть ее в деловом учреждении: компьютеры соединены кабелями, передавая информацию туда и обратно, в то время как пользователи работают с клавиатурой. Однако соединения в Internet нельзя рассматривать только как сеть проводов или волоконно-оптических линий. Оцифрованные данные пересылаются через специальные аппаратные устройства, называемые маршрутизаторами, которые соединяют сети и с помощью сложных
-6-
алгоритмов выбирают наилучшие маршруты для сетевого трафика. Как движутся пакеты данных? Иногда они передаются по телефонным линиям: коммутируемым или выделенным, иногда по спутниковой связи. Информация может также передаваться посредством микроволновой радиопередачи, волоконно-оптических кабельных соединений и даже по так называемой пакетной радиосвязи. Рассмотрим каждую возможность. Коммутируемые линии Телефонная линия у вас дома – это коммутируемая линия; соединение производится, когда вы набрали номер, и обрывается, когда вы вешаете трубку. Между двумя сетями перед началом сеанса передачи данных также может быть установлено коммутируемое соединение, а по окончании этой передачи – разъединено. Снижающаяся стоимость междугородной и международной связи делает такой вариант возможным для тех, кто работает с небольшими локальными сетями. Можно позвонить на узел Internet и, используя только коммутируемые соединения, получить доступ к услугам Internet даже в режиме интерактивного IP-узла. Арендуемые линии Арендуемые линии работают по-другому. Они устанавливают постоянное соединение, которое всегда позволяет передать поток информации между узлами; арендуемые линии часто называют выделенными линиями. Выделенные линии, предназначенные для передачи цифровых данных, различаются по скорости – от 2,5 Кбит/с до 45 Мбит/с. Линия Т1 обеспечивает скорость передачи 1,544 Мбит/с. Линия связи Т3 работает намного быстрее, передавая данные со скоростью 45 Мбит/с, а технология ОСЗ поднимает этот уровень до 155 Мбит/с. Микроволновая связь Микроволновое оборудование позволяет соединять сети без проводов, переправляя данные с помощью передатчика на приемную антенну места назначения. Между двумя пунктами стоят репитеры (повторители), задача которых принять сигнал, усилить его и передать на следующую станцию. Предельное расстояние между станциями может меняться в зависимости от ландшафта, так как микроволновая связь действует в среде прямой видимости. Спутниковая связь Спутники, расположенные на геостационарных орбитах на высоте 22500 миль над Экватором, имеют преимущества при связи на сверхбольших расстояниях. Ретрансляторы на борту спутников получают сигналы от наземных и передают их обратно на Землю. В качестве приемной антенны
-7- используется терминал сверхмалой апертуры (VSAT – Very Small Apperture Terminal). Данные по радио Корпорация Radio Mail использует радиомодемы для соединения беспроводных сетей типа RAM Mobile Data или ARDIS, тем самым, позволяя нам, находясь в пути, работать с электронной почтой Internet. Кроме того, на сегодняшний день пейджеры корпорации SkyTel могут предоставить электронную почту Internet так же, как и AN&N Mail и MCI Mail. Notable Technologies предлагает пейджеры с Internet-адресом, дисплеем и средствами передачи электронной почты. Тем временем Microsoft и основанная SkyTel корпорация Mobile Telecommunication Technologies кооперируются для построения системы стоимостью 150 млн. долларов под названием Nation Wide Wireless Network (Общегосударственная Радиосеть), которая позволит посылать и получать сообщения с помощью пейджеров или небольших компьютеров, названных Personal Digital Assistants (Персональными Цифровыми Ассистентами). Управление Internet Управляет ли кто-нибудь Internet или она существует сама по себе? Если набросать самую примитивную схему, то в основе будет лежать базовая система сетей, называемая опорными. В США крупнейшей такой сетью является internetMCI, принадлежащая MCI. Commercial Internet Exchange объединяет мощную и растущую опорную сеть поставщиков коммерчиских услуг. Региональные сети среднего уровня присоединяют один или несколько штатов к высокоскоростной опорной сети. На местном уровне сети организаций подключены к региональным сетям, которые, в свою очередь, предоставляют им доступ к опорной сети. За пределами США можно отметить EBONE, панъевропейскую опорную IP-сеть, а также NORDUnet, DANTE и EUnet, обеспечивающие сетевые соединения по всей Европе. Каждая из этих сетей отвечает за трафик, который циркулирует внутри нее, и его распределение. Если, например, два компьютера расположенные в одном университете, хотят обменяться информацией, то трафик не должен выходить за пределы локальной сети. Тот же принцип применим и к региональным сетям. Если пользователь Internet хочет послать электронную почту кому-нибудь по адресу, соединенному той же региональной сетью, этот трафик будет оставаться внутри региональной сети, и не возникнет необходимости передавать его по опорной сети. Соответственно принцип управления состоит в том, что каждая сеть несет ответственность за соединения с сетью уровнем выше. Вернемся к примеру с
-8-
университетом и предположим, что факультет компьютерных наук решил получить доступ к Internet. При этом вовсе не обязательно добиваться получения нового статуса для локальной сети факультета. Для решения этого вопроса можно обратиться к одному из поставщиков услуг (провайдеру). Между тем сеть факультета остается автономной. Единственное, за что теперь отвечает факультет – передача информации об используемых компьютерах на вышестоящую сеть. За обмен информацией циркулирующей внутри локальной сети, по-прежнему отвечают системные администраторы. Кто платит за это? Любая сеть сама отвечает за свое финансирование, а также может устанавливать собственные административные процедуры. И это, более чем что-либо другое, стимулирует быстрый рост Internet. Рост Internet со скоростью 15% в месяц или 100% в год возможен только потому, что подключающиеся к Internet сети остаются под управлением своих собственных администраторов. Политики спорят о том, должен ли этот рост контролироваться, в то время как грандиозные успехи объединения сетей налицо. В связи с тем, что единственного поставщика сетевых услуг не существует, организации сами финансируют свои сети, каждая из которых считается частью Internet. Есть также и частные опорные сети, предлагающие доступ к Internet корпорациям и частным лицам на коммерческой основе. Многие региональные сети были созданы на средства Национального фонда США в расчете на то, что со временем они перейдут на самофинансирование. В результате возникло много сетей, принципы финансирования и управления которыми существенно различаются. Некоторые сети, например, разрешают передачу коммерческого трафика, в то время как другие его запрещают.
-9-
www.ronl.ru