Начальная

Windows Commander

Far
WinNavigator
Frigate
Norton Commander
WinNC
Dos Navigator
Servant Salamander
Turbo Browser

Winamp, Skins, Plugins
Необходимые Утилиты
Текстовые редакторы
Юмор

File managers and best utilites

Реферат: Что такое интернет? Что такое интернет реферат


Реферат - Что такое интернет?

МИНИСТЕРСТВО ОБЩЕГО И ПРОФЕССИОНАЛЬНОГО

ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

ДАЛЬНЕВОСТОЧНЫЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Кафедра информатики

Что такое интернет

Аспиранта второго

года обучения

Незнановой С. Ю.

03.00.10.(ихтиология)

Научный руководитель

профессор, д.б.н.

Иванков В. Н.

Владивосток

2002

Содержание
Введение

1. Основные протоколы в Internet и поиск в них

2. Инструменты поиска

2.1. Тематические каталоги

2.2. Автоматические индексы

2.3. Российские системы поиска

Список литературы

Введение.

Одно из главных отличий Интернета от всего остального, что связано с компьютерами, — это то, что для успешной работы с ним, вообще говоря, не нужно никаких книг. Сам Интернет может служить и справочником, и учебником, и энциклопе­дией самого себя. Однако на начальном этапе, как мне кажется, польза от книги, внятно и доступно излагающей основы, может быть весьма значительной. Именно такую книгу я и постарался написать. Но прежде чем вы познакомитесь с ней поближе, да­вайте попробуем ответить на самый главный вопрос, который, вероятно, вы себе уже задавали:

Интернет: что же это, наконец, такое

Более или менее научные (или просто наукообразные) опреде­ления Интернета, которыми заполнены книги и статьи на эту тему, конечно, имеют свою ценность. Но для наших целей пока достаточно самого простого объяснения: Интернет — это мно­жество компьютеров, соединенных друг с другом каналами связи, плюс набор стандартных правил, по которым они обме­ниваются информацией. При этом сами каналы связи, по­жалуй, даже менее важны, чем правила передачи данных по ним, называемые в Интернете протоколами. Если хотя бы два компьютера взаимодействуют по одному из таких протоко­лов — это уже настоящий Интернет.

Изобретение и совершенствование модемов — специальных устройств, по­зволяющих компьютеру посылать информацию по телефону, — открыло двери в Интернет огромному количеству людей, у ко­торых нет. никакого специального сетевого оборудования, а есть лишь персональный компьютер и телефонная розетка побли­зости.

Как сам Интернет, так и модемы для персональных компью­теров существуют уже довольно долго. Однако лишь совсем не­давно — около 1990 года — Интернет набрал, наконец крити­ческую массу пользователей и ресурсов, необходимую для про­исходящей на наших глазах сетевой революции. Скоростные модемы, позволяющие обычным пользователям персональных компьютеров без ограничений наслаждаться всеми благами Ин­тернета, появились еще позднее. А система World Wide Web (WWW, или «Всемирная паутина»), изобретенная в 1993 г. и бывшая поначалу лишь одной из многих составных частей сети, заняла доминирующее положение и стала определять лицо Ин­тернета буквально в последние год-два. Так или иначе, все­мирный интернетовский бум сейчас в самом разгаре — и вам очень повезло, что вы почти не опоздали к началу представ­ления.

Интернет — это, прежде всего огромное множество компьютеров и программ. Среди последних вы найдете не только такие, ко­торые умеют хорошо решать ваши конкретные задачи, но и го­раздо больше таких, чьи способности вам, вероятно, поначалу будет сложно даже представить. Выход в Интернет дает вам уникальную возможность, каким бы несовершенным ни был ваш компьютер, заглянуть в двадцать первый век и самостоя­тельно освоиться с такими понятиями, как «всемирный кибер-социум», «виртуальные деньги», «информационная среда оби­тания» и т. п., — словом, со всем тем, о чем так любят писать сейчас журналисты.

Однако это лишь часть ответа на вопрос «что такое Интернет». Интернет сегодня — это не только огромное количество компьютеров, но еще и невероятное количество людей, для ко­торых сеть является принципиально новым способом общения, почти не имеющим аналогов в материальном мире. Человек — существо социальное, и общение с себе подобными — одна из первейших его потребностей. Пожалуй, до сих пор еще ни одно техническое изобретение (если не считать телефона) не произ­водило такого переворота в этом древнем как мир занятии — об­щении человека с человеком.

Конечно, что именно заинтересует вас в Интернете в первую очередь — люди или компьютеры, — зависит только от вас. Древняя метафора книги как модели мироздания, пожалуй, за­служивает пересмотра — теперь на роль такой модели гораздо лучше подходит компьютер. Когда же речь идет о миллионах компьютеров и их пользователей во всем мире, связанных в единую сеть, метафора эта уже перестает быть просто мета­форой. Вот почему не будет преувеличением сказать, что, вы­ходя в Интернет, вы делаете для себя доступным целый мир.

1. Основные протоколы в Internet и поиск в них.

Internet содержит громадное количество информации, по этому в нем трудно найти то что нужно, если не знать где искать. Место нахождения (или адреса) каждого ресурса определяет его URL. В URL содержится тип протокола, указывающий на какой сервер осуществляется доступ: на WWW( на который указывает запись: http), Gopher, ftp, telnet, или WAIS, это зависит от того какой тип информации вы будете передавать. Сетевой протокол — совокупность четко определенных правил: как запрашивать, оформлять и высылать по сети данную разновидность информации (Кент, 1996).

telnet

К сети Internet присоединены миллионы компьютеров и многие из них обладают интересными возможностями.

Оказывается, вполне осуществимо добраться до этих компьютеров чтобы посмотреть имеющиеся в них базы данных и программы. Специальная программа telnet позволяет превратить ваш компьютер в клиента telnet для доступа к данным и программам в многочисленных серверах telnet. Например исследователь регулярно может работать на нескольких компьютерах, администраторы которых назначают ему специальное имя и пароль.

Сам по себе telnet — просто средство связи; ни какого-то собственного интерфейса, ни возможностей поиска он не предоставляет.

Связавшись с помощью telnet с удаленной машиной и введя в поле запроса свое входное имя (login) и пароль (password) вы дальше общаетесь именно с этой машиной и программами на ней, а telnet заботится лишь о поддержании связи между вами (Левин, 1996).

Разумеется, многие хранилища информации, которые первоначально обслуживались специальными программами с доступом по telnet теперь можно перевести на WWW, что не редко и делается. Однако остались и такие которые по прежнему предоставляют свои услуги только по telnet (особенно среди каталогов и информационных служб библиотек ).

Стандартизированная ссылка на telnet соединение с некоторым узлом Internet ( т.е. URL- адрес этого соединения) выглядит так:

telnet://< адрес сервера >

FTP

Практически вся информация в компьютерном мире хранится в виде файлов. По этому еще на самой заре Internet появилось специальное средство для обмена файлами по сети — сетевой протокол FTP (File Transfer Protocol).

Количество файлов, доступных на узлах всего мира по анонимному FTP измеряется астрономическими цифрами и постоянно растет. К тому же Word Wide Web позволяет без какой-либо переделки существующих FTP архивов, снабжать их описаниями любой степени детальности и удобным гипертекстовым интерфейсом.

Но как узнать куда обращаться в поисках нужного файла?

Archie.

Поиск по имени файла на всех анонимных FTP-узлах мира можно осуществить с помощью системы Archie. Она разработана несколькими программистами из университета МакГила в Канаде и осуществляет индексирование станций FTP, показывая доступные в каждой станции файлы. Archie сообщает о нескольких миллионах файлов находящихся в более тысячи станций FTP, и предоставляет удивительно быстрый способ поиска того места, куда нужно направиться для получения интересующего вас файла. Поиск в базе данных сервера Archie производится с помощью ключевых слов, которые в данном случае представляют собой просто имена файлов или фрагменты имен.

Сейчас Archie доступен через WWW. Это WWW страница с бланком в котором указываются ключевые слова и опции поиска.

Хотя имя файла почти всегда имеет некое отношение к его содержимому, пользоваться Archie для тематического поиска программ не стоит. Эта система будет полезна, если вы действительно знаете имя нужного файла или часть имени. С другой стороны если вы ищете программу, которая имеет общепринятое сокращенное название, то есть некоторая вероятность что это сокращение будет присутствовать и в имени файла, так что можно попробовать найти такой файл с помощью Archie. Результаты поиска представляют собой список FTP-узлов и полных имен файлов на этих узлах. Имя файла служит ссылкой на этот файл, так что щелчок по имени позволит сразу же получить файл с данного узла. А доменый адрес FTP-архива выделенный крупным жирным шрифтом, перенесет вас в исходный каталог файловой системы на этом архиве.

Archie не делит свой список на страницы и его удобнее всего просматривать прямо по мере получения (Хоникарт, 1996).

URL-адрес, указывающий на FTP-соединение, должен, как минимум, включать в себя слово “ ftp” в качестве левой части и адрес узла в правой:

ftp://< адрес сервера >.

WAIS

Почти все информационные ресурсы Internet предоставляют возможность автоматического поиска, но лишь в одной из них — в системе WAIS ( Wide Area Information Server, глобальный информационный сервер) — поиск по ключевым словам, является основным методом доступа к информации.

Система WAIS представляет собой огромную распределенную базу данных, т.е. отдельные части этой базы данных расположены на разных узлах сети по всему миру. Программа-клиент для работы с серверами WAIS не только умеет общаться с ними по специальному протоколу, но и хранит список всех баз данных WAIS с их адресами и названиями, а иногда и с краткими описаниями. Там можно найти архивы телеконференций, всевозможные каталоги, справочники, сборники научных статей и рефератов, индексы и словоуказатели и многое другое. Практически любая информация, для которой база данных является удобной формой представлениями которая достаточно интересна для широкой аудитории, может быть представлена в WAIS.

База данных WAIS настолько велика, что простое “листание” записей — крайне бесперспективный способ доступа к информации. Поэтому в WAIS применяется довольно сложный метод поиска по ключевым словам и фразам. Документы, полученные в результате поиска, сортируются WAIS-сервером по количеству вхождения в них ключевых слов и по тому, насколько полно в каждом из них представлен весь набор заказанных ключевых слов. Такая система способна давать хорошие результаты, особенно если разбить процесс поиска на несколько этапов.

Первым этапом поиска обычно является запрос специальной в базе данных под названием “directory-of-servers ”, которая содержит небольшие по объему описания (рефераты) всех остальных баз WAIS. При этом лучше указывать не те ключевые слова, которые вас в конечном счете интересуют, а те общие понятия, относящиеся к вашей области знаний.

Выбрав на первом этапе одну или несколько баз, можно приступить к поиску собственно документов — что также можно делать в несколько заходов, знакомясь после каждого поиска с результатами и изменяя список ключевых слов, пока не будет найден нужный документ. Кроме того WAIS обладает одним полезным свойством: если на очередном этапе поиска вы нашли документ, содержимое которого особенно близко к тому, что вы ищите, то его можно добавить к списку релевантных документов. В результате на следующем этапе WAIS найдет документы, не только содержащие набор ваших ключевых слов, но и похожие по своему словарному составу на те тексты, которые вы указали как наиболее подходящие.

Хотя Netscape способен работать с серверами WAIS, для этого он должен знать адрес особого прокси-сервера для протокола WAIS, которого вашего провайдера может не оказаться. Специальные WAIS-клиенты, работающие в том числе и под Windows, не только удобные для интерактивного поиска в базах данных, но и позволяет обходиться без услуг какого-либо сервера-посредника(Левин, 1996).

URL-адрес для WAIS выглядит как:

wais:// < адрес сервера>/<название базы>

Gopher

Каждый из рассмотренных до сих пор интернетовских протоколов вполне мог бы существовать сам по себе: telnet предоставляет доступ к программам, FTP — к файлам, WAIS — к базам данных. Все эти системы создавались и развивались почти независимо друг от друга и ставили перед собой конкретную цель — построить механизм доступа к одному определенному виду ресурсов.

Однако по мере того как Internet рос и усложнялся, он сам подталкивал людей к мысли, что информация по природе своей едина и что не слишком разумно делить ее на разные “виды ресурсов” с непохожими методами доступа. К концу 80-ых годов идея нового универсального средства работы с разнородной информацией носилась в воздухе.

Первой системой, призванной воплотить в жизнь эти мечты стал Gopher, появившийся на свет 1991 году в американском университете штата Меннесота. Фундаментальным понятием, заложенным в ее основание была структура вложенных друг в друга меню (Кирсанов,1996).

Связавшись Gopher- клиентом с одним из Gopher-серверов, вы в первую очередь попадаете в корневое, главное меню этого сервера. Сориентировавшись в его содержимом и переходя далее из одного подменю в другое, можно заняться собственно поиском информации. Информация в системе Gopher организована строго иерархически, “от общего к частному”. На каждом шаге сервер посылает вашему Gopher — клиенту не только содержимое очередного меню, но и служебную информацию о том, где находятся объекты, соответствующие пунктам этого меню. Клиент выводит на экран только само перечисление пунктов, но когда вы выберите один из них, он, сверившись с имеющейся у него информацией, либо пошлет на какой-то из Gopher — серверов запрос на выдачу следующего меню, либо попытается установить FTP- или telnet- соединение с некоторым узлом Internet.

Очевидно из всех информационных инструментов Internet Gopher больше всего похож на WWW — обе эти системы призваны служить оболочкой с разнородными ресурсами. Однако Gopher лишен тех богатых изобразительных средств, которые делают WWW не только информационным каталогом, но и новым средством массовой информации и даже новым жанром искусства. Можно сказать, что Gopher является “подмножеством” WWW — что очень упрощает интегрирование самого Gopher как одного из видов ресурсов в WWW. Практически все что сказано о работе с Gopher — клиентом справедливо и для путешествия по системе Gopher с помощью броузера WWW (Хоникарт, 1996).

URL одного из пунктов Gopher — меню состоит из адреса Gopher- сервера и перечисленных тех пунктов меню, которые приведут вас к исходному пункту:

gopher://< адрес сервера>/< пункт меню>

WWW

Несмотря на то, что в первые годы своего существования Gopher завоевал большую популярность, назревала нужда в какой-то более простой и в тоже время максимально универсальной системе, в которой связи между ресурсами были бы более свободными и ассоциативными. Такая система была разработана в 1993 году и названа World Wide Web (WWW). Система WWW строиться на понятии гипертекста, или, точнее гипермедиа. Гипертекст — это текст составные части которого связаны друг с другом и с другими текстами с помощью ссылок. Гипермедиа — это то что получится из гипертекста, если заменить в его определении слово “текст” на “любые виды информации”: графические изображения, видео, звук и т.д.

World Wide Web означает буквально “всемирная паутина”. Почему она так называется. Как ясно из названия, она глобальна. Вы не всегда знаете в какой части света находится компьютер, к которому вы подключаетесь. Вы можете начинать читать страницу Web в Далласе, затем перейти в Австралию, и все это по одному нажатию кнопки мыши. WWW похожа на паутину. Это сложная информационная сеть, соединенная гипермедиа связями. WWW позволяет не отказываться от информационных ресурсов уже накопленных в Internet, доступных с помощью других средств — FTP, telnet и Gopher. Больше того, работа с этими ресурсами через WWW настолько удобна, что, скажем, FTP-клиенты, бывшие когда-то отдельным классом программ, теперь используются лишь немногими.

И все-таки главное в World Wide Web — это не удобства доступа к FTP- архива и Gopher-меню. Большинство серверов системы WWW предлагают информацию, которая без WWW вряд ли вообще когда- либо попала бы в сеть. Быстрота создания и обновления, богатые изобразительные возможности в сочетании с легкостью доступа и огромной аудиторией сделали WWW новым средством массовой информации. Запуск WWW-серрверов и создание WWW-страниц уже превратилось из повальной моды в новый бизнес — со всем что свойственно современному бизнесу: платой за квадратные сантиметры рекламной площади.

С другой стороны, быстрому распространению системы, столь естественно объединяющей разнородные ресурсы, способствовало не в последнюю очередь ее зарождение не в недрах коммерческой фирмы, а в научном учреждении — Европейской лаборатории физики частиц, сотрудники которой не стали делать секретов из своей разработки и даже не попытались на ней разбогатеть.

К счастью, сама природа WWW как прежде всего средства поиска и организации информации позволяет надеяться, что это замечательное изобретение не превратиться в инструмент одной лишь коммерции и рекламы (Кирсанов, 1996).

Серверы и клиенты WWW связываются между собой по специальному протоколу HTTP (Hyper Transfer Protocol, протокол передачи гипертекста). URL для WWW выглядит как :

< адрес сервера>

Переходить от одной странице Web к другой — интересный способ исследования World Wide Web, однако вам рано или поздно понадобится найти что-то конкретное. Но таким образом это сделать не удастся. В Internet имеются специальные инструменты Web-поиска.

Инструменты поиска в WWW.

Инструментов поиска информации в Internet, построенных на разных принципах и преследующих разные цели, существует немало. Но все их объединяет то, что они располагаются на специально выделенных сетевых компьютерах с мощными каналами связи, обслуживают ежеминутно огромное количество посетителей и требуют от своих владельцев значительных затрат на поддержку и обновление. Тем не менее, почти все они отвечают на запросы пользователей совершенно бескорыстно, а платят за это удовольствие спонсоры и рекламодатели. По масштабам влияния на сетевое сообщество поисковые системы, без сомнения, являются одним из краеугольных камней Internet.

Классификацию поисковых систем удобнее всего строить на основании того, на сколько автоматизирован в них сбор и обработка информации, предоставляемой пользователям, — иначе говоря, кто набирает базу данных, в которой производится поиск: люди или сами компьютеры.

2. Инструменты поиска

Условно инструменты поиска подразделяются на поисковые средства справочного типа (directories) и поисковые системы в чистом виде (search engines).

2.1 Тематические каталоги

Поисковые инструменты первого типа чаще всего называют предметными, или тематическими каталогами. Компания, владеющая таким каталогом, непрерывно ведет огромную работу, исследуя, описывая, каталогизируя и раскладывая по полочкам содержимое WWW-серверов и других сетевых ресурсов, разбросанных по всему миру. Результатом ее титанических усилий является постоянно обновляющийся иерархический каталог, на верхнем уровне собраны самые общие категории, такие как “бизнес ”, ”наука”, ”искусство” и т.п., а элементы самого нижнего уровня представляют собой ссылки на отдельные WWW-страницы и сервера вместе с кратким описанием их содержимого.

Гарантий того, что такой каталог действительно охватывает все содержимое WWW, никто не даст, однако возможная не полнота и даже однобокость подбора материалов с лихвой искупается там, что пока еще не под силу никакому компьютеру — осмысленность отбора.

Предметные каталоги предоставляют и возможность поиска по ключевым словам. Однако поиск этот происходит не в содержимом самих WWW-серверов, а в их кратких описаниях, хранящихся в каталоге.

Предметные каталоги Internet можно пересчитать буквально на пальцах, так как их создание и поддержка требуют огромных затрат. К наиболее известным относятся Yahoo, WWW Virtual Library, Galaxy и некоторые другие.

Yahoo.

Наиболее популярен у населения Internet каталог Yahoo. На первой же странице Yahoo, расположенной по адресу www.yahoo.com, вы получаете доступ к двум основным методом работы с каталогом — поиску по ключевым словам и иерархическому древу разделов.

Начав спуск по разделам каталога, вы увидите, что каждый раздел содержит точно такое же поле для ввода ключевых слов и кнопку Search, запускающую поиск.

Каждый раздел может включать в себя как перечисление входящих в него подразделов, так и собственно ссылки на страницы, относящиеся сразу ко всему разделу, с их краткими описаниями.

Вместо путешествия по дереву подраздела вы можете сразу попасть в нужное место каталога Yahoo с помощью поиска. Введя одно или несколько ключевых слов, разделенных пробелами, в строку поиска и нажав кнопку Search, вы получите список всего в Yahoo, что содержит в себе указанные ключевые слова. Этот список будет разделен на две части — “categories” и “sites”.

Если общее количество ссылок, возвращенных в результате поиска, превышает 25, список ссылок будет разбит на несколько частей.

Автоматическим поиском можно воспользоваться не только с главной страницы Yahoo, но и из любого подраздела; при этом специальный переключатель, расположенный под полем ввода ключевых слов, позволяет либо ограничить поиск текущим разделом и его подразделами, либо искать во всем каталоге (Черил, 1998).

Magellan.

Но не редко случается так, что выдаваемый машиной список очень велик и просмотреть его просто не реально. Выходом из этой ситуации может стать более строгий отбор информации, заносимой в каталог. Одна из самых известных систем такого рода — каталог Magellan по адресу: www.mckinley.com

Эта база данных содержит сведения о 80 тысячах WWW-страниц — что очень не много в сравнении с теми миллионами, которые существуют в сети. Однако если Yahoo в качестве описания ресурса использует одну-две строчки текста, то сотрудники системы Magellan на некоторые из страниц, заносимые в их базу данных, сами пишут небольшие рецензии, а также оценивают качество этих информационных ресурсов по пятибалльной шкале. По мимо базы рецензий, Magellan владеет так же собственным автоматическим индексом, для поиска в котором нужно перебросить переключатель под полем ввода в положение entire database.

Как правило запрос представляет собой одно или несколько ключевых слов, разделенных пробелами (Кирсанов, 1996).

Point.

Схожая по своим принципам служба фирмы Point (http://www.pointcom.com) вообще основной упор делает не на поиск, а на работу с тематическим каталогом.

Служба Point известна в сети тем, что ее сотрудники постоянно заняты оцениванием сетевых ресурсов и ведут списки тех узлов, которые они считают принадлежат к “лучшим пяти процентам WWW”.

Сама фирма Point Ведет общедоступную базу данных всех “пятипроцентных WWW-страниц, где о каждой можно прочитать подробную лицензию (Хоникарт, 1996).

Virtual Library.

Самым старым предметным каталогом WWW является каталог Virtual Library:

www.w3.org/hypertext/DataSources/bySubject/Overview.html

Эта система достаточно полно охватывает научную прослойку WWW — серверы университетов, лабораторий и учебных заведений.

Russia-On-Line Subject Guide.

Для пользователей в нашей стране определенный интерес может представлять тематический каталог Russia-On-Line Subject Guide, расположенный по адресу www.online.ru/rmain. Этот каталог содержит довольно пестрое собрание ссылок на зарубежные источники плюс тематический обзор российских и русскоязычных ресурсов WWW.

2.2.Автоматические индексы.

К проблеме поиска информации в Internet можно подойти и с другой стороны. Существуют программы в которые загрузили несколько тысяч общеизвестных URL-адресов. Будучи запущена на компьютере с доступом к WWW, эта программа начинает автоматически скачивать из сети документы по этим URL, причем из каждого нового документа она извлекает все содержащиеся в нем ссылки и добавляет их в свою базу адресов. Поскольку в конечном счете все WWW документы связаны между собой, рано или поздно такая программа обойдет весь Internet.

Разумеется, программа не может ни понять ни как либо классифицировать то, что она видит в сети. Программы такого типа называются роботами. Они ограничиваются сбором статистической информации и построением словоуказателей (индексов) по текстам документов. Собираемая роботом база данных — индекс — хранит в себе, попросту говоря, сведения о том в каких WWW-документах содержаться те или иные слова.

Именно такой автоматически собираемый индекс и лежит в основе поисковых систем второго рода, которые часто так и называют — автоматические индексы.

Автоматический индекс состоит из трех частей: программы-робота, собираемой этим роботом базы данных и интерфейса для поиска в этой базе, с которым работает пользователь. Все эти компоненты вполне могут функционировать без вмешательства человека.

Поскольку какая-либо классификация или оценивание материалов в системах такого рода отсутствуют, к ним следует прибегать только тогда, когда вы точно знаете ключевые слова, относящиеся к тому, что вам нужно, — скажем, фамилию человека или несколько достаточно редких терминов из соответствующей области. если же задать поиск по сколько-нибудь распространенным словам, то вам не хватит жизни, чтобы обойти все полученные в результате поиска URL-адреса, — к примеру, индекс системы Alta Vista содержит 11 миллиардов слов, извлеченных из 30 миллионов WWW-страниц.

Автоматических индексов WWW-страниц существует немало: WebCrawler, Lycos, Excite, Inktomi, Open Text и другие. Некоторые из них (например, Lycos) представляют собой более или менее удачный синтез предметного каталога и автоматического индекса.

Alta Vista.

Ее адрес altavista.digital.com. Эта система появилась в декабре 1995 года. Она один из самых больших по объему индексов из всех поисковых систем такого рода и самые мощные и гибкие правила построения запросов. Alta Vista понимает два разных языка запросов, довольно сильно отличающихся друг от друга. На первой странице Alta Vista вы видите бланк для простого запроса (Simple Search), а панель заголовка вверху страницы содержит кнопку Advanced Search, нажав которую, вы получите бланк для усложнения запроса.

Кроме WWW-страниц, Alta Vista ведет отдельный индекс для статей из более чем 14000 конференций Usenet (включая иерархию групп relcom.*).

Поиск Alta Vista: чтобы Alta Vista срабатывала на группе слов, только когда они стоят рядом, нужно заключить эту группу в кавычки. Если необходимо исключить из результата все документы, содержащие определенное слово, необходимо приписать это слово со знаком “минус”.

Слово без всякого знака действует в запросе точно так же, как и оно же со знаком “плюс”.

В отличие от Yahoo, по умолчанию Alta Vista ищет вхождения целых слов, т. е. заказанные термины должны стоять в документе обособленно, а не быть частью других цепочек символов. Если же вам нужно найти все вхождения слова, даже когда оно входит в состав других слов, пользуйтесь символом *. звездочка может стоять только в конце слова, а чтобы предотвратить обвальный поиск, дающий слишком много результатов, Alta Vista требует, чтобы слово, заканчивающееся на *, состояло не менее чем из 3 букв. Более того, символ * позволяет найти не любое окончание слова, а только не превышающее длину пяти символов и не содержащее заглавных букв или цифр.

Результаты поиска Alta Vista, как и Yahoo, выдает в виде списка ссылок на документы, но вместо описания каждого документа рядом с его заголовком вы увидите просто первые несколько строк его текста. Если найдено будет больше 10 документов, Alta Vista разобьет их список на страницы по 10 ссылок на каждой. Alta Vista сортирует ссылки так, чтобы на первом месте стояли “самые важные” документы с вашими ключевыми словами при определении степени важности учитывая следующие факторы:

* входят ли ключевые слова в заголовок документов;

* содержатся ли эти слова в первых нескольких строках документов;

* насколько близки друг к другу в тексте обнаружены ключевые слова (Кирсанов, 1996).

Infoseek

Infoseek, вступивший в эксплуатацию в конце 19996 года, несколько напоминает Alta Vista, однако объем обследуемых им полных текстов документов еще не превышает 30 млн. Web-страниц. Адрес: www.infoseek.com. Это довольно мощная система, обладающая высокой скоростью и простой в обращении. Возможности составления запроса почти такие же, как и в Alta Vista, но не столь богатые. При почти полном сохранении значений знаков «плюс», «минус» и «кавычек», чувствительности к разнице заглавных и строчных букв и возможности ограничивать поиск фрагментами Web- страниц, Infoseek пока не обладает способностью определять рядом стоящие термины (нет оператора NEAR), ограничивать поиск по дате обновления источника и, главное, усекать окончания ключевых терминов.

Но данная поисковая система содержит массу факультативных функций. К таковым относится, например, возможность определять количество ссылок в WWW на конкретную страницу, то есть судить, насколько она популярна или же, наоборот, выяснить, сколько ссылок на внешние страницы содержится на данном узле, вернее, сколько из них отражены в индексных файлах Ultraseek. Использование специальной функции Imageseek позволяет находить в Internet изображения (рисунки, фотографии) на определенную тему. Infoseek имеет также один из лучших справочников ресурсов Сети.

HotBot

Одним из мощных поисковых средств в World Wide Webможно отнести HotBot, содержащий сведения о полных текстах 110 млн. страниц. Адрес: http:// www.hotbot.com. HotBot принадлежит к новейшим системам, поэтому его углубленный поиск дает поразительно широкие возможности для детализации запроса. Это достигается за счет использования многоступенчатого меню, предлагающего различные варианты составления поискового предписания. Можно осуществить поиск по наличию в документе одного или нескольких терминов, поиск по отдельной фазе, поиск конкретного лица или ссылки на определенный электронный адрес. Для большей детализации запроса возможно применение условий SHOULD (может содержать), MUST (должен обязательно содержать), MUST NOT (не должен содержать) по отношению к каким-либо понятиям. Кроме того,HotBot представляет возможностьограничить поиск по дате создания или последнего обновления документа, по георафическому положению сервера. Верхом сервисных возможностей является поиск документов, содержащих определенные типы файлов, например аудио или видио. Для этого надо лишь сделать отметку в специальном пункте меню запроса (Куприянова, 1998).

WebCrawler.

Это еще один инструмент поиска типа search-bot (поисковый робот). Адрес: www.webcrawler.com. Поиск здесь очень прост. Введите как можно больше ключевых слов в поле поиска, нажмите Search.

L ycos.

Это большая база данных индексирующая содержание всех найденных ею страниц Web. Адрес: www.lycos.com.

World Wide Web Worm .

Вы найдете этот инструмент поиска на www.cs.colorado.edu/home/mcbryan/wwww.html. Это еще один обширный указатель участков Web.

В каждом конкретном случае целесообразно использовать свой инструмент поиска. Вам придется пытаться проводить поиск при помощи одного инструмента и, если вы не получили результатов, переходить к другому. Но все же каким инструментом пользоваться? В первую очередь лучше воспользоваться тематическим каталогом типа Yahoo, размер у них сравнительно небольшой, зато велика скорость. Если найти необходимую информацию не удалось, это говорит о том, что вы интересуетесь слишком узкой темой, или же с вашей темой плохо соотносятся выбранные вами ключевые слова. Это не значит, что нужной информации в WWW нет — просто найти ее будет сложнее. Для ее поиска вам прийдется воспользоваться более примитивными, более автоматическими и потому более всеобъемлющими системами типа Alta Vista (Кент, 1996).

2.3.Российские поисковые системы

Поисковые системы глобального масштаба свое основное внимание концентрируют на англоязычных ресурсах Сети. Задачу поиска информации на серверах в пределах отдельных стран выполняют системы локального характера, специально адаптированные к особенностям конкретных языков. Существуют подобные поисковые средства и в России. Всех их объединяет возможность обработки материалов во всех кириллических кодировках*. Однако по мощности и уровню предлагаемого сервиса русскоязычные поисковые системы значительно отличаются друг от друга.

К лидирующей группе в настоящее время относятся системы Rambler , «Апорт» и«Я ndex ».

Rambler

Среди фаворитов выделяется Rambler (http://www.rambler.ru), ставший первой профессиональной отечественной поисковой системой. Эта система обеспечивает полнотекстовый поиск на 3 млн. страниц, расположенных на более чем 15 тыс. Web-узлах Росси и стран ближнего зарубежья. Помимо Web-серверов, обследуется также недельный архив телеконференций иерархии relcom.

Rambler обладает близким к оптимальному выводом результатов поиска. Даже в нормальной форме ссылка на найденный объектвключает полную информацию. Система сконструирована таким образом, что один и тот же документ в различных кодировках показывается в различных кодировках показываются только один раз, а его конкретные адреса суммируются в списке, идущим за резюме.это сокращает время на аналмз полученных результатов из-за отсутствия дублирования одних и тех же документов.

Главный недостаток Rambler заключается в невозможности осуществлять поиск по целой фазе или хотя бы указывать в запросах предельное расстояние искомых терминов друг от друга. Случайное сочетание совершенно несвязанных слов приводит к выдаче ссылок на документы, совершенно не релевантны запросу.

Апорт

Поисковая система Апорт (http://www.апорт.ru) снабжена массой различных функций, относящих ее к числу самых удобных для пользователя.

Одно из главных достоинств Апорт состоит в широких возможностях составления запроса. Помимо традиционных операторов “и” и “или”, поиска по целой фазе, система способна вычленять сочетания терминов, расположенных в тексте рядом друг с другом. Апорт предлагает возможность автоматического перевода запроса с русского на английский язык и наоборот. И Rambler, и Апорт способны выделять один и тот же документ в различных кодировках и выдавать ссылку на него лишь раз, перечисляя конкретные адреса в списке URL. К сожалению, при этом вовремя не удаляются сведения об устаревших версиях одной и той же страницы, которые перечисляются как существующие, имея разницу лишь в дате обновления. Еще одним недостатком этой системы является не всегда корректная обработка названий страниц, из-за чего в результатах поиска часто указывается «документ без названия».

Я ndex

Поисковая система Яndex (http://www.yandex.ru), где помимо серверов доменов «ru» и «su» Яndex индексирует содержание зарубежных русскоязычных Web-узлов.

Главной отличительной чертой этой системы является глубокий морфологический анализ обрабатываемых терминов. Мощнейшая лингвистика позволяет учесть практически все возможные оттенки употребления ключевых слов и составить запрос максимально точно. Яndex обладает хорошим механизмом распознавания одного документа в нескольких кодировках или на зеркальных серверах.

Вслед за лидирующей российской тройкой идут еще несколько поисковых средств, среди которых “Русская машина поиска”(http://search.interrussia.com), «TELA-поиск» (http:// tela.dux.ru/) и Russian Internet Search (http://www.search.ru). Пока все эти серверы не отличаются ни широтой поиска, ни комфортностью, и могут быть использованы лишь в качестве дополнения к ведущим поисковым средствам.

Поисковый сервис в русскоязычном блоке Internet, также как и во всем мире, развивается стремительно. Нет сомнения, что в ближайшем будущем показатели существующих систем повысятся, появятся новые поколения поисковых средств, предоставляющих пользователям еще большие возможности (Куприянова, 1998).

Список литературы

1. Дмитрий Кирсанов Понятный Internet / -М. Символ-Плюс, 1996

2. Джери Хоникарт Internet без проблем /- М. 1996

3. Питер Кент Internet / М. 1996

4.Джон Левин Секреты Internet / Киев 1996

5.В. Степанов С компьютером на ты / — М., 1998

6. Кирк Черил Internet. Книга ответов / М. 1998

7. Г. И. Куприянова Информационные ресурсы Internet / М., 1998

www.ronl.ru

Реферат Что такое интернет?

МИНИСТЕРСТВО ОБЩЕГО И ПРОФЕССИОНАЛЬНОГО

ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

ДАЛЬНЕВОСТОЧНЫЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Кафедра информатики

Что такое интернет

Аспиранта второго

года обучения

Незнановой С. Ю.

03.00.10.(ихтиология)

Научный руководитель

профессор, д.б.н.

Иванков В. Н.

Владивосток

2002

Содержание
Введение
  1. Основные протоколы в Internet и поиск в них

  2. Инструменты поиска

    1. Тематические каталоги

    2. Автоматические индексы

    3. Российские системы поиска

Список литературы

Введение.

Одно из главных отличий Интернета от всего остального, что связано с компьютерами, — это то, что для успешной работы с ним, вообще говоря, не нужно никаких книг. Сам Интернет может служить и справочником, и учебником, и энциклопе­дией самого себя. Однако на начальном этапе, как мне кажется, польза от книги, внятно и доступно излагающей основы, может быть весьма значительной. Именно такую книгу я и постарался написать. Но прежде чем вы познакомитесь с ней поближе, да­вайте попробуем ответить на самый главный вопрос, который, вероятно, вы себе уже задавали:

Интернет: что же это, наконец, такое

Более или менее научные (или просто наукообразные) опреде­ления Интернета, которыми заполнены книги и статьи на эту тему, конечно, имеют свою ценность. Но для наших целей пока достаточно самого простого объяснения: Интернет — это мно­жество компьютеров, соединенных друг с другом каналами связи, плюс набор стандартных правил, по которым они обме­ниваются информацией. При этом сами каналы связи, по­жалуй, даже менее важны, чем правила передачи данных по ним, называемые в Интернете протоколами. Если хотя бы два компьютера взаимодействуют по одному из таких протоко­лов — это уже настоящий Интернет.

Изобретение и совершенствование модемов — специальных устройств, по­зволяющих компьютеру посылать информацию по телефону, — открыло двери в Интернет огромному количеству людей, у ко­торых нет. никакого специального сетевого оборудования, а есть лишь персональный компьютер и телефонная розетка побли­зости.

Как сам Интернет, так и модемы для персональных компью­теров существуют уже довольно долго. Однако лишь совсем не­давно — около 1990 года — Интернет набрал, наконец крити­ческую массу пользователей и ресурсов, необходимую для про­исходящей на наших глазах сетевой революции. Скоростные модемы, позволяющие обычным пользователям персональных компьютеров без ограничений наслаждаться всеми благами Ин­тернета, появились еще позднее. А система World Wide Web (WWW, или «Всемирная паутина»), изобретенная в 1993 г. и бывшая поначалу лишь одной из многих составных частей сети, заняла доминирующее положение и стала определять лицо Ин­тернета буквально в последние год-два. Так или иначе, все­мирный интернетовский бум сейчас в самом разгаре — и вам очень повезло, что вы почти не опоздали к началу представ­ления.

Интернет — это, прежде всего огромное множество компьютеров и программ. Среди последних вы найдете не только такие, ко­торые умеют хорошо решать ваши конкретные задачи, но и го­раздо больше таких, чьи способности вам, вероятно, поначалу будет сложно даже представить. Выход в Интернет дает вам уникальную возможность, каким бы несовершенным ни был ваш компьютер, заглянуть в двадцать первый век и самостоя­тельно освоиться с такими понятиями, как «всемирный кибер-социум», «виртуальные деньги», «информационная среда оби­тания» и т. п., — словом, со всем тем, о чем так любят писать сейчас журналисты.

Однако это лишь часть ответа на вопрос «что такое Интернет». Интернет сегодня — это не только огромное количество компьютеров, но еще и невероятное количество людей, для ко­торых сеть является принципиально новым способом общения, почти не имеющим аналогов в материальном мире. Человек — существо социальное, и общение с себе подобными — одна из первейших его потребностей. Пожалуй, до сих пор еще ни одно техническое изобретение (если не считать телефона) не произ­водило такого переворота в этом древнем как мир занятии — об­щении человека с человеком.

Конечно, что именно заинтересует вас в Интернете в первую очередь — люди или компьютеры, — зависит только от вас. Древняя метафора книги как модели мироздания, пожалуй, за­служивает пересмотра — теперь на роль такой модели гораздо лучше подходит компьютер. Когда же речь идет о миллионах компьютеров и их пользователей во всем мире, связанных в единую сеть, метафора эта уже перестает быть просто мета­форой. Вот почему не будет преувеличением сказать, что, вы­ходя в Интернет, вы делаете для себя доступным целый мир.

1. Основные протоколы в Internet и поиск в них.

Internet содержит громадное количество информации, по этому в нем трудно найти то что нужно, если не знать где искать. Место нахождения (или адреса) каждого ресурса определяет его URL . В URL содержится тип протокола, указывающий на какой сервер осуществляется доступ: на WWW( на который указывает запись: http), Gopher, ftp, telnet, или WAIS, это зависит от того какой тип информации вы будете передавать. Сетевой протокол — совокупность четко определенных правил: как запрашивать, оформлять и высылать по сети данную разновидность информации (Кент, 1996).

telnet

К сети Internet присоединены миллионы компьютеров и многие из них обладают интересными возможностями.

Оказывается, вполне осуществимо добраться до этих компьютеров чтобы посмотреть имеющиеся в них базы данных и программы. Специальная программа telnet позволяет превратить ваш компьютер в клиента telnet для доступа к данным и программам в многочисленных серверах telnet. Например исследователь регулярно может работать на нескольких компьютерах, администраторы которых назначают ему специальное имя и пароль.

Сам по себе telnet — просто средство связи; ни какого-то собственного интерфейса, ни возможностей поиска он не предоставляет.

Связавшись с помощью telnet с удаленной машиной и введя в поле запроса свое входное имя (login) и пароль (password) вы дальше общаетесь именно с этой машиной и программами на ней, а telnet заботится лишь о поддержании связи между вами (Левин, 1996).

Разумеется, многие хранилища информации, которые первоначально обслуживались специальными программами с доступом по telnet теперь можно перевести на WWW , что не редко и делается. Однако остались и такие которые по прежнему предоставляют свои услуги только по telnet (особенно среди каталогов и информационных служб библиотек ).

Стандартизированная ссылка на telnet соединение с некоторым узлом Internet ( т.е. URL- адрес этого соединения) выглядит так:

telnet://< адрес сервера >

FTP

Практически вся информация в компьютерном мире хранится в виде файлов. По этому еще на самой заре Internet появилось специальное средство для обмена файлами по сети — сетевой протокол FTP (File Transfer Protocol).

Количество файлов, доступных на узлах всего мира по анонимному FTP измеряется астрономическими цифрами и постоянно растет. К тому же Word Wide Web позволяет без какой-либо переделки существующих FTP архивов, снабжать их описаниями любой степени детальности и удобным гипертекстовым интерфейсом.

Но как узнать куда обращаться в поисках нужного файла?

Archie.

Поиск по имени файла на всех анонимных FTP-узлах мира можно осуществить с помощью системы Archie. Она разработана несколькими программистами из университета МакГила в Канаде и осуществляет индексирование станций FTP, показывая доступные в каждой станции файлы. Archie сообщает о нескольких миллионах файлов находящихся в более тысячи станций FTP, и предоставляет удивительно быстрый способ поиска того места, куда нужно направиться для получения интересующего вас файла. Поиск в базе данных сервера Archie производится с помощью ключевых слов, которые в данном случае представляют собой просто имена файлов или фрагменты имен.

Сейчас Archie доступен через WWW. Это WWW страница с бланком в котором указываются ключевые слова и опции поиска.

Хотя имя файла почти всегда имеет некое отношение к его содержимому, пользоваться Archie для тематического поиска программ не стоит. Эта система будет полезна, если вы действительно знаете имя нужного файла или часть имени. С другой стороны если вы ищете программу, которая имеет общепринятое сокращенное название, то есть некоторая вероятность что это сокращение будет присутствовать и в имени файла, так что можно попробовать найти такой файл с помощью Archie. Результаты поиска представляют собой список FTP-узлов и полных имен файлов на этих узлах. Имя файла служит ссылкой на этот файл, так что щелчок по имени позволит сразу же получить файл с данного узла. А доменый адрес FTP-архива выделенный крупным жирным шрифтом, перенесет вас в исходный каталог файловой системы на этом архиве.

Archie не делит свой список на страницы и его удобнее всего просматривать прямо по мере получения (Хоникарт, 1996).

URL-адрес, указывающий на FTP-соединение, должен, как минимум, включать в себя слово “ ftp” в качестве левой части и адрес узла в правой:

ftp://< адрес сервера >.

WAIS

Почти все информационные ресурсы Internet предоставляют возможность автоматического поиска, но лишь в одной из них — в системе WAIS ( Wide Area Information Server, глобальный информационный сервер) — поиск по ключевым словам, является основным методом доступа к информации.

Система WAIS представляет собой огромную распределенную базу данных, т.е. отдельные части этой базы данных расположены на разных узлах сети по всему миру. Программа-клиент для работы с серверами WAIS не только умеет общаться с ними по специальному протоколу, но и хранит список всех баз данных WAIS с их адресами и названиями, а иногда и с краткими описаниями. Там можно найти архивы телеконференций, всевозможные каталоги, справочники, сборники научных статей и рефератов, индексы и словоуказатели и многое другое. Практически любая информация, для которой база данных является удобной формой представлениями которая достаточно интересна для широкой аудитории, может быть представлена в WAIS.

База данных WAIS настолько велика, что простое “листание” записей — крайне бесперспективный способ доступа к информации. Поэтому в WAIS применяется довольно сложный метод поиска по ключевым словам и фразам. Документы, полученные в результате поиска, сортируются WAIS-сервером по количеству вхождения в них ключевых слов и по тому, насколько полно в каждом из них представлен весь набор заказанных ключевых слов. Такая система способна давать хорошие результаты, особенно если разбить процесс поиска на несколько этапов.

Первым этапом поиска обычно является запрос специальной в базе данных под названием “directory-of-servers ”, которая содержит небольшие по объему описания (рефераты) всех остальных баз WAIS. При этом лучше указывать не те ключевые слова, которые вас в конечном счете интересуют, а те общие понятия, относящиеся к вашей области знаний.

Выбрав на первом этапе одну или несколько баз, можно приступить к поиску собственно документов — что также можно делать в несколько заходов, знакомясь после каждого поиска с результатами и изменяя список ключевых слов, пока не будет найден нужный документ. Кроме того WAIS обладает одним полезным свойством: если на очередном этапе поиска вы нашли документ, содержимое которого особенно близко к тому, что вы ищите, то его можно добавить к списку релевантных документов. В результате на следующем этапе WAIS найдет документы, не только содержащие набор ваших ключевых слов, но и похожие по своему словарному составу на те тексты, которые вы указали как наиболее подходящие.

Хотя Netscape способен работать с серверами WAIS, для этого он должен знать адрес особого прокси-сервера для протокола WAIS, которого вашего провайдера может не оказаться. Специальные WAIS-клиенты, работающие в том числе и под Windows, не только удобные для интерактивного поиска в базах данных, но и позволяет обходиться без услуг какого-либо сервера-посредника(Левин, 1996).

URL-адрес для WAIS выглядит как:

wais:// < адрес сервера>/<название базы>

Gopher

Каждый из рассмотренных до сих пор интернетовских протоколов вполне мог бы существовать сам по себе: telnet предоставляет доступ к программам, FTP — к файлам, WAIS — к базам данных. Все эти системы создавались и развивались почти независимо друг от друга и ставили перед собой конкретную цель — построить механизм доступа к одному определенному виду ресурсов.

Однако по мере того как Internet рос и усложнялся, он сам подталкивал людей к мысли, что информация по природе своей едина и что не слишком разумно делить ее на разные “виды ресурсов” с непохожими методами доступа. К концу 80-ых годов идея нового универсального средства работы с разнородной информацией носилась в воздухе.

Первой системой, призванной воплотить в жизнь эти мечты стал Gopher, появившийся на свет 1991 году в американском университете штата Меннесота. Фундаментальным понятием, заложенным в ее основание была структура вложенных друг в друга меню (Кирсанов,1996).

Связавшись Gopher- клиентом с одним из Gopher-серверов, вы в первую очередь попадаете в корневое, главное меню этого сервера. Сориентировавшись в его содержимом и переходя далее из одного подменю в другое, можно заняться собственно поиском информации. Информация в системе Gopher организована строго иерархически, “от общего к частному”. На каждом шаге сервер посылает вашему Gopher - клиенту не только содержимое очередного меню, но и служебную информацию о том, где находятся объекты, соответствующие пунктам этого меню. Клиент выводит на экран только само перечисление пунктов, но когда вы выберите один из них, он, сверившись с имеющейся у него информацией, либо пошлет на какой-то из Gopher - серверов запрос на выдачу следующего меню, либо попытается установить FTP- или telnet- соединение с некоторым узлом Internet.

Очевидно из всех информационных инструментов Internet Gopher больше всего похож на WWW — обе эти системы призваны служить оболочкой с разнородными ресурсами. Однако Gopher лишен тех богатых изобразительных средств, которые делают WWW не только информационным каталогом, но и новым средством массовой информации и даже новым жанром искусства. Можно сказать, что Gopher является “подмножеством” WWW — что очень упрощает интегрирование самого Gopher как одного из видов ресурсов в WWW. Практически все что сказано о работе с Gopher - клиентом справедливо и для путешествия по системе Gopher с помощью броузера WWW (Хоникарт, 1996).

URL одного из пунктов Gopher - меню состоит из адреса Gopher- сервера и перечисленных тех пунктов меню, которые приведут вас к исходному пункту:

gopher://< адрес сервера>/< пункт меню>

WWW

Несмотря на то, что в первые годы своего существования Gopher завоевал большую популярность, назревала нужда в какой-то более простой и в тоже время максимально универсальной системе, в которой связи между ресурсами были бы более свободными и ассоциативными. Такая система была разработана в 1993 году и названа World Wide Web (WWW). Система WWW строиться на понятии гипертекста, или, точнее гипермедиа. Гипертекст — это текст составные части которого связаны друг с другом и с другими текстами с помощью ссылок. Гипермедиа — это то что получится из гипертекста, если заменить в его определении слово “текст” на “любые виды информации”: графические изображения, видео, звук и т.д.

World Wide Web означает буквально “всемирная паутина”. Почему она так называется. Как ясно из названия, она глобальна. Вы не всегда знаете в какой части света находится компьютер, к которому вы подключаетесь. Вы можете начинать читать страницу Web в Далласе, затем перейти в Австралию, и все это по одному нажатию кнопки мыши. WWW похожа на паутину. Это сложная информационная сеть, соединенная гипермедиа связями. WWW позволяет не отказываться от информационных ресурсов уже накопленных в Internet, доступных с помощью других средств — FTP, telnet и Gopher. Больше того, работа с этими ресурсами через WWW настолько удобна, что, скажем, FTP-клиенты, бывшие когда-то отдельным классом программ, теперь используются лишь немногими.

И все-таки главное в World Wide Web — это не удобства доступа к FTP- архива и Gopher-меню. Большинство серверов системы WWW предлагают информацию, которая без WWW вряд ли вообще когда- либо попала бы в сеть. Быстрота создания и обновления, богатые изобразительные возможности в сочетании с легкостью доступа и огромной аудиторией сделали WWW новым средством массовой информации. Запуск WWW-серрверов и создание WWW-страниц уже превратилось из повальной моды в новый бизнес — со всем что свойственно современному бизнесу: платой за квадратные сантиметры рекламной площади.

С другой стороны, быстрому распространению системы, столь естественно объединяющей разнородные ресурсы, способствовало не в последнюю очередь ее зарождение не в недрах коммерческой фирмы, а в научном учреждении — Европейской лаборатории физики частиц, сотрудники которой не стали делать секретов из своей разработки и даже не попытались на ней разбогатеть.

К счастью, сама природа WWW как прежде всего средства поиска и организации информации позволяет надеяться, что это замечательное изобретение не превратиться в инструмент одной лишь коммерции и рекламы (Кирсанов, 1996).

Серверы и клиенты WWW связываются между собой по специальному протоколу HTTP (Hyper Transfer Protocol, протокол передачи гипертекста). URL для WWW выглядит как :

http://< адрес сервера>

Переходить от одной странице Web к другой — интересный способ исследования World Wide Web, однако вам рано или поздно понадобится найти что-то конкретное. Но таким образом это сделать не удастся. В Internet имеются специальные инструменты Web-поиска.

Инструменты поиска в WWW.

Инструментов поиска информации в Internet, построенных на разных принципах и преследующих разные цели, существует немало. Но все их объединяет то, что они располагаются на специально выделенных сетевых компьютерах с мощными каналами связи, обслуживают ежеминутно огромное количество посетителей и требуют от своих владельцев значительных затрат на поддержку и обновление. Тем не менее, почти все они отвечают на запросы пользователей совершенно бескорыстно, а платят за это удовольствие спонсоры и рекламодатели. По масштабам влияния на сетевое сообщество поисковые системы, без сомнения, являются одним из краеугольных камней Internet.

Классификацию поисковых систем удобнее всего строить на основании того, на сколько автоматизирован в них сбор и обработка информации, предоставляемой пользователям, — иначе говоря, кто набирает базу данных, в которой производится поиск: люди или сами компьютеры.

2.Инструменты поиска

Условно инструменты поиска подразделяются на поисковые средства справочного типа (directories) и поисковые системы в чистом виде (search engines).

2.1 Тематические каталоги

Поисковые инструменты первого типа чаще всего называют предметными, или тематическими каталогами. Компания, владеющая таким каталогом, непрерывно ведет огромную работу, исследуя, описывая, каталогизируя и раскладывая по полочкам содержимое WWW-серверов и других сетевых ресурсов, разбросанных по всему миру. Результатом ее титанических усилий является постоянно обновляющийся иерархический каталог, на верхнем уровне собраны самые общие категории, такие как “бизнес ”, ”наука”, ”искусство” и т.п., а элементы самого нижнего уровня представляют собой ссылки на отдельные WWW-страницы и сервера вместе с кратким описанием их содержимого.

Гарантий того, что такой каталог действительно охватывает все содержимое WWW, никто не даст, однако возможная не полнота и даже однобокость подбора материалов с лихвой искупается там, что пока еще не под силу никакому компьютеру — осмысленность отбора.

Предметные каталоги предоставляют и возможность поиска по ключевым словам. Однако поиск этот происходит не в содержимом самих WWW-серверов, а в их кратких описаниях, хранящихся в каталоге.

Предметные каталоги Internet можно пересчитать буквально на пальцах, так как их создание и поддержка требуют огромных затрат. К наиболее известным относятся Yahoo, WWW Virtual Library, Galaxy и некоторые другие.

Yahoo.

Наиболее популярен у населения Internet каталог Yahoo. На первой же странице Yahoo, расположенной по адресу http://www.yahoo.com, вы получаете доступ к двум основным методом работы с каталогом — поиску по ключевым словам и иерархическому древу разделов.

Начав спуск по разделам каталога, вы увидите, что каждый раздел содержит точно такое же поле для ввода ключевых слов и кнопку Search, запускающую поиск.

Каждый раздел может включать в себя как перечисление входящих в него подразделов, так и собственно ссылки на страницы, относящиеся сразу ко всему разделу, с их краткими описаниями.

Вместо путешествия по дереву подраздела вы можете сразу попасть в нужное место каталога Yahoo с помощью поиска. Введя одно или несколько ключевых слов, разделенных пробелами, в строку поиска и нажав кнопку Search, вы получите список всего в Yahoo, что содержит в себе указанные ключевые слова. Этот список будет разделен на две части — “categories” и “sites”.

Если общее количество ссылок, возвращенных в результате поиска, превышает 25, список ссылок будет разбит на несколько частей.

Автоматическим поиском можно воспользоваться не только с главной страницы Yahoo, но и из любого подраздела; при этом специальный переключатель, расположенный под полем ввода ключевых слов, позволяет либо ограничить поиск текущим разделом и его подразделами, либо искать во всем каталоге (Черил, 1998).

Magellan.

Но не редко случается так, что выдаваемый машиной список очень велик и просмотреть его просто не реально. Выходом из этой ситуации может стать более строгий отбор информации, заносимой в каталог. Одна из самых известных систем такого рода — каталог Magellan по адресу: http://www.mckinley.com

Эта база данных содержит сведения о 80 тысячах WWW-страниц — что очень не много в сравнении с теми миллионами, которые существуют в сети. Однако если Yahoo в качестве описания ресурса использует одну-две строчки текста, то сотрудники системы Magellan на некоторые из страниц, заносимые в их базу данных, сами пишут небольшие рецензии, а также оценивают качество этих информационных ресурсов по пятибалльной шкале. По мимо базы рецензий, Magellan владеет так же собственным автоматическим индексом, для поиска в котором нужно перебросить переключатель под полем ввода в положение entire database.

Как правило запрос представляет собой одно или несколько ключевых слов, разделенных пробелами (Кирсанов, 1996).

Point.

Схожая по своим принципам служба фирмы Point (http://www.pointcom.com) вообще основной упор делает не на поиск, а на работу с тематическим каталогом.

Служба Point известна в сети тем, что ее сотрудники постоянно заняты оцениванием сетевых ресурсов и ведут списки тех узлов, которые они считают принадлежат к “лучшим пяти процентам WWW”.

Сама фирма Point Ведет общедоступную базу данных всех “пятипроцентных WWW-страниц, где о каждой можно прочитать подробную лицензию (Хоникарт, 1996).

Virtual Library.

Самым старым предметным каталогом WWW является каталог Virtual Library:

http://www.w3.org/hypertext/DataSources/bySubject/Overview.html

Эта система достаточно полно охватывает научную прослойку WWW - серверы университетов, лабораторий и учебных заведений.

Russia-On-Line Subject Guide.

Для пользователей в нашей стране определенный интерес может представлять тематический каталог Russia-On-Line Subject Guide, расположенный по адресу http://www.online.ru/rmain. Этот каталог содержит довольно пестрое собрание ссылок на зарубежные источники плюс тематический обзор российских и русскоязычных ресурсов WWW.

2.2.Автоматические индексы.

К проблеме поиска информации в Internet можно подойти и с другой стороны. Существуют программы в которые загрузили несколько тысяч общеизвестных URL-адресов. Будучи запущена на компьютере с доступом к WWW, эта программа начинает автоматически скачивать из сети документы по этим URL, причем из каждого нового документа она извлекает все содержащиеся в нем ссылки и добавляет их в свою базу адресов. Поскольку в конечном счете все WWW документы связаны между собой, рано или поздно такая программа обойдет весь Internet.

Разумеется, программа не может ни понять ни как либо классифицировать то, что она видит в сети. Программы такого типа называются роботами. Они ограничиваются сбором статистической информации и построением словоуказателей (индексов) по текстам документов. Собираемая роботом база данных — индекс — хранит в себе, попросту говоря, сведения о том в каких WWW-документах содержаться те или иные слова.

Именно такой автоматически собираемый индекс и лежит в основе поисковых систем второго рода, которые часто так и называют — автоматические индексы.

Автоматический индекс состоит из трех частей: программы-робота, собираемой этим роботом базы данных и интерфейса для поиска в этой базе, с которым работает пользователь. Все эти компоненты вполне могут функционировать без вмешательства человека.

Поскольку какая-либо классификация или оценивание материалов в системах такого рода отсутствуют, к ним следует прибегать только тогда, когда вы точно знаете ключевые слова, относящиеся к тому, что вам нужно, — скажем, фамилию человека или несколько достаточно редких терминов из соответствующей области. если же задать поиск по сколько-нибудь распространенным словам, то вам не хватит жизни, чтобы обойти все полученные в результате поиска URL-адреса, — к примеру, индекс системы Alta Vista содержит 11 миллиардов слов, извлеченных из 30 миллионов WWW-страниц.

Автоматических индексов WWW-страниц существует немало: WebCrawler, Lycos, Excite, Inktomi, Open Text и другие. Некоторые из них (например, Lycos) представляют собой более или менее удачный синтез предметного каталога и автоматического индекса.

Alta Vista.

Ее адрес http://altavista.digital.com . Эта система появилась в декабре 1995 года. Она один из самых больших по объему индексов из всех поисковых систем такого рода и самые мощные и гибкие правила построения запросов. Alta Vista понимает два разных языка запросов, довольно сильно отличающихся друг от друга. На первой странице Alta Vista вы видите бланк для простого запроса (Simple Search), а панель заголовка вверху страницы содержит кнопку Advanced Search, нажав которую, вы получите бланк для усложнения запроса.

Кроме WWW-страниц, Alta Vista ведет отдельный индекс для статей из более чем 14000 конференций Usenet (включая иерархию групп relcom.*).

Поиск Alta Vista: чтобы Alta Vista срабатывала на группе слов, только когда они стоят рядом, нужно заключить эту группу в кавычки. Если необходимо исключить из результата все документы, содержащие определенное слово, необходимо приписать это слово со знаком “минус”.

Слово без всякого знака действует в запросе точно так же, как и оно же со знаком “плюс”.

В отличие от Yahoo, по умолчанию Alta Vista ищет вхождения целых слов, т. е. заказанные термины должны стоять в документе обособленно, а не быть частью других цепочек символов. Если же вам нужно найти все вхождения слова, даже когда оно входит в состав других слов, пользуйтесь символом *. звездочка может стоять только в конце слова, а чтобы предотвратить обвальный поиск, дающий слишком много результатов, Alta Vista требует, чтобы слово, заканчивающееся на *, состояло не менее чем из 3 букв. Более того, символ * позволяет найти не любое окончание слова, а только не превышающее длину пяти символов и не содержащее заглавных букв или цифр.

Результаты поиска Alta Vista, как и Yahoo, выдает в виде списка ссылок на документы, но вместо описания каждого документа рядом с его заголовком вы увидите просто первые несколько строк его текста. Если найдено будет больше 10 документов, Alta Vista разобьет их список на страницы по 10 ссылок на каждой. Alta Vista сортирует ссылки так, чтобы на первом месте стояли “самые важные” документы с вашими ключевыми словами при определении степени важности учитывая следующие факторы:

  • входят ли ключевые слова в заголовок документов;

  • содержатся ли эти слова в первых нескольких строках документов;

  • насколько близки друг к другу в тексте обнаружены ключевые слова (Кирсанов, 1996).

Infoseek

Infoseek, вступивший в эксплуатацию в конце 19996 года, несколько напоминает AltaVista, однако объем обследуемых им полных текстов документов еще не превышает 30 млн. Web-страниц. Адрес: http://www.infoseek.com. Это довольно мощная система, обладающая высокой скоростью и простой в обращении. Возможности составления запроса почти такие же, как и в AltaVista, но не столь богатые. При почти полном сохранении значений знаков «плюс», «минус» и «кавычек», чувствительности к разнице заглавных и строчных букв и возможности ограничивать поиск фрагментами Web- страниц, Infoseek пока не обладает способностью определять рядом стоящие термины (нет оператора NEAR), ограничивать поиск по дате обновления источника и, главное, усекать окончания ключевых терминов.

Но данная поисковая система содержит массу факультативных функций. К таковым относится, например, возможность определять количество ссылок в WWW на конкретную страницу, то есть судить, насколько она популярна или же, наоборот, выяснить, сколько ссылок на внешние страницы содержится на данном узле, вернее, сколько из них отражены в индексных файлах Ultraseek. Использование специальной функции Imageseek позволяет находить в Internet изображения (рисунки, фотографии) на определенную тему. Infoseek имеет также один из лучших справочников ресурсов Сети.

HotBot

Одним из мощных поисковых средств в World Wide Webможно отнести HotBot, содержащий сведения о полных текстах 110 млн. страниц. Адрес: http:// www.hotbot.com. HotBot принадлежит к новейшим системам, поэтому его углубленный поиск дает поразительно широкие возможности для детализации запроса. Это достигается за счет использования многоступенчатого меню, предлагающего различные варианты составления поискового предписания. Можно осуществить поиск по наличию в документе одного или нескольких терминов, поиск по отдельной фазе, поиск конкретного лица или ссылки на определенный электронный адрес. Для большей детализации запроса возможно применение условий SHOULD (может содержать), MUST (должен обязательно содержать), MUST NOT (не должен содержать) по отношению к каким-либо понятиям. Кроме того, HotBot представляет возможностьограничить поиск по дате создания или последнего обновления документа, по георафическому положению сервера. Верхом сервисных возможностей является поиск документов, содержащих определенные типы файлов, например аудио или видио. Для этого надо лишь сделать отметку в специальном пункте меню запроса (Куприянова, 1998).

WebCrawler.

Это еще один инструмент поиска типа search-bot (поисковый робот). Адрес: http://www.webcrawler.com . Поиск здесь очень прост. Введите как можно больше ключевых слов в поле поиска, нажмите Search.

Lycos.

Это большая база данных индексирующая содержание всех найденных ею страниц Web. Адрес: http://www.lycos.com .

World Wide Web Worm.

Вы найдете этот инструмент поиска на http://www.cs.colorado.edu/home/mcbryan/wwww.html . Это еще один обширный указатель участков Web.

В каждом конкретном случае целесообразно использовать свой инструмент поиска. Вам придется пытаться проводить поиск при помощи одного инструмента и, если вы не получили результатов, переходить к другому. Но все же каким инструментом пользоваться? В первую очередь лучше воспользоваться тематическим каталогом типа Yahoo, размер у них сравнительно небольшой, зато велика скорость. Если найти необходимую информацию не удалось, это говорит о том, что вы интересуетесь слишком узкой темой, или же с вашей темой плохо соотносятся выбранные вами ключевые слова. Это не значит, что нужной информации в WWW нет — просто найти ее будет сложнее. Для ее поиска вам прийдется воспользоваться более примитивными, более автоматическими и потому более всеобъемлющими системами типа Alta Vista (Кент, 1996).

2.3.Российские поисковые системы

Поисковые системы глобального масштаба свое основное внимание концентрируют на англоязычных ресурсах Сети. Задачу поиска информации на серверах в пределах отдельных стран выполняют системы локального характера, специально адаптированные к особенностям конкретных языков. Существуют подобные поисковые средства и в России. Всех их объединяет возможность обработки материалов во всех кириллических кодировках. Однако по мощности и уровню предлагаемого сервиса русскоязычные поисковые системы значительно отличаются друг от друга.

К лидирующей группе в настоящее время относятся системы Rambler, «Апорт» и «Яndex».

Rambler

Среди фаворитов выделяется Rambler (http://www.rambler.ru), ставший первой профессиональной отечественной поисковой системой. Эта система обеспечивает полнотекстовый поиск на 3 млн. страниц, расположенных на более чем 15 тыс. Web-узлах Росси и стран ближнего зарубежья. Помимо Web-серверов, обследуется также недельный архив телеконференций иерархии relcom.

Rambler обладает близким к оптимальному выводом результатов поиска. Даже в нормальной форме ссылка на найденный объектвключает полную информацию. Система сконструирована таким образом, что один и тот же документ в различных кодировках показывается в различных кодировках показываются только один раз, а его конкретные адреса суммируются в списке, идущим за резюме.это сокращает время на аналмз полученных результатов из-за отсутствия дублирования одних и тех же документов.

Главный недостаток Rambler заключается в невозможности осуществлять поиск по целой фазе или хотя бы указывать в запросах предельное расстояние искомых терминов друг от друга. Случайное сочетание совершенно несвязанных слов приводит к выдаче ссылок на документы, совершенно не релевантны запросу.

Апорт

Поисковая система Апорт (http://www.апорт.ru) снабжена массой различных функций, относящих ее к числу самых удобных для пользователя.

Одно из главных достоинств Апорт состоит в широких возможностях составления запроса. Помимо традиционных операторов “и” и “или”, поиска по целой фазе, система способна вычленять сочетания терминов, расположенных в тексте рядом друг с другом. Апорт предлагает возможность автоматического перевода запроса с русского на английский язык и наоборот. И Rambler, и Апорт способны выделять один и тот же документ в различных кодировках и выдавать ссылку на него лишь раз, перечисляя конкретные адреса в списке URL. К сожалению, при этом вовремя не удаляются сведения об устаревших версиях одной и той же страницы, которые перечисляются как существующие, имея разницу лишь в дате обновления. Еще одним недостатком этой системы является не всегда корректная обработка названий страниц, из-за чего в результатах поиска часто указывается «документ без названия».

Яndex

Поисковая система Яndex (http://www.yandex.ru) , где помимо серверов доменов «ru» и «su» Яndex индексирует содержание зарубежных русскоязычных Web-узлов.

Главной отличительной чертой этой системы является глубокий морфологический анализ обрабатываемых терминов. Мощнейшая лингвистика позволяет учесть практически все возможные оттенки употребления ключевых слов и составить запрос максимально точно. Яndex обладает хорошим механизмом распознавания одного документа в нескольких кодировках или на зеркальных серверах.

Вслед за лидирующей российской тройкой идут еще несколько поисковых средств, среди которых “Русская машина поиска”(http://search.interrussia.com), «TELA-поиск» (http://tela.dux.ru/) и Russian Internet Search (http://www.search.ru). Пока все эти серверы не отличаются ни широтой поиска, ни комфортностью, и могут быть использованы лишь в качестве дополнения к ведущим поисковым средствам.

Поисковый сервис в русскоязычном блоке Internet, также как и во всем мире, развивается стремительно. Нет сомнения, что в ближайшем будущем показатели существующих систем повысятся, появятся новые поколения поисковых средств, предоставляющих пользователям еще большие возможности (Куприянова, 1998).

Список литературы

1. Дмитрий Кирсанов Понятный Internet / -М. Символ-Плюс, 1996

2. Джери Хоникарт Internet без проблем /- М. 1996

3. Питер Кент Internet / М. 1996

4. Джон Левин Секреты Internet / Киев 1996

5. В. Степанов С компьютером на ты / - М., 1998

6. Кирк Черил Internet. Книга ответов / М. 1998

7. Г. И. Куприянова Информационные ресурсы Internet / М., 1998

nreferat.ru

Реферат : Что такое интернет?

МИНИСТЕРСТВО ОБЩЕГО И ПРОФЕССИОНАЛЬНОГО

ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

ДАЛЬНЕВОСТОЧНЫЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Кафедра информатики

Что такое интернет

Аспиранта второго

года обучения

Незнановой С. Ю.

03.00.10.(ихтиология)

Научный руководитель

профессор, д.б.н.

Иванков В. Н.

Владивосток

2002

Содержание
Введение
  1. Основные протоколы в Internet и поиск в них

  2. Инструменты поиска

    1. Тематические каталоги

    2. Автоматические индексы

    3. Российские системы поиска

Список литературы

Введение.

Одно из главных отличий Интернета от всего остального, что связано с компьютерами, — это то, что для успешной работы с ним, вообще говоря, не нужно никаких книг. Сам Интернет может служить и справочником, и учебником, и энциклопе­дией самого себя. Однако на начальном этапе, как мне кажется, польза от книги, внятно и доступно излагающей основы, может быть весьма значительной. Именно такую книгу я и постарался написать. Но прежде чем вы познакомитесь с ней поближе, да­вайте попробуем ответить на самый главный вопрос, который, вероятно, вы себе уже задавали:

Интернет: что же это, наконец, такое

Более или менее научные (или просто наукообразные) опреде­ления Интернета, которыми заполнены книги и статьи на эту тему, конечно, имеют свою ценность. Но для наших целей пока достаточно самого простого объяснения: Интернет — это мно­жество компьютеров, соединенных друг с другом каналами связи, плюс набор стандартных правил, по которым они обме­ниваются информацией. При этом сами каналы связи, по­жалуй, даже менее важны, чем правила передачи данных по ним, называемые в Интернете протоколами. Если хотя бы два компьютера взаимодействуют по одному из таких протоко­лов — это уже настоящий Интернет.

Изобретение и совершенствование модемов — специальных устройств, по­зволяющих компьютеру посылать информацию по телефону, — открыло двери в Интернет огромному количеству людей, у ко­торых нет. никакого специального сетевого оборудования, а есть лишь персональный компьютер и телефонная розетка побли­зости.

Как сам Интернет, так и модемы для персональных компью­теров существуют уже довольно долго. Однако лишь совсем не­давно — около 1990 года — Интернет набрал, наконец крити­ческую массу пользователей и ресурсов, необходимую для про­исходящей на наших глазах сетевой революции. Скоростные модемы, позволяющие обычным пользователям персональных компьютеров без ограничений наслаждаться всеми благами Ин­тернета, появились еще позднее. А система World Wide Web (WWW, или «Всемирная паутина»), изобретенная в 1993 г. и бывшая поначалу лишь одной из многих составных частей сети, заняла доминирующее положение и стала определять лицо Ин­тернета буквально в последние год-два. Так или иначе, все­мирный интернетовский бум сейчас в самом разгаре — и вам очень повезло, что вы почти не опоздали к началу представ­ления.

Интернет — это, прежде всего огромное множество компьютеров и программ. Среди последних вы найдете не только такие, ко­торые умеют хорошо решать ваши конкретные задачи, но и го­раздо больше таких, чьи способности вам, вероятно, поначалу будет сложно даже представить. Выход в Интернет дает вам уникальную возможность, каким бы несовершенным ни был ваш компьютер, заглянуть в двадцать первый век и самостоя­тельно освоиться с такими понятиями, как «всемирный кибер-социум», «виртуальные деньги», «информационная среда оби­тания» и т. п., — словом, со всем тем, о чем так любят писать сейчас журналисты.

Однако это лишь часть ответа на вопрос «что такое Интернет». Интернет сегодня — это не только огромное количество компьютеров, но еще и невероятное количество людей, для ко­торых сеть является принципиально новым способом общения, почти не имеющим аналогов в материальном мире. Человек — существо социальное, и общение с себе подобными — одна из первейших его потребностей. Пожалуй, до сих пор еще ни одно техническое изобретение (если не считать телефона) не произ­водило такого переворота в этом древнем как мир занятии — об­щении человека с человеком.

Конечно, что именно заинтересует вас в Интернете в первую очередь — люди или компьютеры, — зависит только от вас. Древняя метафора книги как модели мироздания, пожалуй, за­служивает пересмотра — теперь на роль такой модели гораздо лучше подходит компьютер. Когда же речь идет о миллионах компьютеров и их пользователей во всем мире, связанных в единую сеть, метафора эта уже перестает быть просто мета­форой. Вот почему не будет преувеличением сказать, что, вы­ходя в Интернет, вы делаете для себя доступным целый мир.

1. Основные протоколы в Internet и поиск в них.

Internet содержит громадное количество информации, по этому в нем трудно найти то что нужно, если не знать где искать. Место нахождения (или адреса) каждого ресурса определяет его URL . В URL содержится тип протокола, указывающий на какой сервер осуществляется доступ: на WWW( на который указывает запись: http), Gopher, ftp, telnet, или WAIS, это зависит от того какой тип информации вы будете передавать. Сетевой протокол — совокупность четко определенных правил: как запрашивать, оформлять и высылать по сети данную разновидность информации (Кент, 1996).

telnet

К сети Internet присоединены миллионы компьютеров и многие из них обладают интересными возможностями.

Оказывается, вполне осуществимо добраться до этих компьютеров чтобы посмотреть имеющиеся в них базы данных и программы. Специальная программа telnet позволяет превратить ваш компьютер в клиента telnet для доступа к данным и программам в многочисленных серверах telnet. Например исследователь регулярно может работать на нескольких компьютерах, администраторы которых назначают ему специальное имя и пароль.

Сам по себе telnet — просто средство связи; ни какого-то собственного интерфейса, ни возможностей поиска он не предоставляет.

Связавшись с помощью telnet с удаленной машиной и введя в поле запроса свое входное имя (login) и пароль (password) вы дальше общаетесь именно с этой машиной и программами на ней, а telnet заботится лишь о поддержании связи между вами (Левин, 1996).

Разумеется, многие хранилища информации, которые первоначально обслуживались специальными программами с доступом по telnet теперь можно перевести на WWW , что не редко и делается. Однако остались и такие которые по прежнему предоставляют свои услуги только по telnet (особенно среди каталогов и информационных служб библиотек ).

Стандартизированная ссылка на telnet соединение с некоторым узлом Internet ( т.е. URL- адрес этого соединения) выглядит так:

telnet://< адрес сервера >

FTP

Практически вся информация в компьютерном мире хранится в виде файлов. По этому еще на самой заре Internet появилось специальное средство для обмена файлами по сети — сетевой протокол FTP (File Transfer Protocol).

Количество файлов, доступных на узлах всего мира по анонимному FTP измеряется астрономическими цифрами и постоянно растет. К тому же Word Wide Web позволяет без какой-либо переделки существующих FTP архивов, снабжать их описаниями любой степени детальности и удобным гипертекстовым интерфейсом.

Но как узнать куда обращаться в поисках нужного файла?

Archie.

Поиск по имени файла на всех анонимных FTP-узлах мира можно осуществить с помощью системы Archie. Она разработана несколькими программистами из университета МакГила в Канаде и осуществляет индексирование станций FTP, показывая доступные в каждой станции файлы. Archie сообщает о нескольких миллионах файлов находящихся в более тысячи станций FTP, и предоставляет удивительно быстрый способ поиска того места, куда нужно направиться для получения интересующего вас файла. Поиск в базе данных сервера Archie производится с помощью ключевых слов, которые в данном случае представляют собой просто имена файлов или фрагменты имен.

Сейчас Archie доступен через WWW. Это WWW страница с бланком в котором указываются ключевые слова и опции поиска.

Хотя имя файла почти всегда имеет некое отношение к его содержимому, пользоваться Archie для тематического поиска программ не стоит. Эта система будет полезна, если вы действительно знаете имя нужного файла или часть имени. С другой стороны если вы ищете программу, которая имеет общепринятое сокращенное название, то есть некоторая вероятность что это сокращение будет присутствовать и в имени файла, так что можно попробовать найти такой файл с помощью Archie. Результаты поиска представляют собой список FTP-узлов и полных имен файлов на этих узлах. Имя файла служит ссылкой на этот файл, так что щелчок по имени позволит сразу же получить файл с данного узла. А доменый адрес FTP-архива выделенный крупным жирным шрифтом, перенесет вас в исходный каталог файловой системы на этом архиве.

Archie не делит свой список на страницы и его удобнее всего просматривать прямо по мере получения (Хоникарт, 1996).

URL-адрес, указывающий на FTP-соединение, должен, как минимум, включать в себя слово “ ftp” в качестве левой части и адрес узла в правой:

ftp://< адрес сервера >.

WAIS

Почти все информационные ресурсы Internet предоставляют возможность автоматического поиска, но лишь в одной из них — в системе WAIS ( Wide Area Information Server, глобальный информационный сервер) — поиск по ключевым словам, является основным методом доступа к информации.

Система WAIS представляет собой огромную распределенную базу данных, т.е. отдельные части этой базы данных расположены на разных узлах сети по всему миру. Программа-клиент для работы с серверами WAIS не только умеет общаться с ними по специальному протоколу, но и хранит список всех баз данных WAIS с их адресами и названиями, а иногда и с краткими описаниями. Там можно найти архивы телеконференций, всевозможные каталоги, справочники, сборники научных статей и рефератов, индексы и словоуказатели и многое другое. Практически любая информация, для которой база данных является удобной формой представлениями которая достаточно интересна для широкой аудитории, может быть представлена в WAIS.

База данных WAIS настолько велика, что простое “листание” записей — крайне бесперспективный способ доступа к информации. Поэтому в WAIS применяется довольно сложный метод поиска по ключевым словам и фразам. Документы, полученные в результате поиска, сортируются WAIS-сервером по количеству вхождения в них ключевых слов и по тому, насколько полно в каждом из них представлен весь набор заказанных ключевых слов. Такая система способна давать хорошие результаты, особенно если разбить процесс поиска на несколько этапов.

Первым этапом поиска обычно является запрос специальной в базе данных под названием “directory-of-servers ”, которая содержит небольшие по объему описания (рефераты) всех остальных баз WAIS. При этом лучше указывать не те ключевые слова, которые вас в конечном счете интересуют, а те общие понятия, относящиеся к вашей области знаний.

Выбрав на первом этапе одну или несколько баз, можно приступить к поиску собственно документов — что также можно делать в несколько заходов, знакомясь после каждого поиска с результатами и изменяя список ключевых слов, пока не будет найден нужный документ. Кроме того WAIS обладает одним полезным свойством: если на очередном этапе поиска вы нашли документ, содержимое которого особенно близко к тому, что вы ищите, то его можно добавить к списку релевантных документов. В результате на следующем этапе WAIS найдет документы, не только содержащие набор ваших ключевых слов, но и похожие по своему словарному составу на те тексты, которые вы указали как наиболее подходящие.

Хотя Netscape способен работать с серверами WAIS, для этого он должен знать адрес особого прокси-сервера для протокола WAIS, которого вашего провайдера может не оказаться. Специальные WAIS-клиенты, работающие в том числе и под Windows, не только удобные для интерактивного поиска в базах данных, но и позволяет обходиться без услуг какого-либо сервера-посредника(Левин, 1996).

URL-адрес для WAIS выглядит как:

wais:// < адрес сервера>/<название базы>

Gopher

Каждый из рассмотренных до сих пор интернетовских протоколов вполне мог бы существовать сам по себе: telnet предоставляет доступ к программам, FTP — к файлам, WAIS — к базам данных. Все эти системы создавались и развивались почти независимо друг от друга и ставили перед собой конкретную цель — построить механизм доступа к одному определенному виду ресурсов.

Однако по мере того как Internet рос и усложнялся, он сам подталкивал людей к мысли, что информация по природе своей едина и что не слишком разумно делить ее на разные “виды ресурсов” с непохожими методами доступа. К концу 80-ых годов идея нового универсального средства работы с разнородной информацией носилась в воздухе.

Первой системой, призванной воплотить в жизнь эти мечты стал Gopher, появившийся на свет 1991 году в американском университете штата Меннесота. Фундаментальным понятием, заложенным в ее основание была структура вложенных друг в друга меню (Кирсанов,1996).

Связавшись Gopher- клиентом с одним из Gopher-серверов, вы в первую очередь попадаете в корневое, главное меню этого сервера. Сориентировавшись в его содержимом и переходя далее из одного подменю в другое, можно заняться собственно поиском информации. Информация в системе Gopher организована строго иерархически, “от общего к частному”. На каждом шаге сервер посылает вашему Gopher - клиенту не только содержимое очередного меню, но и служебную информацию о том, где находятся объекты, соответствующие пунктам этого меню. Клиент выводит на экран только само перечисление пунктов, но когда вы выберите один из них, он, сверившись с имеющейся у него информацией, либо пошлет на какой-то из Gopher - серверов запрос на выдачу следующего меню, либо попытается установить FTP- или telnet- соединение с некоторым узлом Internet.

Очевидно из всех информационных инструментов Internet Gopher больше всего похож на WWW — обе эти системы призваны служить оболочкой с разнородными ресурсами. Однако Gopher лишен тех богатых изобразительных средств, которые делают WWW не только информационным каталогом, но и новым средством массовой информации и даже новым жанром искусства. Можно сказать, что Gopher является “подмножеством” WWW — что очень упрощает интегрирование самого Gopher как одного из видов ресурсов в WWW. Практически все что сказано о работе с Gopher - клиентом справедливо и для путешествия по системе Gopher с помощью броузера WWW (Хоникарт, 1996).

URL одного из пунктов Gopher - меню состоит из адреса Gopher- сервера и перечисленных тех пунктов меню, которые приведут вас к исходному пункту:

gopher://< адрес сервера>/< пункт меню>

WWW

Несмотря на то, что в первые годы своего существования Gopher завоевал большую популярность, назревала нужда в какой-то более простой и в тоже время максимально универсальной системе, в которой связи между ресурсами были бы более свободными и ассоциативными. Такая система была разработана в 1993 году и названа World Wide Web (WWW). Система WWW строиться на понятии гипертекста, или, точнее гипермедиа. Гипертекст — это текст составные части которого связаны друг с другом и с другими текстами с помощью ссылок. Гипермедиа — это то что получится из гипертекста, если заменить в его определении слово “текст” на “любые виды информации”: графические изображения, видео, звук и т.д.

World Wide Web означает буквально “всемирная паутина”. Почему она так называется. Как ясно из названия, она глобальна. Вы не всегда знаете в какой части света находится компьютер, к которому вы подключаетесь. Вы можете начинать читать страницу Web в Далласе, затем перейти в Австралию, и все это по одному нажатию кнопки мыши. WWW похожа на паутину. Это сложная информационная сеть, соединенная гипермедиа связями. WWW позволяет не отказываться от информационных ресурсов уже накопленных в Internet, доступных с помощью других средств — FTP, telnet и Gopher. Больше того, работа с этими ресурсами через WWW настолько удобна, что, скажем, FTP-клиенты, бывшие когда-то отдельным классом программ, теперь используются лишь немногими.

И все-таки главное в World Wide Web — это не удобства доступа к FTP- архива и Gopher-меню. Большинство серверов системы WWW предлагают информацию, которая без WWW вряд ли вообще когда- либо попала бы в сеть. Быстрота создания и обновления, богатые изобразительные возможности в сочетании с легкостью доступа и огромной аудиторией сделали WWW новым средством массовой информации. Запуск WWW-серрверов и создание WWW-страниц уже превратилось из повальной моды в новый бизнес — со всем что свойственно современному бизнесу: платой за квадратные сантиметры рекламной площади.

С другой стороны, быстрому распространению системы, столь естественно объединяющей разнородные ресурсы, способствовало не в последнюю очередь ее зарождение не в недрах коммерческой фирмы, а в научном учреждении — Европейской лаборатории физики частиц, сотрудники которой не стали делать секретов из своей разработки и даже не попытались на ней разбогатеть.

К счастью, сама природа WWW как прежде всего средства поиска и организации информации позволяет надеяться, что это замечательное изобретение не превратиться в инструмент одной лишь коммерции и рекламы (Кирсанов, 1996).

Серверы и клиенты WWW связываются между собой по специальному протоколу HTTP (Hyper Transfer Protocol, протокол передачи гипертекста). URL для WWW выглядит как :

http://< адрес сервера>

Переходить от одной странице Web к другой — интересный способ исследования World Wide Web, однако вам рано или поздно понадобится найти что-то конкретное. Но таким образом это сделать не удастся. В Internet имеются специальные инструменты Web-поиска.

Инструменты поиска в WWW.

Инструментов поиска информации в Internet, построенных на разных принципах и преследующих разные цели, существует немало. Но все их объединяет то, что они располагаются на специально выделенных сетевых компьютерах с мощными каналами связи, обслуживают ежеминутно огромное количество посетителей и требуют от своих владельцев значительных затрат на поддержку и обновление. Тем не менее, почти все они отвечают на запросы пользователей совершенно бескорыстно, а платят за это удовольствие спонсоры и рекламодатели. По масштабам влияния на сетевое сообщество поисковые системы, без сомнения, являются одним из краеугольных камней Internet.

Классификацию поисковых систем удобнее всего строить на основании того, на сколько автоматизирован в них сбор и обработка информации, предоставляемой пользователям, — иначе говоря, кто набирает базу данных, в которой производится поиск: люди или сами компьютеры.

2. Инструменты поиска

Условно инструменты поиска подразделяются на поисковые средства справочного типа (directories) и поисковые системы в чистом виде (search engines).

2.1 Тематические каталоги

Поисковые инструменты первого типа чаще всего называют предметными, или тематическими каталогами. Компания, владеющая таким каталогом, непрерывно ведет огромную работу, исследуя, описывая, каталогизируя и раскладывая по полочкам содержимое WWW-серверов и других сетевых ресурсов, разбросанных по всему миру. Результатом ее титанических усилий является постоянно обновляющийся иерархический каталог, на верхнем уровне собраны самые общие категории, такие как “бизнес ”, ”наука”, ”искусство” и т.п., а элементы самого нижнего уровня представляют собой ссылки на отдельные WWW-страницы и сервера вместе с кратким описанием их содержимого.

Гарантий того, что такой каталог действительно охватывает все содержимое WWW, никто не даст, однако возможная не полнота и даже однобокость подбора материалов с лихвой искупается там, что пока еще не под силу никакому компьютеру — осмысленность отбора.

Предметные каталоги предоставляют и возможность поиска по ключевым словам. Однако поиск этот происходит не в содержимом самих WWW-серверов, а в их кратких описаниях, хранящихся в каталоге.

Предметные каталоги Internet можно пересчитать буквально на пальцах, так как их создание и поддержка требуют огромных затрат. К наиболее известным относятся Yahoo, WWW Virtual Library, Galaxy и некоторые другие.

Yahoo.

Наиболее популярен у населения Internet каталог Yahoo. На первой же странице Yahoo, расположенной по адресу http://www.yahoo.com, вы получаете доступ к двум основным методом работы с каталогом — поиску по ключевым словам и иерархическому древу разделов.

Начав спуск по разделам каталога, вы увидите, что каждый раздел содержит точно такое же поле для ввода ключевых слов и кнопку Search, запускающую поиск.

Каждый раздел может включать в себя как перечисление входящих в него подразделов, так и собственно ссылки на страницы, относящиеся сразу ко всему разделу, с их краткими описаниями.

Вместо путешествия по дереву подраздела вы можете сразу попасть в нужное место каталога Yahoo с помощью поиска. Введя одно или несколько ключевых слов, разделенных пробелами, в строку поиска и нажав кнопку Search, вы получите список всего в Yahoo, что содержит в себе указанные ключевые слова. Этот список будет разделен на две части — “categories” и “sites”.

Если общее количество ссылок, возвращенных в результате поиска, превышает 25, список ссылок будет разбит на несколько частей.

Автоматическим поиском можно воспользоваться не только с главной страницы Yahoo, но и из любого подраздела; при этом специальный переключатель, расположенный под полем ввода ключевых слов, позволяет либо ограничить поиск текущим разделом и его подразделами, либо искать во всем каталоге (Черил, 1998).

Magellan.

Но не редко случается так, что выдаваемый машиной список очень велик и просмотреть его просто не реально. Выходом из этой ситуации может стать более строгий отбор информации, заносимой в каталог. Одна из самых известных систем такого рода — каталог Magellan по адресу: http://www.mckinley.com

Эта база данных содержит сведения о 80 тысячах WWW-страниц — что очень не много в сравнении с теми миллионами, которые существуют в сети. Однако если Yahoo в качестве описания ресурса использует одну-две строчки текста, то сотрудники системы Magellan на некоторые из страниц, заносимые в их базу данных, сами пишут небольшие рецензии, а также оценивают качество этих информационных ресурсов по пятибалльной шкале. По мимо базы рецензий, Magellan владеет так же собственным автоматическим индексом, для поиска в котором нужно перебросить переключатель под полем ввода в положение entire database.

Как правило запрос представляет собой одно или несколько ключевых слов, разделенных пробелами (Кирсанов, 1996).

Point.

Схожая по своим принципам служба фирмы Point (http://www.pointcom.com) вообще основной упор делает не на поиск, а на работу с тематическим каталогом.

Служба Point известна в сети тем, что ее сотрудники постоянно заняты оцениванием сетевых ресурсов и ведут списки тех узлов, которые они считают принадлежат к “лучшим пяти процентам WWW”.

Сама фирма Point Ведет общедоступную базу данных всех “пятипроцентных WWW-страниц, где о каждой можно прочитать подробную лицензию (Хоникарт, 1996).

Virtual Library.

Самым старым предметным каталогом WWW является каталог Virtual Library:

http://www.w3.org/hypertext/DataSources/bySubject/Overview.html

Эта система достаточно полно охватывает научную прослойку WWW - серверы университетов, лабораторий и учебных заведений.

Russia-On-Line Subject Guide.

Для пользователей в нашей стране определенный интерес может представлять тематический каталог Russia-On-Line Subject Guide, расположенный по адресу http://www.online.ru/rmain. Этот каталог содержит довольно пестрое собрание ссылок на зарубежные источники плюс тематический обзор российских и русскоязычных ресурсов WWW.

2.2.Автоматические индексы.

К проблеме поиска информации в Internet можно подойти и с другой стороны. Существуют программы в которые загрузили несколько тысяч общеизвестных URL-адресов. Будучи запущена на компьютере с доступом к WWW, эта программа начинает автоматически скачивать из сети документы по этим URL, причем из каждого нового документа она извлекает все содержащиеся в нем ссылки и добавляет их в свою базу адресов. Поскольку в конечном счете все WWW документы связаны между собой, рано или поздно такая программа обойдет весь Internet.

Разумеется, программа не может ни понять ни как либо классифицировать то, что она видит в сети. Программы такого типа называются роботами. Они ограничиваются сбором статистической информации и построением словоуказателей (индексов) по текстам документов. Собираемая роботом база данных — индекс — хранит в себе, попросту говоря, сведения о том в каких WWW-документах содержаться те или иные слова.

Именно такой автоматически собираемый индекс и лежит в основе поисковых систем второго рода, которые часто так и называют — автоматические индексы.

Автоматический индекс состоит из трех частей: программы-робота, собираемой этим роботом базы данных и интерфейса для поиска в этой базе, с которым работает пользователь. Все эти компоненты вполне могут функционировать без вмешательства человека.

Поскольку какая-либо классификация или оценивание материалов в системах такого рода отсутствуют, к ним следует прибегать только тогда, когда вы точно знаете ключевые слова, относящиеся к тому, что вам нужно, — скажем, фамилию человека или несколько достаточно редких терминов из соответствующей области. если же задать поиск по сколько-нибудь распространенным словам, то вам не хватит жизни, чтобы обойти все полученные в результате поиска URL-адреса, — к примеру, индекс системы Alta Vista содержит 11 миллиардов слов, извлеченных из 30 миллионов WWW-страниц.

Автоматических индексов WWW-страниц существует немало: WebCrawler, Lycos, Excite, Inktomi, Open Text и другие. Некоторые из них (например, Lycos) представляют собой более или менее удачный синтез предметного каталога и автоматического индекса.

Alta Vista.

Ее адрес http://altavista.digital.com . Эта система появилась в декабре 1995 года. Она один из самых больших по объему индексов из всех поисковых систем такого рода и самые мощные и гибкие правила построения запросов. Alta Vista понимает два разных языка запросов, довольно сильно отличающихся друг от друга. На первой странице Alta Vista вы видите бланк для простого запроса (Simple Search), а панель заголовка вверху страницы содержит кнопку Advanced Search, нажав которую, вы получите бланк для усложнения запроса.

Кроме WWW-страниц, Alta Vista ведет отдельный индекс для статей из более чем 14000 конференций Usenet (включая иерархию групп relcom.*).

Поиск Alta Vista: чтобы Alta Vista срабатывала на группе слов, только когда они стоят рядом, нужно заключить эту группу в кавычки. Если необходимо исключить из результата все документы, содержащие определенное слово, необходимо приписать это слово со знаком “минус”.

Слово без всякого знака действует в запросе точно так же, как и оно же со знаком “плюс”.

В отличие от Yahoo, по умолчанию Alta Vista ищет вхождения целых слов, т. е. заказанные термины должны стоять в документе обособленно, а не быть частью других цепочек символов. Если же вам нужно найти все вхождения слова, даже когда оно входит в состав других слов, пользуйтесь символом *. звездочка может стоять только в конце слова, а чтобы предотвратить обвальный поиск, дающий слишком много результатов, Alta Vista требует, чтобы слово, заканчивающееся на *, состояло не менее чем из 3 букв. Более того, символ * позволяет найти не любое окончание слова, а только не превышающее длину пяти символов и не содержащее заглавных букв или цифр.

Результаты поиска Alta Vista, как и Yahoo, выдает в виде списка ссылок на документы, но вместо описания каждого документа рядом с его заголовком вы увидите просто первые несколько строк его текста. Если найдено будет больше 10 документов, Alta Vista разобьет их список на страницы по 10 ссылок на каждой. Alta Vista сортирует ссылки так, чтобы на первом месте стояли “самые важные” документы с вашими ключевыми словами при определении степени важности учитывая следующие факторы:

  1. входят ли ключевые слова в заголовок документов;

  2. содержатся ли эти слова в первых нескольких строках документов;

  3. насколько близки друг к другу в тексте обнаружены ключевые слова (Кирсанов, 1996).

Infoseek

Infoseek, вступивший в эксплуатацию в конце 19996 года, несколько напоминает Alta Vista, однако объем обследуемых им полных текстов документов еще не превышает 30 млн. Web-страниц. Адрес: http://www.infoseek.com. Это довольно мощная система, обладающая высокой скоростью и простой в обращении. Возможности составления запроса почти такие же, как и в Alta Vista, но не столь богатые. При почти полном сохранении значений знаков «плюс», «минус» и «кавычек», чувствительности к разнице заглавных и строчных букв и возможности ограничивать поиск фрагментами Web- страниц, Infoseek пока не обладает способностью определять рядом стоящие термины (нет оператора NEAR), ограничивать поиск по дате обновления источника и, главное, усекать окончания ключевых терминов.

Но данная поисковая система содержит массу факультативных функций. К таковым относится, например, возможность определять количество ссылок в WWW на конкретную страницу, то есть судить, насколько она популярна или же, наоборот, выяснить, сколько ссылок на внешние страницы содержится на данном узле, вернее, сколько из них отражены в индексных файлах Ultraseek. Использование специальной функции Imageseek позволяет находить в Internet изображения (рисунки, фотографии) на определенную тему. Infoseek имеет также один из лучших справочников ресурсов Сети.

HotBot

Одним из мощных поисковых средств в World Wide Webможно отнести HotBot, содержащий сведения о полных текстах 110 млн. страниц. Адрес: http:// www.hotbot.com. HotBot принадлежит к новейшим системам, поэтому его углубленный поиск дает поразительно широкие возможности для детализации запроса. Это достигается за счет использования многоступенчатого меню, предлагающего различные варианты составления поискового предписания. Можно осуществить поиск по наличию в документе одного или нескольких терминов, поиск по отдельной фазе, поиск конкретного лица или ссылки на определенный электронный адрес. Для большей детализации запроса возможно применение условий SHOULD (может содержать), MUST (должен обязательно содержать), MUST NOT (не должен содержать) по отношению к каким-либо понятиям. Кроме того, HotBot представляет возможностьограничить поиск по дате создания или последнего обновления документа, по георафическому положению сервера. Верхом сервисных возможностей является поиск документов, содержащих определенные типы файлов, например аудио или видио. Для этого надо лишь сделать отметку в специальном пункте меню запроса (Куприянова, 1998).

WebCrawler.

Это еще один инструмент поиска типа search-bot (поисковый робот). Адрес: http://www.webcrawler.com . Поиск здесь очень прост. Введите как можно больше ключевых слов в поле поиска, нажмите Search.

Lycos.

Это большая база данных индексирующая содержание всех найденных ею страниц Web. Адрес: http://www.lycos.com .

World Wide Web Worm.

Вы найдете этот инструмент поиска на http://www.cs.colorado.edu/home/mcbryan/wwww.html . Это еще один обширный указатель участков Web.

В каждом конкретном случае целесообразно использовать свой инструмент поиска. Вам придется пытаться проводить поиск при помощи одного инструмента и, если вы не получили результатов, переходить к другому. Но все же каким инструментом пользоваться? В первую очередь лучше воспользоваться тематическим каталогом типа Yahoo, размер у них сравнительно небольшой, зато велика скорость. Если найти необходимую информацию не удалось, это говорит о том, что вы интересуетесь слишком узкой темой, или же с вашей темой плохо соотносятся выбранные вами ключевые слова. Это не значит, что нужной информации в WWW нет — просто найти ее будет сложнее. Для ее поиска вам прийдется воспользоваться более примитивными, более автоматическими и потому более всеобъемлющими системами типа Alta Vista (Кент, 1996).

2.3.Российские поисковые системы

Поисковые системы глобального масштаба свое основное внимание концентрируют на англоязычных ресурсах Сети. Задачу поиска информации на серверах в пределах отдельных стран выполняют системы локального характера, специально адаптированные к особенностям конкретных языков. Существуют подобные поисковые средства и в России. Всех их объединяет возможность обработки материалов во всех кириллических кодировках. Однако по мощности и уровню предлагаемого сервиса русскоязычные поисковые системы значительно отличаются друг от друга.

К лидирующей группе в настоящее время относятся системы Rambler, «Апорт» и «Яndex».

Rambler

Среди фаворитов выделяется Rambler (http://www.rambler.ru), ставший первой профессиональной отечественной поисковой системой. Эта система обеспечивает полнотекстовый поиск на 3 млн. страниц, расположенных на более чем 15 тыс. Web-узлах Росси и стран ближнего зарубежья. Помимо Web-серверов, обследуется также недельный архив телеконференций иерархии relcom.

Rambler обладает близким к оптимальному выводом результатов поиска. Даже в нормальной форме ссылка на найденный объектвключает полную информацию. Система сконструирована таким образом, что один и тот же документ в различных кодировках показывается в различных кодировках показываются только один раз, а его конкретные адреса суммируются в списке, идущим за резюме.это сокращает время на аналмз полученных результатов из-за отсутствия дублирования одних и тех же документов.

Главный недостаток Rambler заключается в невозможности осуществлять поиск по целой фазе или хотя бы указывать в запросах предельное расстояние искомых терминов друг от друга. Случайное сочетание совершенно несвязанных слов приводит к выдаче ссылок на документы, совершенно не релевантны запросу.

Апорт

Поисковая система Апорт (http://www.апорт.ru) снабжена массой различных функций, относящих ее к числу самых удобных для пользователя.

Одно из главных достоинств Апорт состоит в широких возможностях составления запроса. Помимо традиционных операторов “и” и “или”, поиска по целой фазе, система способна вычленять сочетания терминов, расположенных в тексте рядом друг с другом. Апорт предлагает возможность автоматического перевода запроса с русского на английский язык и наоборот. И Rambler, и Апорт способны выделять один и тот же документ в различных кодировках и выдавать ссылку на него лишь раз, перечисляя конкретные адреса в списке URL. К сожалению, при этом вовремя не удаляются сведения об устаревших версиях одной и той же страницы, которые перечисляются как существующие, имея разницу лишь в дате обновления. Еще одним недостатком этой системы является не всегда корректная обработка названий страниц, из-за чего в результатах поиска часто указывается «документ без названия».

Яndex

Поисковая система Яndex (http://www.yandex.ru) , где помимо серверов доменов «ru» и «su» Яndex индексирует содержание зарубежных русскоязычных Web-узлов.

Главной отличительной чертой этой системы является глубокий морфологический анализ обрабатываемых терминов. Мощнейшая лингвистика позволяет учесть практически все возможные оттенки употребления ключевых слов и составить запрос максимально точно. Яndex обладает хорошим механизмом распознавания одного документа в нескольких кодировках или на зеркальных серверах.

Вслед за лидирующей российской тройкой идут еще несколько поисковых средств, среди которых “Русская машина поиска”(http://search.interrussia.com), «TELA-поиск» (http://tela.dux.ru/) и Russian Internet Search (http://www.search.ru). Пока все эти серверы не отличаются ни широтой поиска, ни комфортностью, и могут быть использованы лишь в качестве дополнения к ведущим поисковым средствам.

Поисковый сервис в русскоязычном блоке Internet, также как и во всем мире, развивается стремительно. Нет сомнения, что в ближайшем будущем показатели существующих систем повысятся, появятся новые поколения поисковых средств, предоставляющих пользователям еще большие возможности (Куприянова, 1998).

Список литературы

1. Дмитрий Кирсанов Понятный Internet / -М. Символ-Плюс, 1996

2. Джери Хоникарт Internet без проблем /- М. 1996

3. Питер Кент Internet / М. 1996

4. Джон Левин Секреты Internet / Киев 1996

5. В. Степанов С компьютером на ты / - М., 1998

6. Кирк Черил Internet. Книга ответов / М. 1998

7. Г. И. Куприянова Информационные ресурсы Internet / М., 1998

topref.ru

Реферат - Что такое интернет?

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">МИНИСТЕРСТВО  ОБЩЕГО И  ПРОФЕССИОНАЛЬНОГО

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">ОБРАЗОВАНИЯРОССИЙСКОЙ ФЕДЕРАЦИИ

ДАЛЬНЕВОСТОЧНЫЙГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-weight:bold;mso-bidi-font-style:italic">Кафедра информатики

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">

Что такое интернет

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-style:italic">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-style:italic">Аспиранта второго

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-style:italic">года обучения

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-bidi-font-style:italic">Незнановой

С. Ю.

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-ansi-language:EN-US;mso-bidi-font-style:italic">03.00.10.(

ихтиология)

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

                                                                            Научныйруководитель

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-style:italic">профессор, д.б.н.

<span Arial",«sans-serif»;mso-bidi-font-family: «Times New Roman»;mso-bidi-font-style:italic">Иванков

В. Н.

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-style:italic">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-style:italic">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-style:italic">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»; mso-bidi-font-style:italic">

<span Arial",«sans-serif»; mso-bidi-font-family:«Times New Roman»">

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">Владивосток

<span Arial",«sans-serif»;mso-bidi-font-family:«Times New Roman»">2002

СодержаниеВведение

1.<span Times New Roman"">                            

Основныепротоколы в Internetи поиск вних

2.<span Times New Roman"">                            

Инструментыпоиска

2.1.<span Times New Roman"">                                

Тематическиекаталоги

2.2.<span Times New Roman"">                                

Автоматическиеиндексы

2.3.<span Times New Roman"">                                

Российскиесистемы поиска

Список литературы

Введение.

Одно изглавных отличий Интернета от всего остального, чтосвязано с компьютерами, — это то, что для успешной работы с ним, вообще говоря,не нужно никаких книг. Сам Интернет может служить исправочником, и учебником, и энциклопе­дией самого себя. Однако на начальномэтапе, как мне кажется, польза от книги, внятно и доступно излагающей основы,может быть весьма значительной. Именно такую книгу я и постарался написать. Но преждечем вы познакомитесь с ней поближе, да­вайте попробуем ответить на самыйглавный вопрос, который, вероятно, вы себе уже задавали:

Интернет: что же это, наконец, такое

Более илименее научные (или просто наукообразные) опреде­ления Интернета,которыми заполнены книги и статьи на эту тему, конечно, имеют свою ценность. Нодля наших целей пока достаточно самого простого объяснения: Интернет— это мно­жество компьютеров, соединенных друг с другом каналамисвязи, плюс набор стандартных правил, по которым они обме­ниваютсяинформацией. При этом сами каналы связи, по­жалуй, даже менее важны, чемправила передачи данных по ним, называемые в Интернетепротоколами. Если хотя бы два компьютера взаимодействуют по одному изтаких протоко­лов — это уже настоящий Интернет.

Изобретениеи совершенствование модемов — специальных устройств, по­зволяющихкомпьютеру посылать информацию по телефону, — открыло двери в Интернет огромному количеству людей, у ко­торых нет.никакого специального сетевого оборудования, а есть лишь персональный компьютери телефонная розетка побли­зости.

Каксам Интернет, так и модемы для персональных компью­теровсуществуют уже довольно долго. Однако лишь совсем не­давно — около 1990 года — Интернет набрал, наконец крити­ческую массу пользователей иресурсов, необходимую для про­исходящей на наших глазах сетевой революции.Скоростные модемы, позволяющие обычным пользователям персональных компьютеровбез ограничений наслаждаться всеми благами Ин­тернета,появились еще позднее. А система WorldWideWeb(WWW, или«Всемирная паутина»), изобретенная в 1993 г. и бывшая поначалу лишь одной измногих составных частей сети, заняла доминирующее положение и стала определятьлицо Ин­тернета буквально в последние год-два. Такили иначе, все­мирный интернетовский бум сейчас всамом разгаре — и вам очень повезло, что вы почти не опоздали к началу представ­ления.

Интернет— это, прежде всего огромноемножество компьютеров и программ. Среди последних вы найдете не только такие,ко­торые умеют хорошо решать ваши конкретные задачи, но и го­раздо большетаких, чьи способности вам, вероятно, поначалу будет сложно даже представить.Выход в Интернет дает вам уникальную возможность,каким бы несовершенным ни был ваш компьютер, заглянуть в двадцать первыйвек и самостоя­тельно освоиться с такими понятиями, как «всемирный кибер-социум», «виртуальные деньги», «информационная средаоби­тания» и т. п., — словом, со всем тем, о чем так любят писать сейчасжурналисты.

Однакоэто лишь часть ответа на вопрос «что такое Интернет».Интернет сегодня — это не только огромное количествокомпьютеров, но еще и невероятное количество людей, для ко­торых сетьявляется принципиально новым способом общения, почти не имеющим аналогов вматериальном мире. Человек — существо социальное, и общение с себе подобными —одна из первейших его потребностей. Пожалуй, до сих пор еще ни одно техническоеизобретение (если не считать телефона) не произ­водило такого переворота в этомдревнем как мир занятии — об­щении человека с человеком.

Конечно,что именно заинтересует вас в Интернете в первуюочередь — люди или компьютеры, — зависит только от вас. Древняя метафора книгикак модели мироздания, пожалуй, за­служивает пересмотра — теперь на роль такоймодели гораздо лучше подходит компьютер. Когда же речь идет о миллионахкомпьютеров и их пользователей во всем мире, связанных в единую сеть, метафораэта уже перестает быть просто мета­форой. Вот почему не будет преувеличениемсказать, что, вы­ходя в Интернет, вы делаете для себядоступным целый мир.

1. Основныепротоколы в Internet и поиск в них.

Internetсодержит громадное количествоинформации, по этому в нем трудно найти то что нужно, если не знать где искать.Место нахождения (или адреса) каждого ресурса определяет его URL. В URL содержитсятип протокола, указывающий на какой сервер осуществляется доступ: на WWW( накоторый указывает запись: http), Gopher,ftp, telnet, или WAIS, этозависит от того какой тип информации вы будете передавать. Сетевой протокол — совокупность четко определенныхправил: как запрашивать, оформлять и высылать по сети данную разновидностьинформации (Кент, 1996).

telnet

Ксети Internet присоединены миллионы компьютеров имногие из них обладают интересными возможностями.

Оказывается,вполне осуществимо добраться до этих компьютеров чтобы посмотреть имеющиеся вних базы данных и программы. Специальная программа telnetпозволяет превратить ваш компьютер в клиента telnetдля доступа к данным и программам в многочисленных серверах telnet.Например исследователь регулярно может работать на нескольких компьютерах,администраторы которых назначают ему специальное имя и пароль.

Сампо себе telnet — просто средство связи; ни какого-тособственного интерфейса, ни возможностей поиска он не предоставляет.

Связавшисьс помощью telnet с удаленной машиной и введя в полезапроса свое входное имя (login) и пароль (password) вы дальше общаетесь именно с этой машиной ипрограммами на ней, а telnet заботится лишь оподдержании связи между вами (Левин, 1996).

Разумеется,многие хранилища информации, которые первоначально обслуживались специальнымипрограммами с доступом по telnet теперь можноперевести на WWW, что не редко и делается. Однако остались и такие которые попрежнему предоставляют свои услуги только по telnet(особенно среди каталогов и информационных служб библиотек ).

Стандартизированнаяссылка на telnet соединение с некоторым узлом Internet    ( т.е.URL- адрес  этого соединения) выглядиттак:

telnet://<адрес сервера >

FTP

Практическився информация в компьютерном мире хранится в виде файлов. По этому еще насамой заре Internet появилось специальное средстводля обмена файлами по сети — сетевой протокол FTP (FileTransfer Protocol).

Количествофайлов, доступных на узлах всего мира по анонимному FTP измеряется астрономическимицифрами и постоянно растет. К тому же Word Wide Web позволяет без какой-либопеределки существующих FTP архивов, снабжать их описаниями любой степенидетальности и удобным гипертекстовым интерфейсом.

Нокак узнать куда обращаться в поисках нужного файла?

Archie.

Поискпо имени файла на всех анонимных FTP-узлах мира можно осуществить с помощьюсистемы Archie. Она разработана несколькимипрограммистами из университета МакГила в Канаде иосуществляет индексирование станций FTP, показывая доступные в каждой станциифайлы. Archie сообщает о нескольких миллионах файловнаходящихся в более тысячи станций FTP, и предоставляет удивительно быстрыйспособ поиска того места, куда нужно направиться для получения интересующеговас файла. Поиск в базе данных сервера Archieпроизводится с помощью ключевых слов, которые в данном случае представляютсобой просто имена файлов или фрагменты имен.

СейчасArchie доступен через WWW. Это WWW страница с бланкомв котором указываются ключевые слова и опции поиска.

Хотяимя файла почти всегда имеет некое отношение к его содержимому, пользоваться Archie для тематического поиска программ не стоит. Этасистема будет полезна, если вы действительно знаете имя нужного файла или частьимени. С другой стороны если вы ищете программу, которая имеет общепринятоесокращенное название, то есть некоторая вероятность что это сокращение будетприсутствовать и в имени файла, так что можно попробовать найти такой файл спомощью Archie. Результаты поиска представляют собойсписок FTP-узлов и полных имен файлов на этих узлах. Имя файла служит ссылкойна этот файл, так что щелчок по имени позволит сразу же получить файл с данногоузла. А доменый адрес FTP-архива  выделенный крупным жирным шрифтом, перенесетвас в исходный каталог файловой системы на этом архиве.

Archieне делит свой список на страницы и его удобнее всегопросматривать прямо по мере получения (Хоникарт,1996).

URL-адрес,указывающий на FTP-соединение, должен, как минимум, включать в себя слово “ ftp” в качестве левой части и адрес узла в правой:

ftp://<адрес сервера >.

WAIS

 Почти все информационные ресурсы Internet предоставляют возможность автоматического поиска,но лишь в одной из них — в системе WAIS ( Wide Area Information Server, глобальный информационный сервер) — поиск поключевым словам, является основным методом доступа к информации.

СистемаWAIS представляет собой огромную распределенную базу данных, т.е. отдельныечасти этой базы данных расположены на разных узлах сети по всему миру.Программа-клиент для работы с серверами WAIS не только умеет общаться с ними поспециальному протоколу, но и хранит список всех баз данных WAIS с их адресами иназваниями, а иногда и с краткими описаниями. Там можно найти архивытелеконференций, всевозможные каталоги, справочники, сборники научных статей ирефератов, индексы и словоуказатели и многое другое.Практически любая информация, для которой база данных является удобной формойпредставлениями которая достаточно интересна для широкой аудитории, может бытьпредставлена в WAIS.

Базаданных WAIS настолько велика, что простое “листание” записей — крайнебесперспективный способ доступа к информации. Поэтому в WAIS применяетсядовольно сложный метод поиска по ключевым словам и фразам. Документы,полученные в результате поиска, сортируются WAIS-сервером по количествувхождения в них ключевых слов и по тому, насколько полно в каждом из нихпредставлен весь набор заказанных ключевых слов. Такая система способна даватьхорошие результаты, особенно если разбить процесс поиска на несколько этапов.

Первымэтапом поиска  обычно является запросспециальной в базе данных под названием “directory-of-servers”, которая содержит небольшие по объему описания (рефераты) всех остальных базWAIS. При этом лучше указывать не те ключевые слова, которые вас в конечномсчете интересуют, а те общие понятия, относящиеся к вашей области знаний.

Выбравна первом этапе одну или несколько баз, можно приступить к поиску собственнодокументов — что также можно делать в несколько заходов, знакомясь послекаждого поиска с результатами и изменяя список ключевых слов, пока не будетнайден нужный документ. Кроме того WAIS обладает одним полезным свойством: еслина очередном этапе поиска вы нашли документ, содержимое которого особенноблизко к тому, что вы ищите, то его можно добавить к списку релевантныхдокументов. В результате на следующем этапе WAIS найдет документы, не толькосодержащие набор ваших ключевых слов, но и похожие по своему словарному составуна те тексты, которые вы указали как наиболее подходящие.

ХотяNetscape способен работать с серверами WAIS, для этого он должен знать адресособого прокси-сервера для протокола WAIS, котороговашего провайдера может не оказаться. СпециальныеWAIS-клиенты, работающие в том числе и под Windows,не только удобные для интерактивного поиска в базах данных, но и позволяетобходиться без услуг какого-либо сервера-посредника(Левин, 1996).

URL-адресдля WAIS выглядит как:

wais://< адрес сервера>/<название базы>

Gopher

Каждыйиз рассмотренных до сих пор интернетовских протоколоввполне мог бы существовать сам по себе: telnetпредоставляет доступ к программам, FTP — к файлам, WAIS — к базам данных. Всеэти системы создавались и развивались почти независимо друг от друга и ставилиперед собой конкретную цель — построить механизм доступа к одному определенномувиду ресурсов.

Однакопо мере того как Internet рос и усложнялся, он самподталкивал людей к мысли, что информация по природе своей едина и что неслишком разумно делить ее на разные “виды ресурсов” с непохожими методамидоступа. К концу 80-ых годов идея нового универсального средства работы сразнородной информацией носилась в воздухе.

Первойсистемой, призванной воплотить в жизнь эти мечты стал Gopher,появившийся на свет 1991 году в американском университете штата Меннесота. Фундаментальным понятием, заложенным в ееоснование была структура вложенных друг в друга меню (Кирсанов,1996).

СвязавшисьGopher- клиентом с одним из Gopher-серверов, вы в первую очередь попадаете вкорневое, главное меню этого сервера. Сориентировавшись в его содержимом ипереходя далее из одного подменю в другое, можно заняться собственно поискоминформации. Информация в системе Gopher организованастрого иерархически, “от общего к частному”. На каждом шаге сервер посылаетвашему Gopher — клиенту не только содержимоеочередного меню, но и служебную информацию о том, где находятся объекты,соответствующие пунктам этого меню. Клиент выводит на экран только самоперечисление пунктов, но когда вы выберите один из них, он, сверившись симеющейся у него информацией, либо пошлет на какой-то из Gopher — серверов запрос на выдачу следующего меню, либо попытается установитьFTP-  или telnet-  соединение с некоторым узлом Internet.

Очевидноиз всех информационных инструментов Internet Gopherбольше всего похож на WWW — обе эти системы призваны служить оболочкой сразнородными ресурсами. Однако Gopher лишен тех богатых  изобразительных средств, которые делают WWWне только информационным каталогом, но и новым средством массовой информации идаже новым жанром искусства. Можно сказать, что Gopher является “подмножеством”WWW — что очень упрощает интегрирование самого Gopher как одного из видов  ресурсов в WWW. Практически все что сказано оработе с Gopher — клиентом справедливо и для путешествия по системе Gopher спомощью броузера WWW (Хоникарт,1996).

URLодного из пунктов Gopher — меню состоит из адресаGopher- сервера и перечисленных тех пунктов меню, которые приведут вас кисходному пункту:

gopher://<адрес сервера>/< пункт меню> 

WWW

Несмотряна то, что в первые годы своего существования Gopherзавоевал большую популярность, назревала нужда в какой-то более простой и втоже время максимально универсальной системе, в которой связи между ресурсамибыли бы более свободными и ассоциативными. Такая система была разработана в 1993году и названа World Wide Web (WWW). Система WWW строиться на понятии гипертекста,или, точнее гипермедиа. Гипертекст — это текст составные части которого связаныдруг с другом и с другими текстами с помощью ссылок. Гипермедиа — это то чтополучится из гипертекста, если заменить в его определении слово “текст” на“любые виды информации”: графические изображения, видео, звук и т.д.

WorldWide Webозначает буквально “всемирная паутина”. Почему она так называется. Как ясно изназвания, она глобальна. Вы не всегда знаете в какой части света находитсякомпьютер, к которому вы подключаетесь. Вы можете начинать читать страницу Web в Далласе, затем перейти в Австралию, и все это поодному нажатию кнопки мыши. WWW похожа на паутину. Это сложная информационнаясеть, соединенная гипермедиа связями. WWW позволяет не отказываться отинформационных ресурсов уже накопленных в Internet,доступных с помощью других средств — FTP, telnet и Gopher. Больше того, работа с этими ресурсами через WWWнастолько удобна, что, скажем, FTP-клиенты, бывшие когда-то отдельным классомпрограмм, теперь используются лишь немногими.

Ивсе-таки главное в World WideWeb — это не удобства доступа к FTP- архива иGopher-меню. Большинство серверов системы WWW предлагают информацию, котораябез WWW вряд ли вообще когда- либо попала бы в сеть. Быстрота создания иобновления, богатые изобразительные возможности в сочетании с легкостью доступаи огромной аудиторией сделали WWW новым средством массовой информации. ЗапускWWW-серрверов и создание WWW-страниц уже превратилось из повальной моды в новыйбизнес — со всем что свойственно современному бизнесу: платой за квадратныесантиметры рекламной площади.

Сдругой стороны, быстрому распространению системы, столь естественнообъединяющей разнородные ресурсы, способствовало не в последнюю очередь еезарождение не в недрах коммерческой фирмы, а в научном учреждении — Европейскойлаборатории физики частиц, сотрудники которой не стали делать секретов из своейразработки и даже не попытались на ней разбогатеть.

Ксчастью, сама природа WWW как прежде всего средства поиска и организацииинформации позволяет надеяться, что это замечательное изобретение непревратиться в инструмент одной лишь коммерции и рекламы (Кирсанов, 1996).

Серверыи клиенты WWW связываются между собой по специальному протоколу HTTP (Hyper Transfer Protocol, протокол передачи гипертекста). URL для WWWвыглядит как :

http://<адрес сервера>

Переходить от одной странице Webк другой — интересный способ исследования World Wide Web, однако вам рано илипоздно понадобится найти что-то конкретное. Но таким образом это сделать неудастся. В Internet имеются специальные инструментыWeb-поиска.

Инструменты поиска в WWW.

 Инструментов поиска информации в Internet, построенных на разных принципах и преследующихразные цели, существует немало. Но все их объединяет то, что они располагаютсяна специально выделенных сетевых компьютерах с мощными каналами связи,обслуживают ежеминутно огромное количество посетителей и требуют от своихвладельцев значительных затрат на поддержку и обновление. Тем не менее, почтивсе они отвечают на запросы пользователей совершенно бескорыстно, а платят заэто удовольствие спонсоры и рекламодатели. По масштабам влияния на сетевоесообщество поисковые системы, без сомнения, являются одним из краеугольныхкамней Internet.

Классификациюпоисковых систем удобнее всего строить на основании того, на сколькоавтоматизирован в них сбор и обработка информации, предоставляемойпользователям, — иначе говоря, кто набирает базу данных, в которой производитсяпоиск: люди или сами компьютеры.

2.Инструменты поиска

Условноинструменты поиска подразделяются на поисковые средства справочного типа (directories) и поисковые системы в чистом виде(searchengines).

2.1Тематические каталоги

Поисковыеинструменты первого типа чаще всего называют предметными, или тематическимикаталогами. Компания, владеющая таким каталогом, непрерывно ведет огромнуюработу, исследуя, описывая, каталогизируя и раскладывая по полочкам содержимоеWWW-серверов и других сетевых ресурсов, разбросанных по всему миру. Результатомее титанических усилий является постоянно обновляющийся иерархический каталог,на верхнем уровне собраны самые общие категории, такие как “бизнес ”, ”наука”,”искусство” и т.п., а элементы самого нижнего уровня представляют собой ссылкина отдельные WWW-страницы и сервера вместе с кратким описанием их содержимого.

Гарантийтого, что такой каталог действительно охватывает все содержимое WWW, никто недаст, однако возможная не полнота и даже однобокость подбора материалов слихвой искупается там, что пока еще не под силу никакому компьютеру —осмысленность отбора.

Предметныекаталоги предоставляют и возможность поиска по ключевым словам. Однако поискэтот происходит не в содержимом самих WWW-серверов, а в их кратких описаниях,хранящихся в каталоге.

Предметныекаталоги Internet можно пересчитать буквально напальцах, так как их создание и поддержка требуют огромных затрат. К наиболееизвестным относятся Yahoo, WWW VirtualLibrary, Galaxy и некоторыедругие.

Yahoo.

Наиболеепопулярен у населения Internet каталог Yahoo. На первой же странице Yahoo,расположенной по адресу www.yahoo.com, вы получаете доступ к двумосновным методом работы с каталогом — поиску по ключевым словам ииерархическому древу разделов.

Начавспуск по разделам каталога, вы увидите, что каждый раздел содержит точно такоеже поле для ввода ключевых слов и кнопку Search,запускающую поиск.

Каждыйраздел может включать в себя как перечисление входящих в него подразделов, таки собственно ссылки на страницы, относящиеся сразу ко всему разделу, с ихкраткими описаниями.

Вместопутешествия по дереву подраздела вы можете сразу попасть в нужное местокаталога Yahoo с помощью поиска. Введя одно илинесколько ключевых слов, разделенных пробелами, в строку поиска и нажав кнопку Search, вы получите список всего в Yahoo,что содержит в себе указанные ключевые слова. Этот список будет разделен на двечасти — “categories” и “sites”.

Еслиобщее количество ссылок, возвращенных в результате поиска, превышает 25, списокссылок будет разбит на несколько частей.

Автоматическимпоиском можно воспользоваться не только с главной страницы Yahoo,но и из любого подраздела; при этом специальный переключатель, расположенныйпод полем ввода ключевых слов, позволяет либо ограничить поиск текущим разделоми его подразделами, либо искать во всем каталоге (Черил,1998).

Magellan.

Ноне редко случается так, что выдаваемый машиной список очень велик и просмотретьего просто не реально. Выходом из этой ситуации может стать более строгий отборинформации, заносимой в каталог. Одна из самых известных систем такого рода —каталог Magellan по адресу: www.mckinley.com

Этабаза данных содержит сведения о 80 тысячах WWW-страниц — что очень не много всравнении с теми миллионами, которые существуют в сети. Однако если Yahoo в качестве описания ресурса использует одну-двестрочки текста, то сотрудники системы Magellan нанекоторые из страниц, заносимые в их базу данных, сами пишут небольшиерецензии, а также оценивают качество этих информационных ресурсов попятибалльной шкале. По мимо базы рецензий, Magellanвладеет так же собственным автоматическим индексом, для поиска в котором нужноперебросить переключатель под полем ввода в положение entiredatabase.

Какправило запрос представляет собой одно или несколько ключевых слов, разделенныхпробелами (Кирсанов, 1996).  

Point.

Схожаяпо своим принципам служба фирмы Point(http://www.pointcom.com) вообще основной упор делает не на поиск, а на работус тематическим каталогом.

СлужбаPoint известна в сети тем, что ее сотрудникипостоянно заняты оцениванием сетевых ресурсов и ведут списки тех узлов, которыеони считают принадлежат к “лучшим пяти процентам WWW”.

Самафирма Point Ведет общедоступную базу данных всех“пятипроцентных WWW-страниц, где о каждой можно прочитать подробную лицензию (Хоникарт, 1996).

Virtual Library.

Самымстарым предметным каталогом WWW является каталог VirtualLibrary:

www.w3.org/hypertext/DataSources/bySubject/Overview.html

Этасистема достаточно полно охватывает научную прослойку WWW — серверыуниверситетов, лабораторий и учебных заведений.

Russia-On-Line Subject Guide.

Дляпользователей в нашей стране определенный интерес может представлятьтематический каталог Russia-On-Line Subject Guide, расположенный поадресу www.online.ru/rmain. Этот каталог содержит довольно пестроесобрание ссылок на зарубежные источники плюс тематический обзор российских ирусскоязычных ресурсов WWW.

2.2.Автоматическиеиндексы.

Кпроблеме поиска информации в Internet можно подойти ис другой стороны. Существуют программы в которые загрузили несколько тысячобщеизвестных URL-адресов. Будучи запущена на компьютере с доступом к WWW, этапрограмма начинает автоматически скачивать из сети документы по этим URL,причем из каждого нового документа она извлекает все содержащиеся в нем ссылкии добавляет их в свою базу адресов. Поскольку в конечном счете все WWWдокументы связаны между собой, рано или поздно такая программа обойдет весь Internet.

Разумеется,программа не может ни понять ни как либо классифицировать то, что она видит всети. Программы такого типа называются роботами. Они ограничиваются сборомстатистической информации и построением словоуказателей(индексов) по текстам документов. Собираемая роботом база данных — индекс —хранит в себе, попросту говоря, сведения о том в каких WWW-документахсодержаться те или иные слова.

Именнотакой  автоматически собираемый индекс илежит в основе поисковых систем второго рода, которые часто так и называют —автоматические индексы.

Автоматическийиндекс состоит из трех частей: программы-робота, собираемой этим роботом базыданных и интерфейса для поиска в этой базе, с которым работает пользователь.Все эти компоненты вполне могут функционировать без вмешательства человека.

Посколькукакая-либо классификация или оценивание материалов в системах такого родаотсутствуют, к ним следует прибегать только тогда, когда вы точно знаетеключевые слова, относящиеся к тому, что вам нужно, — скажем, фамилию человекаили несколько достаточно редких терминов из соответствующей области. если жезадать поиск по сколько-нибудь распространенным словам, то вам не хватит жизни,чтобы обойти все полученные в результате поиска URL-адреса, — к примеру, индекссистемы Alta Vista содержит11 миллиардов слов, извлеченных из 30 миллионов WWW-страниц.

Автоматическихиндексов WWW-страниц существует немало: WebCrawler, Lycos, Excite, Inktomi, Open Textи другие.  Некоторые из них (например, Lycos) представляют собой более или менее удачный синтезпредметного каталога и автоматического индекса.

AltaVista.

Ееадрес altavista.digital.com. Эта система появилась в декабре 1995 года.Она один из самых больших по объему индексов из всех поисковых систем такогорода и самые мощные и гибкие правила построения запросов. AltaVista понимает два разных языка запросов, довольносильно отличающихся друг от друга. На первой странице AltaVista вы видите бланк для простого запроса (Simple Search), а панельзаголовка вверху страницы содержит кнопку Advanced Search, нажав которую, вы получите бланк для усложнениязапроса.

КромеWWW-страниц, Alta Vistaведет отдельный индекс для статей из более чем 14000 конференций Usenet (включая иерархию групп relcom.*).

ПоискAlta Vista: чтобы Alta Vista срабатывала на группеслов, только когда они стоят рядом, нужно заключить эту группу в кавычки. Еслинеобходимо исключить из результата все документы, содержащие определенноеслово, необходимо приписать это слово со знаком “минус”.

Словобез всякого знака действует в запросе точно так же, как и оно же со знаком“плюс”.

Вотличие от Yahoo, по умолчанию AltaVista ищет вхождения целых слов, т. е. заказанныетермины должны стоять в документе обособленно, а не быть частью других цепочексимволов. Если же вам нужно найти все вхождения слова, даже когда оно входит всостав других слов, пользуйтесь символом *. звездочка может стоять только вконце слова, а чтобы предотвратить обвальный поиск, дающий слишком многорезультатов, Alta Vistaтребует, чтобы слово, заканчивающееся на *, состояло не менее чем из 3 букв.Более того, символ * позволяет найти не любое окончание слова, а только непревышающее длину  пяти символов и несодержащее заглавных букв или цифр.

Результатыпоиска Alta Vista, как и Yahoo, выдает в виде списка ссылок на документы, но вместоописания каждого документа рядом с его заголовком вы увидите просто первыенесколько строк его текста. Если найдено будет больше 10 документов, Alta Vista разобьет их список настраницы по 10 ссылок на каждой. Alta Vista сортирует ссылки так, чтобы на первом месте стояли“самые важные” документы с вашими ключевыми словами при определении степениважности учитывая следующие факторы:

*<span Times New Roman"">                   

 входят лиключевые слова в заголовок документов;

*<span Times New Roman"">                   

 содержатся лиэти слова в первых нескольких строках документов;

*<span Times New Roman"">                   

 насколькоблизки друг к другу в тексте обнаружены ключевые слова (Кирсанов, 1996).InfoseekInfoseek, вступившийв эксплуатацию в конце 19996 года, несколько напоминает AltaVista, однакообъем обследуемых им полных текстов документов еще не превышает 30 млн. Web-страниц.Адрес: www.infoseek.com. Это довольно мощная система, обладающая высокойскоростью и простой в обращении. Возможности составления запроса почти такиеже, как и в AltaVista, но не стольбогатые. При почти полном сохранении значений знаков «плюс»,  «минус» и «кавычек», чувствительности кразнице заглавных и строчных букв и возможности ограничивать поиск фрагментами Web — страниц, Infoseekпока необладает способностью определять рядом стоящие термины (нет оператора NEAR),ограничивать поиск по дате обновления источника и, главное, усекать окончанияключевых терминов.

Ноданная поисковая система содержит массу факультативных функций. К таковымотносится, например, возможность определять количество ссылок в WWWна конкретную страницу, то есть судить, насколько онапопулярна или же, наоборот, выяснить, сколько ссылок на внешние страницысодержится на данном узле, вернее, сколько из них отражены в индексных файлах Ultraseek. Использование специальнойфункции  Imageseekпозволяет находить в Internetизображения (рисунки, фотографии) на определенную тему. Infoseekимеет также один из лучшихсправочников ресурсов Сети.

HotBot

Однимиз мощных поисковых средств в WorldWideWebможно отнести HotBot, содержащий сведения о полных текстах 110 млн. страниц.Адрес: http:// www.hotbot.com. HotBotпринадлежит к новейшим системам, поэтому егоуглубленный поиск дает поразительно широкие возможности для детализациизапроса. Это достигается за счет использования многоступенчатого меню,предлагающег

www.ronl.ru

Что такое интернет — реферат

     Оглавление 

     
  1. Что такое Internet.....................................................................................................2
  2. Краткая история Internet........................................................................................3
  3. Сети и протоколы.....................................................................................................5
  4. Список литературы...................................................................................................9

     1. Что такое Internet

     Internet -- глобальная компьютерная сеть, охватывающая весь мир. Сегодня Internet имеет около 30 миллионов абонентов в более чем 180 странах мира. Ежемесячно размер сети увеличивается на 5-7%. Internet образует как бы ядро, обеспечивающее связь различных информационных сетей, принадлежащих раз-личным учреждениям во всем мире, одна с другой.

     Всплеск интереса к глобальной информационной сети Internet наблюдается сейчас повсеместно. В сложившихся условиях потребность  в информации о сети Internet становится особенно острой. В настоящее время по Internet распространяется множество документов, касающихся как функционирования сети и работы в ней пользователей, так и связанных с различными сферами жизни: наукой, культурой, экономикой и т.д. Причем, обновление информации в Internet, обширной разветвленной сети, которая включает в себя компьютерные узлы, разбросанные по всему миру, происходит, практически, и режиме реального времени.

     В действительности Internet не просто сеть, -- она есть структура, объединяющая обычные сети. Internet - это «Сеть сетей».

     Чтобы описать сегодняшнюю Internet, полезно  воспользоваться строгим определением. В своей книге «The Matrix: Computer Networks and Conferencing Systems Worldwide» Джон Квотерман  описывает Internet как «метасеть, состоящую  из мно-гих сетей, которые работают согласно протоколам семейства TCP/IP, объединены через шлюзы и используют единое адрес-ное пространство и пространство имен».

     Для организации межсетевых соединений необходим соот-ветствующий протокол.

     Протокол - это набор договоренностей, который определя-ет обмен данными между различными программами. Протоко-лы задают способы передачи сообщений и обработки ошибок в сети, а также позволяют разрабатывать стандарты, не привязан-ные к конкретной аппаратной платформе. Все параметры -- от скорости передачи данных до методов адресации при транспор-тировке отдельных сообщений -- задаются протоколами, исполь-зуемыми в данной конкретной сети.

     В Internet базовым протоколом служит TCP/IP (Transmission Control Protocol/Internet Protocol). IP отвечает за адресацию сетевых узлов, a TCP обеспечивает доставку сообщений по нуж-ному адресу. Эти мощные протоколы были предложены в 1974 г. Робертом Кэном, одним из основных разработчиков ARPANET, и ученым-компьютерщиком Винтоном Серфом, вице-президентом CNRI. Следует иметь в виду, что TCP/IP не единственный протокол, пригодный для объединения различных сетей.  Основные среди них - стандарты взаимодействия открытых систем (OSI).

     Предложенные  Международной организацией по стандартизации (ISO) протоколы OSI получили широкое распространение в Европе. Системы, основанные на других протоколах, тоже подключаются к Internet через шлюзы. Например, BITNET -- это сеть, которая использует для передачи данных свои собственные стандарты, однако, по крайней мере, частично, она доступ-на через шлюзы из Internet.

     В Internet нет единого пункта подписки или регистрации; вместо этого вы контактируете с поставщиком  услуг, который предоставляет нам  доступ к сети через местный компьютер. По-следствия такой децентрализации  с точки зрения доступности сетевых ресурсов также весьма значительны. Среду передачи данных в Internet нельзя рассматривать только как паутину проводов или оптоволоконных линий. Оцифрованные данные пересылаются через маршруты шторы, которые соединяют сети и с помощью сложных алгоритмов выбирают наилучшие маршруты для информационных потоков. 

2. Краткая история  Internet

     Вначале ничто не предвещало, что Internet станет общедос-тупной компьютерной сетью. Как  и многие другие великие идеи, «Сеть  сетей» возникла из проекта, предназначавшегося совершенно для других целей. Ее прародительницей стала сеть ARPANET, разработанная и развернутая в 1969 г. компанией «Bolt Beranek and Newman» (BBN) по заказу Агентства передо-вых исследовательских проектов (ARPA) Министерства оборо-ны США.

     ARPANET объединяла учебные заведения,  военные органи-зации и их подрядчиков.  Она была создана с целью  помочь ис-следователям в обмене  информацией, а также (что явилось  од-ной из главных целей) для  отработки методов поддержания  связи в случае ядерного нападения.

     Основатели ARPANET первоначально позволяли ученым только войти в систему и запустить  программу на удаленном компьютере. Скоро к этим возможностям прибавились  переда-ча файлов, электронная почта  и списки рассылки, обеспечив-шие  общение исследователей, интересовавшихся одной и той же областью науки и техники. Но по мере роста ARPANET раз-вивались и другие сети, и вскоре стала очевидной потребность в новых средствах связи.

     Сравнительно  недавно появилась новая технология Internet, названная World Wide Web (WWW), что обычно переводится как «Всемирная паутина». Эта система была разработана, в основ-ном, в Европейской лаборатории элементарных частиц в Швей-царии (CERN). Сеть предназначалась первоначально для физи-ков, но затем получила широкое признание.

     WWW построена по технологии, в основе  которой лежит принцип создания  гипертекстовых документов (Web-страниц). Гипертекстовый документ заключает  в себе ссылки на другие  по-добные документы, которые,  в свою очередь, содержат ссылки  на следующие, и т.д. Таким образом, они оказываются связанными между собой.

     Для работы в WWW используется протокол HTTP (Hyper Text Transmission Protocol), а программы, позволяющие  работать с со-ответствующими документами  в Internet, называют просмотрщиками, или  браузерами.

     Понятие и особенности  образовательного интернет-ресурса

     Традиционно в рамках Интернета понятие "образовательный  ресурс Интернет" трактуют очень  широко. Например, на Всероссийский  конкурс сетевых образовательных  ресурсов "Образование в Рунете" (http://konkurs.auditorium.ru), проходящий под эгидой Министерства образования Российской Федерации, Института "Открытое общество" (Фонд Сороса) и ФИО принимались сайты, содержащие материалы:

     · учреждений и организаций, которые  реализуют образовательные программы  для детей, юношества и молодежи, которые обеспечивают научно-методическое и информационное обеспечение системы образования, а также обеспечивающих научно-техническую и инновационную политику в сфере образования;

     · в области гуманитарных, социально-экономических, точных и естественных наук, а также для учителей и школьников по школьным предметам;

     · дистанционного обучения и тестирования, научно-образовательных конкурсов  и Интернет-олимпиад;

     · электронные библиотеки, каталоги, коллекции для целей образования, а также образовательная пресса;

     · персональные сайты работников сферы  образования.

     Представленные  в этом списке ресурсы создавались  разработчиками различного профессионального  уровня при неодинаковой технической  и финансовой поддержке. Наряду с  сайтами, созданными энтузиастами, представлены работы, выполненные профессиональными дизайн-студиями.

     С одной стороны, Интернет-ресурс - это  ресурс глобальной компьютерной сети, следовательно, имеется возможность  передавать представленную в цифровом формате информацию на большие расстояния посредством сетевого оборудования. К сожалению, скорость передачи информации имеет физические ограничения, что влечёт за собой ограничения на объём передаваемых файлов.

     Дизайнеры, создававшие мультимедийные обучающие  программы на CD, впервые взявшиеся за создание сайтов, приходят в ужас от количества ограничений. Ведь если объем стандартного CD составляет от 600 до 750 Mb, что, например, позволяет записывать на него изображения размером больше 1 Mb, то объем одной картинки на странице сайта только в особых случаях может превышать 50 Kb.

     Вместе  с тем, развитая инфраструктура Интернет предоставляет такие возможности, как:

  • Охват широчайшей аудитории (не только российской, но и международной).
  • Оперативное обновление информации.
  • Использование непосредственных ссылок на другие ресурсы Интернет.
  • Широкое распространение информации о существовании ресурса с помощью информационно-поисковых систем сети Интернет.

     Следует также подчеркнуть, что, говоря об образовательных  ресурсах сети Интернет, имеются в виду веб-сайты (точнее, набор гипертекстовых документов), грамотное структурирование которых позволяет существенно повысить эффективность работы с информацией.

     Поэтому:

  • Создание сетевых образовательных ресурсов требует особого технического и концептуального подхода. Способ их создания в корне отличается от технологии создания прочих образовательных ресурсов.
  • Любая информация, взятая из другого вида ресурса, должна быть соответствующим образом преобразована для включения ее в информационный образовательный ресурс сети Интернет.
 

     Сети  и протоколы

     На  первых порах, когда разные сети базировались на разных вычислительных платформах, т.е. использовали несовместимые технические и программные средства, когда еще не были приняты стандарты на передачу данных, межсетевое общение было затруднено. Серьёзный сдвиг в преодолении этих барьеров произошел в 1974 , когда был разработан межсетевой протокол обмена информацией TCP/IP (Transmission Control Protocol/Internet Protocol). Однако прошло ещё почти 10 лет, пока этот протокол не был принят в обязательном порядке на всех узловых компьютерах сети Arpanet. К тому моменту к Arpanet присоединилось несколько сотен других сетей, и набор услуг вычислительного характера начал постепенно вытесняться услугами информационного плана. Протокол TCP/IP не является единственным стандартом на передачу данных в сетях. Поэтому между двумя сетями, использующими для внутреннего общения разные протоколы, организуются серверы-посредники, называемые шлюзами. Ситуация напоминает смену колес у вагонов на границе двух стран, железнодорожные пути в которых имеют разную ширину колеи.

     Любой протокол обмена информацией между двумя абонентами представляет собой набор соглашений, в которых оговариваются различные технические характеристики и программные средства, участвующие в приёме/ передаче данных. В состав этих характеристик входят скорость передачи данных, средства контроля и устранения ошибок, форматы заголовков и способы адресации абонентов, методы сжатия и распаковки информации и многое другое. Часть таких соглашений обеспечивается аппаратными возможностями модемов, другие - обслуживающими программами.

     Два ПК, оборудованные модемами и снабжённые соответствующим программным обеспечением, могут связаться друг с другом, подобно абонентам, разговаривающим по телефону. Организации такой связи может предшествовать обычный телефонный разговор между владельцами ПК, оговаривающими время связи, скорость передачи информации и прочие параметры протокола. После установления связи между компьютерами по телефонному каналу можно передавать файлы точно так же, как и по «прямому проводу». К услугам подобной связи прибегают абоненты электронной доски объявлений BBS (Bulletin Board System). К существенным недостаткам такого общения между компьютерами относятся непредвиденная занятость телефонной линии, низкая пропускная способность каналов связи, высокая плата за междугородние контакты, необходимость ручного управления сеансом связи со стороны владельца принимающего ПК (клиента), сложность предварительной оценки полезности информации, извлекаемой из сервера BBS.

     В начале 70-х годов Министерство обороны  США приступило к разработке системы  связи, которая должна была соединить  между собой компьютеры всех центров  противоракетной обороны страны. К надежности системы предъявлялись высокие требования: выход из строя любых ее составляющих (то есть компьютеров и линий связи) не должен был сказаться на качестве и скорости связи между остальными участниками информационного обмена. Так появилась сеть ARPAnet (Advanced Research Projects Agency - Бюро перспективных исследований Министерства обороны США; слово "net" по-английски означает "сеть").

     Передача  данных в сети была организована на основе протокола Internet - IP. Протокол IP - это правила и описание работы сети. Этот свод включает правила налаживания и поддержания связи в сети, правила обращения с IP-пакетами и их обработки, описания сетевых пакетов семейства IP (их структура и т.п.).

     Сеть  задумывалась и проектировалась  так, чтобы от пользователей не требовалось никакой информации о конкретной структуре сети. Для того чтобы послать сообщение по сети, компьютер должен поместить данные в некий "конверт", называемый, например, IP ,указать на этом "конверте" конкретный адрес в сети и передать получившиеся в результате этих процедур пакеты в сеть.

myunivercity.ru

Реферат - Интернет - Рефераты на репетирем.ру

Реферат

На тему: “Глобальная компьютерная сеть Интернет”.

Подготовила: Ученица 11 “В” класса Преподаватель:

СШ № 26

Гружевская Екатерина

г. Южно-Сахалинск, 2002г.

Мой реферат посвящён работе в глобальной компьютерной сети Интернет. Что такое Интернет, как возникла эта сеть, зачем нам нужен Интернет, как с ним работать и где можно найти забавные компьютерные штучки? На эти вопросы я попытаюсь дать ответ. Мы обсудим самые важные проблемы, возникающие почти у каждого начинающего пользователя, однако сразу же хотелось бы отметить, что сеть Интернет очень быстро развивается, появляются новые возможности, новые технологии, новые программы для работы в сети, и информация быстро устаревает. Единственный способ ориентироваться в ситуации – постоянная практика.

Ещё несколько лет назад Интернет был роскошью, далеко не каждый пользователь компьютера мог позволить себе это удовольствие. Сегодня Интернет стал доступен практически каждому. Более того многим он сейчас просто необходим. Что же нам даёт работа в сети?

Представьте себе, что лет десять назад вам срочно надо было бы узнать какую- нибудь важную информацию. Скорее всего Вы обратились бы в библиотеку или в справочную службу. Это требовало определённых усилий и временных затрат. Более того, не во всех библиотеках есть та информация, которая нужна Вам. И так далее – проблем и неудобств. Теперь представьте себе другую картину. Вы сидите за своим персональным компьютером, входите в сеть Интернет и буквально за считанные минуты получаете тексты, фотографии, музыку, видео. Можно воспользоваться Британской энциклопедией или познакомиться с последними разработками NASA в области космических исследований. Вы можете взглянуть на фотографию обратной поверхности Луны или насладиться пейзажами пустынь. Вы можете послушать последние хиты клубной музыки. А главное, Вы можете сохранить все эти данные у себя в компьютере и использовать их в работе.

Действительно, в сети Вы получите наиболее свежую информацию об общественно-политических, финансово-экономических, спортивных событиях по всему миру. Информация появляется раньше, чем в газетах и аналитических журналах. Кроме того новости ежечасно ( а бывает и ежеминутно) обновляются.

Финансисты, работники банков и биржевые игроки – вот люди, чья успешная работа зависит от свежих новостей. Котировки акций, курс валют, оптовые, розничные цены на товары, услуги и т.д. – всё это более чем доступно в сети.

Работая за своим компьютером, Вы можете получить сертификаты различных курсов и дипломы университетов. Можно учить иностранные языки или экономические науки.

Вот уж чего в Интернете хватает, так это различной забавной и полезной (или бесполезной) ерунды. Анекдоты, шутки, картинки, слухи, сплетни, смешные истории. Всё, что душе угодно на любом языке и в любом количестве.

Ничто не затягивает глубже в сети Интернет, чем “чат” – общение с людьми из различных уголков мира в реальном времени. То есть, Вы у себя дома печатаете текст на клавиатуре, а Ваш партнер сразу же видит его на экране и уже готов печатать ответ. Такой диалог возможен, как с одним, так и с несколькими партнёрами одновременно.

Электронная почта – понятие неотделимое от понятия “сеть Интернет”. Исторически почта была одним из самых первых видов сервиса и использовалась для передачи личных сообщений. Передача сообщений предполагает наличие у Вас и у получателя специального компьютерного почтового адреса и определённых программных средств для создания, отправки и получения письма. Сейчас помимо передачи служебной и личной информации с посланием можно отправить какой-нибудь небольшой файл.

Именно в сети Интернет Вы можете найти самые последние версии популярных, а так же редких программ, самые новые дополнения и исправления к уже вышедшим версиям, самые новые антивирусы и многое, многое другое.

Развитие сети Интернет открывает всё новые и новые горизонты перед пользователями.

История возникновения сети Интернет.

Что бы хорошо представлять современное состояние и организацию сети, нужно немного рассмотреть историю возникновения Интернет. Следующим шагом после создания персональных компьютеров стала идея их объединения с целью обмена информацией между ними. Конечно, для переноса файлов можно использовать внешние носители информации, такие как магнитные ленты, перфокарты, дискеты, но в тех случаях, когда требуется оперативность и надёжность передачи, эти средства не подходят. Например, дискеты, портятся, теряются, имеют небольшой объём. И вот в начале 60-х годов американские учёные, работавшие в области компьютерных технологий, подошли к проблеме: как объединить вместе несколько компьютеров и их пользоватилей. Эта актуальная проблема получила всестороннюю поддержку от правительства США, которое в конце 60-х годов решило оказать финансовую помощь экспериментальной компьютерной сети. Эта сеть была учреждена Агентством Перспективных Исследований США (Advanced Research Project Agency) и получила название ARPANET. День рождения этой сети 2 января 1969 года.

Пожалуй, самым важным итогом развития сети ARPANET стало создание сетевых протоколов, а именно семейства протоколов TCP/IP (Transmission Control Protocol/Internet Protocol). Протокол – это своего рода язык общения удалённых компьютеров. Таким образом, Arpanet стала представлять содой высокоскоростную магистраль (backbone), обеспечивающую физическую связью между узлами (хостами). Вначале число хостов было невелико, всего 213. В середине 80-х годов Национальный научный фонд (NSF) создал несколько суперкомпьютерных центров, расположенных в разных частях США. Вторым шагом было объединение их в новую магистральную сеть NSFNET и подключение к ней региональных центров. Сеть NSFNET заняла место ARPANET, которую в итоге ликвидировали. Параллельно создавались национальные сети в других странах. К 90-м годам они объединились: таким образом возник сегодняшний Интернет. В нашей стране Интернет появился сравнительно недавно. Пик развития сети пришёлся на 1995-1996гг. Во многом это связано с выходом в свет оперативной системы Windows 95, значительно упрощающий подключение и настройку. На сегодняшний день Интернет доступен каждому. Для подключения достаточно уделит внимание трём пунктам :

  • Выбрать и установить модем ( устройство через которое мы подключаемся к сети)

  • Выбрать провайдера ( то есть фирму, которой мы платим за работу в сети)

  • Произвести необходимые настройки и установить соответствующее программное обеспечение.

Устройство Интернет.

Интернет, как отмечалось выше, представляет собой совокупность многих тысяч компьютерных сетей, объединённых в одну глобальную сеть. Рассмотрим подробнее как устроен Интернет.

Любой житель огромного мегаполиса имеет свой уникальный идентификатор – это его почтовый адрес и паспортные данные. В сети Интернет ситуация очень похожа. Каждый компьютер, подключённый к сети, имеет свой номер, так называемый IP-адрес.

IP-адреса состоят из четырёх частей, размер каждой из которых один байт. Это означает, что каждая из четырёх частей может принимать значение от 0 до 255. Они объединены в запись, где каждая часть отделена точкой. Например, запись 129.102.223.94 . Всякий раз при передаче информации указывается IP-адрес отправителя и получателя. Означает ли это, что в голове придётся держать множество цифр? К счастью нет. Дело в том, что существует гораздо более простой способ адресации в сети – Domain Name System (Доменная система имён), или, сокращённо, DNS.

Доменное имя компьютера – это уникальное алфавитно-цифровое имя, как правило, несущее смысловую нагрузку и гораздо легче запоминаемое, чем IP- адрес. Оно состоит из нескольких частей, причём домен верхнего уровня находится в имени справа, а домен нижнего уровня слева. Как правило в среднем используется 3-5 уровней. Возьмем два уровня и поясним их организацию.

microsoft.com

http://home.projects.alpha.com/

Обратите внимание, что в большинстве случаев, говоря об адресации в сетиИнтернет, Вы скорее всего будете видеть такую форму записи: www.microsoft.comили http://www.microsoft.com/. О том что такое “http://”, “www” и “ftp://”, я расскажу чуть позже в разделе протоколы.

В этих именах представлены домены двух и четырёх доменов соответственно. Начнём с домена верхнего уровня – “com”. Домены верхнего уровня можно условно поделить на две категории: стандартные и организованные по региональному признаку. В первом случае имя домена установлено организацией, контролирующей подключение к Интернет ( Network Information Center). Таких доменов шесть:

  • com – коммерческие компании

  • edu – образовательные учреждения

  • gov – правительственные учреждения

  • mil – военные учреждения

  • net – сетевые организации

  • org – другие организации

Эти домены в основном используются в Америке. Во втором случае домена определяется по территориальному признаку. Такое имя состоит из двух букв:

Домен второго уровня как правило совпадает с именем фирмы или организации. У большинства крупных компаний адрес очень простой, например, pentagon. mil, pepsi.ru и т.д. Откуда берётся домен третего уровня? Предположим, крупная компания содержит ряд подразделений. Каждому подразделению выделяют свой домен.

Электронная почта.

Как уже отмечалось раньше электронная почта – самый быстрый и надёжный способ передачи информации. Что бы обмениваться сообщениями с помощью e-mail, пользователь должен иметь выход в Интернет, иметь свой адрес и знать адрес получателя. Адрес состоит из двух частей, разделённый специальным символом @, который заменяет английский предлог “at”. Первая часть это уникальное имя пользователя (идентификатор), вторая – имя компьютера (узла) Интернет. Типичный почтовый адрес выглядит так: [email protected]или[email protected]. Кроме того нужна специальная программа, с помощью которой можно написать письмо, отправить его, получить и прочитать новые сообщения, удалить лишние письма и т.д. Пожалуй самая удобная и быстрая программа для работы с электронной корреспонденцией - Outlook Express. Об этом я расскажу позже. Нужно отметить, что передача сообщений осуществляется по протоколам SMTP (Simple Mail Transfer Protokol) – Простой Протокол Передачи Почты и POP3 (Post Office Protocol) –Протокол Почтового Офиса.

FTP, хранилище файлов. Вы уже узнали, что для отправки простых текстовых сообщений используется электронная почта. Но предположим, что Вы хотите передать файл (программу, фотографию или документ). Конечно, можно было бы передать файл, прикрепив его письму, но в некоторых случаях это было бы неудобно. Лучше воспользоваться сервисом FTP(File Transfer Protocol)-Протокол Передачи Файлов. Этот

вид сервиса специально создан для того, чтобы Вы могли установить связь с удалённым компьютером в Интернет(используя программу FTP на вашей локальной машине), посмотреть файлы, доступные на нём, и скопировать те, которые Вам необходимы. FTP является основным способом распространения бесплатных программ и различных исправлений и дополнений к коммерческим версиям.

WWW, “Всемирная паутина”. Наиболее популярный сервис в Интернет, World Wide Web предоставляет возможность работать с документами, в которых объединены текст, графика, звуковые фрагменты, видео и анимация. Документы WWW содержат ссылки на другие, связанные по смыслу документы. Щёлкнув мышью пользователь сразу же переходит к тому документу, на который указывает ссылка. Эта возможность позволяет гораздо быстрее находить нужную информацию. Работа WWW строиться на протоколе HTTP – Hyper Text Transfer Protocol (Протокол передачи гипертекста) Для просмотра Web-страниц используются специальные программы-броузеры, например Microsoft Internet Explorer.

Выбор подключения к сети.

Работать с сетью можно либо через выделенную линию, либо через телефонную сеть с использованием модема. В первом случае Вы становитесь счастливым обладателем высокоскоростного соединения, без помех и ослабления сигнала. Но это очень дорогое удовольствие, которое вряд ли доступно частным лицам. Во втором случае используется телефонная линия Это наиболее распространённый вариант работы с сетью. Первое, что Вам понадобится для выхода в Интернет через телефонную линию, это модем (МОдулятор-ДЕМодулятор), устройство посылающее и принимающее данные. Модемы разделяют на два типа: внутренние и внешние. Внутренний модем представляет собой плату расширения, которая вставляется в один из слотов на материнской плате. Внешние модемы – те же платы, но в отдельном пластмассовом корпусе.

Весьма важной характеристикой модема является скорость передачи данных, измеряемая в BPS (биты в секунду). Первые модемы имели скорость 300 или 1200 bps. У современных модемов скорость доходит до 56000 bps.

Большую часть рынка относительно не дорогих и качественных модемов занимает продукция фирмы U.S.Robotics из серии Sportster. Из дешёвых модемов можно обратить внимание на фирмы Motorola, Genius, Lucent.

Цена во многом зависит от фирмы. Сейчас цены на эти устройства колеблется в пределах 25-300$.

Итак, модем куплен и установлен. Кто же поможет нам выйти в Интернет? Выход в Интернет обеспечивают специальные фирмы-провайдеры. Фирм этих в крупных городах достаточно много, и проблема, как правило сводится к выбору подходящего поставщика. Не покупайтесь на рекламу, не гонитесь за дешёвыми тарифами и не заключайте сразу долгосрочные договоры и не оплачивайте большое количество часов наперёд.

Что мы должны получить от провайдера для работы в сети Интернет?

Обязательно Желательно

Номер телефона (модем)

Номер телефона (лучше несколько вариантов)

Имя пользователя (Логин)

Имя пользователя (Логин)

Пароль

Пароль

DNS

HTTP/FTP cache (Proxy server)

E-mail service (POP3, SMTP)

Телефон технической поддержки

Адрес домашней Web-странички провайдера

Допустим, провайдер выбран и вся необходимая информация получена. Нам остается только настроить Windows95/98/ME для работы в сети Интнрнет. Рассмотрим, что необходимо сделать. Здесь нужно отметить, что, если у Вас установлена операционная система Windows98/ME, то все настройки подключения займут несколько минут. Найдите в главном меню программу “Мастер подключения к Интернет” и запустите её. Все настройки протоколов и драйвера мастер установит самостоятельно.

Для Windows 95

  1. Установка средств связи “Удалённый доступ к сети”.

Откройте панель управления Windows, найдите и откройте программу “Установка и удаление программ”. Выберите вкладку “Установка Windows”. В появившемся диалоговом окне выберите строчку “Связь” и нажмите кнопку “Состав”. В списке компонентов найдите и выделите строчку “Удалённый доступ к сети” и нажмите “OK”. Если операционная система Windows была установлена на Ваш компьютер с компакт-диска, Вам потребуется CD-Rom диск с дистрибутивом Windows. В лучае если операционная система производилась с винчестера, CD-Rom Вам не понадобится. Из установленного пакета будут скопированы файлы. Теперь перейдём к установке протокола TCP/IP.

  1. Конфигурирование “Удалённого доступа”

Откройте панель управления и выберите пиктограмму “Сеть”. Откройте её и проверьте наличие компонентов: “Контролёр удалённого доступа” и “TCP/IP”. Если они отсутствуют, воспользуйтесь кнопкой “Добавить”.

  1. Создание нового соединения.

Откройте пиктограмму “Мой компьютер”. Найдите и откройте пиктограмму “Удалённый доступ к сети”, затем “Новое соединение” В первом окне укажите название соединения и проверьте правильно ли указан модем. Нажмите кнопку “Далее”. Укажите код города и телефон провайдера. Нажмите кнопку “Далее”. Теперь почти всё готово для выхода в сеть. Двойной щелчок по пиктограмме приведёт к появлению окна диалога, куда Вы вводите имя пользователя и пароль. Затем нажмите кнопку подключиться, модем наберёт номер поставщика услуг Интернет, если всё в порядке Вы войдёте в сеть.

Первый выход в сеть.

Сразу после успешного выхода в сеть вы увидите первую Web-страницу, так называемую “Домашнюю”. Адрес домашней страницы можно изменить.

Рассмотрим, как устроено окно программы. Верхняя часть окна отведена под заголовок. Здесь отображено название программы и название текущей страницы. Ниже строка меню и панель инструментов. Под панелью Вы видете адресную строку. В самом низу находится строка состояния.

Обратите внимание на панель инструментов. Здесь расположено несколько кнопок, помогающих нам осуществлять переходы. Поясним их значения:

  • “Назад”. Открыв несколько документов, мы можем возвращаться обратно на предыдущие странички.

  • “Вперёд”. Если мы вернёмся на несколько шагов назад, эта кнопка станет доступной. Она выполняет обратную функцию.

  • “Остановить” Если документ долго загружается или вы нечаянно переходите на не ненужную Вам страницу, эта кнопка отменит переход.

  • “Обновить”. Есть документы, обновление которых происходит каждую минуту или каждые несколько минут. Данная кнопка поможет повторно загрузить данную страницу.

  • “Домой”. Эта кнопка сразу же перенесёт Вас на домашнюю страницу.

Полезные возможности.

Во-первых, программа запоминает введённые в поле адресной строки ссылки. Во-вторых, удобным средством хранения ссылок является папка “Избранное”. В эту папку мы можем добавить адреса наиболее понравившиеся или необходимые в работе. Постепенно папка будет пополняться. Некотарые ссылки устареют и не будут больше представлять для Вас интерес. Вы захотите навести порядок в папке. Для этого используйте команду “Упорядочить избранное”. Далее в правой части окна выбираете интересующие Вас объекты, а в левой части указываем действия, которые Вы можете производить (“Переименовать”, “Переместить”, “Удалить”, “Создать папку”).

Мы получили представление об основах поиска информации. Выяснилось, что для нахождения документа нужно знать адрес странички. Какие же адреса Вам могут понадобиться?

Запомните этот адрес –www.rambler.ru. А лучше добавьте в “Избранное”. Почему? Потому что это – наиболее удобная и популярная поисковая система в Российском Интернете. Содержит миллионы документов с более чем 15000 сайтов. Имеет развитый язык запросов и гибкую форму вывода результатов. На страничке Вы видите список ссылок, сгрупированных по темам. Этот список озаглавлен Top100, то есть лучшие сайты Интернет, по рейтингу Rambler. Там Вы можете найти почти всё, что нужно. Так же Вы можете воспользоваться “Поиском по ключевому слову” в самом начале страницы. В пустое поле введите запрос и нажмите кнопку “Поиск”. Через несколько секунд откроется результат поиска.

Теперь я перечислю список наиболее интересных адресов.

Адрес Краткое описание

http://www.anecdotov.net.

Шутки, анекдоты, карикатуры, забавные фотографии.

http://www.atlant.ru

Прейс-листы по товарам и услугам в Санкт-Петербурге

http://www.auto.ru

Автомобили в России

http://www.doctor.ru

Лучший сайт о медицине, здоровье и нездоровье.

http://www.freeware.ru

Сборник полезных программ, утилит и файлов бесплатно.

http://www.job.ru

Поиск работы.

http://www.kino.ru

Новости кино.

http://www.kiss.ru

Клуб знакомств.

http://www.lenta.ru

Новости.

http://www.mail.ru

Бесплатная почта.

http://www.mp3.ru

Музыка.

http://www.rbc.ru

Финансовые новости и аналитическая информация.

http://www.memstick.chat.ru

Бумага для записок.

http://www.video.ru

Новости видеорынка.

http://www.wallpapers.ru

Обои для рабочего стола

Список литературы:

  1. “Персональный компьютер для начинающих” - В.С. Артамонов, Д.Б. Кашенков, Е.С. Серебряков.

  2. Журнал “Она” №2/2002. Статья “Мой уютный компьютер”

referat.store


Смотрите также

 

..:::Новинки:::..

Windows Commander 5.11 Свежая версия.

Новая версия
IrfanView 3.75 (рус)

Обновление текстового редактора TextEd, уже 1.75a

System mechanic 3.7f
Новая версия

Обновление плагинов для WC, смотрим :-)

Весь Winamp
Посетите новый сайт.

WinRaR 3.00
Релиз уже здесь

PowerDesk 4.0 free
Просто - напросто сильный upgrade проводника.

..:::Счетчики:::..

 

     

 

 

.