Глобальная вычислительная сеть Internet

Глобальные вычислительные сети. Что такое Internet. Краткая история Internet. Браузеры: сравнительные характеристики Netscape Navigator и Microsoft Internet Explorer. Поисковые системы. Механизмы поиска. Сравнительный обзор поисковых систем.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 28.10.2008
Размер файла 36,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Тема: «Глобальные вычислительные сети Internet»

Содержание

1. Введение

1.1 Что такое Internet

1.2. Краткая история Internet

2. Браузеры: сравнительные характеристики Netscape Navigator и Microsoft Internet Explorer

3. Поисковые системы

3.1. Механизмы поиска

3.2. Сравнительный обзор поисковых систем. Структура запроса

4.Заключение

1. Введение

1.1. Что такое Internet

Internet -- глобальная компьютерная сеть, охватывающая весь мир. Сегодня Internet имеет около 30 миллионов абонентов в более чем 180 странах мира. Ежемесячно размер сети увеличи-вается на 5-7%. Internet образует как бы ядро, обеспечивающее связь различных информационных сетей, принадлежащих раз-личным учреждениям во всем мире, одна с другой.

Всплеск интереса к глобальной информационной сети Internet наблюдается сейчас повсеместно. В сложившихся усло-виях потребность в информации о сети Internet становится осо-бенно острой. В настоящее время по Internet распространяется множество документов, касающихся как функционирования сети и работы в ней пользователей, так и связанных с различ-ными сферами жизни: наукой, культурой, экономикой и т.д. Причем, обновление информации в Internet, обширной развет-вленной сети, которая включает в себя компьютерные узлы, разбросанные по всему миру, происходит, практически, и режиме реального времени.

В действительности Internet не просто сеть, -- она есть структура, объединяющая обычные сети. Internet -- это «Сеть сетей».

Чтобы описать сегодняшнюю Internet, полезно воспользоваться строгим определением. В своей книге «The Matrix: Computer Networks and Conferencing Systems Worldwide» Джон Квотерман описывает Internet как «метасеть, состоящую из мно-гих сетей, которые работают согласно протоколам семейства TCP/IP, объединены через шлюзы и используют единое адрес-ное пространство и пространство имен».

Для организации межсетевых соединений необходим соот-ветствующий протокол.

Протокол -- это набор договоренностей, который определя-ет обмен данными между различными программами. Протоко-лы задают способы передачи сообщений и обработки ошибок в сети, а также позволяют разрабатывать стандарты, не привязан-ные к конкретной аппаратной платформе. Все параметры -- от скорости передачи данных до методов адресации при транспор-тировке отдельных сообщений -- задаются протоколами, исполь-зуемыми в данной конкретной сети.

В Internet базовым протоколом служит TCP/IP (Transmission Control Protocol/Internet Protocol). IP отвечает за адресацию се-тевых узлов, a TCP обеспечивает доставку сообщений по нуж-ному адресу. Эти мощные протоколы были предложены в 1974 г. Робертом Кэном, одним из основных разработчиков ARPANET, и ученым-компьютерщиком Винтоном Серфом, вице-президен-том CNRI. Следует иметь в виду, что TCP/IP не единственный протокол, пригодный для объединения различных сетей. Internet ныне превратилась в многопротокольную сеть, интегрирующую другие стандарты. Основные среди них -- стандарты взаимодей-ствия открытых систем (OSI).

Предложенные Международной организацией по стандарти-зации (ISO) протоколы OSI получили широкое распростране-ние в Европе. Системы, основанные на других протоколах, тоже подключаются к Internet через шлюзы. Например, BITNET -- это сеть, которая использует для передачи данных свои собствен-ные стандарты, однако, по крайней мере, частично, она доступ-на через шлюзы из Internet.

В Internet нет единого пункта подписки или регистрации; вместо этого вы контактируете с поставщиком услуг, который предоставляет нам доступ к сети через местный компьютер. По-следствия такой децентрализации с точки зрения доступности сетевых ресурсов также весьма значительны. Среду передачи дан-ных в Internet нельзя рассматривать только как паутину прово-дов или оптоволоконных линий. Оцифрованные данные пере-сылаются через маршруты шторы, которые соединяют сети и с помощью сложных алгоритмов выбирают наилучшие маршру-ты для информационных потоков.

1.2. Краткая история Internet

Вначале ничто не предвещало, что Internet станет общедос-тупной компьютерной сетью. Как и многие другие великие идеи, «Сеть сетей» возникла из проекта, предназначавшегося совершенно для других целей. Ее прародительницей стала сеть ARPANET, разработанная и развернутая в 1969 г. компанией «Bolt Beranek and Newman» (BBN) по заказу Агентства передо-вых исследовательских проектов (ARPA) Министерства оборо-ны США.

ARPANET объединяла учебные заведения, военные органи-зации и их подрядчиков. Она была создана с целью помочь ис-следователям в обмене информацией, а также (что явилось од-ной из главных целей) для отработки методов поддержания связи в случае ядерного нападения.

Основатели ARPANET первоначально позволяли ученым только войти в систему и запустить программу на удаленном компьютере. Скоро к этим возможностям прибавились переда-ча файлов, электронная почта и списки рассылки, обеспечив-шие общение исследователей, интересовавшихся одной и той же областью науки и техники. Но по мере роста ARPANET раз-вивались и другие сети, и вскоре стала очевидной потребность в новых средствах связи.

Сравнительно недавно появилась новая технология Internet, названная World Wide Web (WWW), что обычно переводится как «Всемирная паутина». Эта система была разработана, в основ-ном, в Европейской лаборатории элементарных частиц в Швей-царии (CERN). Сеть предназначалась первоначально для физи-ков, но затем получила широкое признание.

WWW построена по технологии, в основе которой лежит принцип создания гипертекстовых документов (Web-страниц). Гипертекстовый документ заключает в себе ссылки на другие по-добные документы, которые, в свою очередь, содержат ссылки на следующие, и т.д. Таким образом, они оказываются связанными между собой.

Для работы в WWW используется протокол HTTP (Hyper Text Transmission Protocol), а программы, позволяющие работать с со-ответствующими документами в Internet, называют просмотрщиками, или браузерами.

2. Браузеры: сравнительные характеристики Netscape Navigator и Microsoft Internet Explorer

Документы Internet предназначены для отображения в элек-тронном виде, причем автор документа не знает возможностей компьютера, на котором будут просматриваться документы. По-этому был создан стандарт для описания и создания докумен-тов, расположенных на Web-страницах. Этот язык называется HTML (HyperText Markup Language -- язык разметки гипертек-ста). Этот язык описывает логическую структуру документа, уп-равляет форматированием текста и размещением вставных объектов.

Форматирование и отображение документа, описанного с помощью HTML, на конкретном компьютере производится спе-циальной программой -- браузером. Проще говоря, браузер пред-назначен для просмотра содержимого Web-страниц.

Основные функции браузеров следующие:

установка связи с Web-сервером, на котором хранится доку-мент, и загрузка всех его компонентов;

форматирование и отображение Web-страниц в соответствии с возможностями компьютера, на котором браузер работает;

предоставление средств для отображения мультимедийных и других объектов входящих в состав Web-страниц, а так же ме-ханизма расширения, позволяющего настраивать программу на работу с новыми типами объектов;

обеспечение автоматизации поиска Web-страниц и упроще-ние доступа к страницам, посещавшимся раньше;

предоставление доступа к встроенным или автономным сред-ствам для работы с другими службами Internet.

В настоящее время на этом рынке доминируют два браузера: Navigator фирмы Netscape и Internet Explorer фирмы Microsoft.

Они предоставляют пользователям весьма схожий интерфейс и набор основных возможностей и ведут на этом рынке весьма жесткую конкурентную борьбу, постоянно обновляя предыду-щие версии.

Ниже приводится описание основных возможностей этих браузеров.

Браузер Internet Explorer обеспечивает работу с WWW, пре-доставляет и идентичные средства работы с локальными папками компьютера и файловыми архивами FTP, дает доступ средствам связи с Internet.Для запуска программы можно использовать значок Internet Explorer на Рабочем столе или Главного меню. Кроме того, программа запускается автоматически при попыт-ке открыть документ Internet или локальный документ в форма-те HTML.

Если соединение с Internet отсутствует, то после запуска про-граммы появиться диалоговое окно установки соединения. При невозможности установки соединения сохраняется возможность просмотра в автономном режиме ранее загруженных Web-документов. При наличии соединения после запуска программы на экране появится основная страница, выбранная при настройке программы.

Далее можно работать с Web-страницами, просматривая их содержимое, сохраняя его на локальном диске и т.д. При этом можно открывать несколько окон, работая с несколькими Web-страницами.

Для более эффективной работы в Internet необходима на-стройка Internet Explorer. Параметры оптимальной настройки зависят от:

свойств видеосистемы компьютера;

производительности действующего соединения с Internet;

содержания текущего Web-документа;

личных предпочтений пользователя.

Настроить Internet Explorer можно как из самой программы, так и через Панель управления.

Если браузер не способен отображать файлы определенного типа (*.ехе, *.zip и т.д.), инициируется процесс загрузки данного файла на компьютер. Программа Internet Explorer 5.0 запускает мастер загрузки файлов, на первом этапе работы которого тре-буется указать открывать ли файл или сохранить его на локаль-ном диске. Чаще всего файл сохраняется. Это позволяет исполь-зовать его в дальнейшей работе, не выходя в Internet. Этот про-цесс называется проще -- «скачать файл».

Netscape Navigator-- один из лучших Web-браузеров, главная программа пакета Netscape Communicator. С его помощью можно просматривать содержимое Web-страниц, копировать файлы, искать различного рода информацию, работать с текстом и мультимедийными файлами Internet.

Оба браузера имеют свои преимущества. Например:

Internet Explorer поставляется бесплатно в составе программного обеспечения фирмы Microsoft;

Internet Explorer имеет более широкие возможности при на-стройке на конкретные вкусы потребителя и большее количество выполняемых функций;

Netscape Navigator-- имеет большую скорость при работе с Web-страницами.

Но, в принципе, оба браузера выполняют похожие задачи и полностью удовлетворяют запросы пользователей при работе с Internet.

Одной из основных архитектурных особенностей Explorer яв-ляется применение ActiveX-- технологии, которая позволяет удобно конфигурировать, например, вид и возможности пане-ли инструментов, что делает компьютер доступным даже для детей.

Оба браузера поддерживают возможность создания HTML-до-кументов, причем Explorer позволяет создавать темплайты, что также упрощает создание web-страниц.

Internet Explorer поддерживает наиболее распространенные языки, облегчая пользовательский интерфейс, поддерживает все основные сетевые стандарты и предусматривает интерфейс без использования мыши и возможность изменять шрифт для удоб-ства просмотра.

Что касается скорости просмотра Web-страниц, то Microsoft утверждает, что Navigator проигрывает в скорости, по крайней мере, на 30%.

Netscape подчеркивает отличие Navigator от других браузе-ров, а в особенности, от Internet Explorer, количеством необхо-димой для него памяти, скоростью работы, значительными удоб-ствами для создателей Web-документов, наличием системы, по-зволяющей компьютеру пользоваться телефонными услугами Internet в режиме реального времени. К тому же это позволяет избежать неудобств обычной телефонной связи.

Когда Netscape неожиданно появилась на рынке, Microsoft пришлось немедленно отреагировать, чтобы не потерять часть своего бизнеса. Без такой яростной конкуренции между двумя гигантами не было бы ни такого широкого использования Web, ни коммерческих Web-серверов, ни недорогих браузеров с гра-фическими интерфейсами. Это соперничество породило недо-рогие продукты, которые, благодаря использованию протоко-лов Internet, способны к взаимодействию. Преодолеть несовме-стимость различных HTML проще, чем те трудности, которые могли бы возникнуть, считают оптимисты.

3. Поисковые системы

Основная задача Internet -- предоставление необходимой ин-формации. Чтобы найти нужную информацию необходимо знать адрес Web-страницы, на которой эта информация находится. Лучше всего искать в Сети необходимую информацию с помо-щью поисковых систем. Поисковая система представляет собой специализированный Web-узел. Поисковые системы классифи-цируют но методам поиска.

Поисковые каталоги предназначены для поиска по темам. Обычно они построены по иерархическому принципу, т.е. каж-дый шаг поиска это выбор подраздела с белее конкретной тема-тикой искомой информации. На нижнем уровне поиска пользо-ватель получает относительно небольшой список ссылок на ис-комую информацию.

Поисковый индекс обеспечивает поиск по заданным ключе-вым словам. Обычно ключевые слова вводятся при заполнении специальной формы поиска, после чего нажимается кнопка «По-иск». В результате поиска формируется набор гиперссылок на Web-страницы, содержащий указанные термины. Обычно поис-ковые индексы выдают огромное количество искомых страниц. В этом списке представлены ссылки на различные Web-стра-ницы, причем ссылки располагаются по степени убывания встре-ченных на данных страницах слов, совпадающих с ключевыми словами. При просмотре списка необходимо выбрать те стра-ницы, которые нужно просмотреть. Некоторые системы состав-ляют список ссылок по степени свежести страниц, другие же -- по степени вероятности того, что данные страницы окажутся ис-комыми. Вычисление вероятности основывается на данных о том, как скоро на странице встречается искомое слово. Первы-ми в таком списке идут ссылки на те страницы, у которых клю-чевые слова встречаются уже в названии.

Поисковые каталоги предоставляют доступ к меньшему количеству страниц, чем поисковые индексы, но они точнее указывают на основные ресурсы Сети. Поэтому при первичном по-иске информации целесообразно использовать поисковые каталоги. А квалифицированным пользователям Internet более полезны поисковые индексы. Они позволяют разыскать малоизвестные и узкоспециализированные ресурсы. Многие современные поисковые системы сочетают в себе оба указанных метода.

Программа Internet Explorer 6.0 имеет специальные средства организации поиска без явного обращения к поисковым систе-мам. Можно получить доступ к одной из известных поисковых систем, просто щелкнув на кнопке «Поиск», слева появится окно поиска. Далее можно набрать ключевые слова для поиска и выб-рать поисковую систему. Результаты поиска будут отражены в правой части окна обозревателя. Если выбрать нужную ссылку, то в правом окне появится содержимое выбранной страницы. Чтобы скрыть окно поиска, необходимо щелкнуть на кнопке «Поиск» еще раз.

При работе с Internet Explorer можно проводить поиск прямо в поле «Адрес». Для этого в адресную строку вводиться слово или фраза для поиска. Под адресной строкой откроется окно со сло-вом «Поиск» и искомой фразой. Internet Explorer начнет поиск с использованием заранее определенной системы поиска; при этом кнопка «Поиск» на панели инструментов нажмется сама.

Можно осуществить поиск, нажав кнопку «Пуск» и выбрав опцию меню «Найти». Окно Internet Explorer откроется само с уже нажатой кнопкой «Поиск».

Если удалось найти то, что искали, но все же не совсем то, то в этом случае пригодится механизм связанных ссылок. Для любой Web-страницы можно просмотреть список ссылок, име-ющих к ней отношение, возможно, среди них окажется как раз то, что нужно. Чтобы просмотреть связанные ссылки, нужно сделать следующее. Необходимо выбрать в меню «Сервис» ко-манду «Показать связанные ссылки».

После этого на панели инструментов нажать кнопку «По-иск», и в левой части экрана появится окно, содержащее спи-сок ссылок, связанных с данной страницей. Нужно щелкнуть на одной из ссылок и просмотреть в правом окне соответству-ющую Web-страницу.

Чтобы скрыть окно поиска, необходимо щелкнуть еще раз на кнопке «Поиск»

3.1. Механизмы поиска

Поисковые системы обычно состоят из трех компонентов:

агент (паук или кроулер), который перемещается по Сети и собирает информацию;

база данных, которая содержит всю информацию, собирае-мую пауками;

поисковый механизм, который люди используют как интер-фейс для взаимодействия с базой данных.

Средства поиска и структурирования, иногда называемые по-исковыми механизмами, используются для того, чтобы помочь людям найти информацию, в которой они нуждаются.

Средства поиска типа агентов, пауков, кроулеров и роботов используются для сбора информации о документах, находящихся в Сети Internet. Это специальные программы, которые занима-ются поиском страниц в Сети, извлекают гипертекстовые ссыл-ки на этих страницах и автоматически индексируют информа-цию, которую они находят для построения базы данных.

Каждый поисковый механизм имеет собственный набор пра-вил, определяющих, как собирать документы. Некоторые сле-дуют за каждой ссылкой на каждой найденной странице и за-тем, в свою очередь, исследуют каждую ссылку на каждой из новых страниц, и так далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам, файлам муль-типликации; другие игнорируют ссылки к ресурсам типа баз данных WAIS; другие проинструктированы, что нужно просмат-ривать, прежде всего, наиболее популярные страницы.

Агенты -- самые «интеллектуальные» из поисковых средств. Они могут делать больше, чем просто искать: они могут выпол-нять даже транзакции от Вашего имени. Уже сейчас они могут искать сайты специфической тематики и возвращать списки сай-тов, отсортированных по их посещаемости. Агенты могут обра-батывать содержание документов, находить и индексировать дру-гие виды ресурсов, не только страницы. Они могут также быть запрограммированы для извлечения информации из уже суще-ствующих баз данных. Независимо от информации, которую агенты индексируют, они передают ее обратно базе данных по-искового механизма.

Агенты извлекают и индексируют различные виды информа-ции. Некоторые, например, индексируют каждое отдельное сло-во во встречающемся документе, в то время как другие индексируют только наиболее важных 100 слов в каждом, индексируют размер документа и число слов в нем, название, заголовки и под-заголовки и так далее. Вид построенного индекса определяет, ка-кой поиск может быть сделан поисковым механизмом и как полученная информация будет интерпретирована.

Агенты могут также перемещаться по Internet и находить им формацию, после чего помещать ее в базу данных поискового механизма. Администраторы поисковых систем могут опреде-лить, какие сайты или типы сайтов агенты должны посетить и проиндексировать. Проиндексированная информация отсыла-ется базе данных поискового механизма так же, как было опи-сано выше.

Общий поиск информации в Сети осуществляют програм-мы, известные как пауки. Пауки сообщают о содержании най-денного документа, индексируют его и извлекают итоговую ин-формацию. Также они просматривают заголовки, некоторые ссылки и посылают проиндексированную информацию базе данных поискового механизма.

Кроулеры просматривают заголовки и возвращают только пер-вую ссылку.

Роботы могут быть запрограммированы так, чтобы перехо-дить по различным ссылкам различной глубины вложенности, выполнять индексацию и даже проверять ссылки в документе. Из-за их природы они могут застревать в циклах, поэтому, про-ходя по ссылкам, им нужны значительные ресурсы Сети. Одна-ко имеются методы, предназначенные для того, чтобы запре-тить роботам поиск по сайтам, владельцы которых не желают, чтобы они были проиндексированы.

Люди могут помещать информацию прямо в индекс, запол-няя особую форму для того раздела, в который они хотели бы по-местить свою информацию. Эти данные передаются базе данных.

Когда кто-либо хочет найти информацию, доступную в Internet, он посещает страницу поисковой системы и заполняет форму, детализирующую информацию, которая ему необходи-ма. Здесь могут использоваться ключевые слова, даты и другие критерии. Критерии в форме поиска должны соответствовать критериям, используемым агентами при индексации информа-ции, которую они нашли при перемещении по Сети.

База данных отыскивает предмет запроса, основанный на ин-формации, указанной в заполненной форме, и выводят соот-ветствующие документы, подготовленные базой данных.Чтобы определить порядок, в котором список документов бу-дет показан, база данных применяет алгоритм ранжирования. В идеальном случае, документы, наиболее релевантные пользова-тельскому запросу будут помещены первыми в списке. Различ-ные поисковые системы используют различные алгоритмы ран-жирования, однако, основные принципы определения релеван-тности следующие:

Количество слов запроса в текстовом содержимом документа.

Тэги, в которых эти слова располагаются.

Местоположение искомых слов в документе.

Удельный вес слов, относительно которых определяется релевантность, в общем количестве слов документа.

База данных выводит ранжированный подобным образом список документов с HTML и возвращает его человеку, сделав-шему запрос.

Различные поисковые механизмы также выбирают различ-ные способы показа полученного списка -- некоторые показы-вают только ссылки; другие выводят ссылки с первыми несколь-кими предложениями, содержащимися в документе или заголо-вок документа вместе со ссылкой.

Когда Вы щелкаете на ссылке к одному из документов, ко-торый вас интересует, этот документ запрашивается у того сер-вера, на котором он находится.

3.2. Сравнительный обзор поисковых систем. Структура запроса

В сети существуют различные способы поиска информации. Конечно же, если имеется справочник, в котором можно найти местонахождение интересующего вас источника конкретной ин-формации, то, без всякого сомнения, следует этим и воспользо-ваться. Однако, к сожалению, такие издания далеко не всегда доступны. Кроме того, сеть является постоянно обновляющейся системой и поэтому находится в курсе всего нового с помощи периодики, а тем более с помощью литературы, не всегда пред-ставляется возможным. Для поисковых целей в Internet суще-ствуют специальные поисковые машины, располагающие зна-чительными базами данных и имеющие связь с себе подобными.

Существенно полезными возможностями у них является на-личие системы поиска, которая строится по принципу: от об-щего -- к конкретному. Задавая общее понятие (в виде ключевого слова, нескольких слов или фразы, -- в зависимости от сер-висных услуг конкретной машины), а затем, с каждым новым поиском все более и более конкретизируя его, можно получить интересующий результат. Поэтому далее будут рассмотрены не-сколько основных поисковых систем, использование которых весьма эффективно.

Исторически сложилось, что первой такой поисковой машиной являлась Alta Vista, поэтому с нее и начнем рассмотрение.

AltaVista. Наиболее интересная возможность AltaVista -- это расширенный поиск. AltaVista разрешает поиск по ключевым фразам, при этом она имеет довольно большой фразеологиче-ский словарь. Кроме всего прочего, при поиске в AltaVista мож-но задать имя поля, где должно встретиться слово. К сожале-нию, подробно процедура ранжирования в документации по системе не описана, но видно, что ранжирование применяется как при простом поиске, так и при расширенном запросе. Ре-ально эту систему можно отнести к системе с расширенным бу-левым поиском.

Lycos. Как и большинство систем, Lycos дает возможность применять простой запрос и более изощренный метод поиска. В простом запросе в качестве поискового критерия вводится предложение на естественном языке, после чего Lycos произво-дит нормализацию запроса, удаляя из него так называемые stop-слова, и только после этого приступает к его выполнению. По-чти сразу выдается информация о количестве документов на каждое слово, а позже и список ссылок на формально релеван-тные документы. В списке против каждого документа указыва-ется его мера близости запросу, количество слов из запроса, по-павших в документ, и оценочная мера близости, которая может быть больше или меньше формально вычисленной.

Пока нельзя вводить логические операторы в строке вместе с терминами, но использовать логику через систему меню Lycos позволяет. Такая возможность применяется для построения рас-ширенной формы запроса, предназначенной для искушенных пользователей, уже научившихся работать с этим механизмом.

Yahoo. Данная система появилась в Сети одной из первых, и сегодня Yahoo сотрудничает со многими производителями средств информационного поиска, а на различных ее серверах используется различное программное обеспечение. Язык Yahoo достаточно прост: все слова следует вводить через пробел, они соединяются связкой «and» либо ,«ог».

При выдаче не указывается степень соответствия документа запросу, а только подчеркиваются слова из запроса, которые встретились и документе. При этом не производится нормали-зация лексики и не проводится анализ на «общие» слова. Хоро-шие результаты поиска получаются только тогда, когда пользо-ватель знает, что и базе данных Yahoo информация есть навер-няка. Ранжирование производится по числу терминов запроса в документе.

Yahoo относится к классу простых традиционных систем с ограниченными возможностями поиска.

Open Text. Информационная система OpenText представляет собой самый коммерциализированный информационный про-дукт в Сети. Все описания больше похожи на рекламу, чем на информативное руководство по работе. Система позволяет про-вести поиск с использованием логических коннекторов, однако размер запроса ограничен тремя терминами или фразами. В дан-ном случае речь идет о расширенном поиске. При выдаче ре-зультатов сообщается степень соответствия документа запросу и размер документа.

Система позволяет также улучшить результаты поиска в сти-ле традиционного булевого поиска. OpenText можно было бы от-нести к разряду традиционных информационно-поисковых си-стем, если бы не механизм ранжирования.

Infoseek. Система Infoseek обладает довольно развитым ин-формационно-поисковым языком, позволяющим не просто указывать, какие термины должны встречаться в документах, но и своеобразно взвешивать их. Достигается это при помощи специальных знаков «+» -- термин обязан быть в документе, и «--» -- термин должен отсутствовать в документе.

Кроме этого, Infoseek позволяет проводить то, что называет-ся контекстным поиском. Это значит, что, используя специаль-ную форму запроса, можно потребовать последовательной со-вместной встречаемости слов. Также можно указать, что неко-торые слова должны совместно встречаться не только в одном документе, а даже в отдельном параграфе или заголовке.

Имеется возможность указания ключевых фраз, представля-ющих собой единое целое, вплоть до порядка слов. Ранжирова-ние при выдаче осуществляется по числу терминов запроса в документе, по числу фраз запроса за вычетом общих слов. Все эти факторы используются как вложенные процедуры. Подводя краткое резюме, можно сказать, что Infoseek относится к традиционным системам с элементом взвешивания термином при по-иске.

WAIS. WAIS является одной из наиболее изощренных поис-ковых систем Internet. В ней не реализованы лишь поиск по не четким множествам и вероятностный поиск. В отличие от мно-гих поисковых машин, система позволяет строить не только вло-женные булевы запросы, считать формальную релевантность по различным мерам близости, взвешивать термины запроса и до-кумента, но и осуществлять коррекцию запроса по релевантно-сти. Система также позволяет использовать усечения терминов, разбиение документов на поля и ведение распределенных ин-дексов.

Rambler. Поисковая система содержит информацию о более чем 12 миллионах документов, расположенных на серверах Рос-сии и стран СНГ.

Rambler обрабатывает ежесуточно не менее 500 тысяч поис-ковых запросов (в среднем-- 5 запросов в секунду), сканируя 48 тысяч Web-серверов и используя несколько одновременно ра-ботающих программ-роботов.

Запрос может состоять из одного или нескольких слов, раз-деленных пробелами. Могут быть использованы как русские, так и английские слова и словосочетания. По умолчанию находят-ся только те документы, в которых встретились все введенные вами слова.

Чтобы найти документы, содержащие хотя бы одно слово из запроса, используется логическая связка «or» или выбирается на странице детального запроса: «Слова запроса: любое». Чтобы ис-ключить документы, содержащие те или иные слова, надо ука-зать на странице детального запроса: «Исключить документы, содержащие следующие слова...».

Все равно, с какой буквы написаны слова запроса: с боль-шой или с маленькой. И при построении индекса, и при поиске по запросу все заглавные (большие) буквы «понижаются».

Слова запроса могут быть соединены логическими связками «and», «or». Вместо связок (или в сочетании с ними) могут ис-пользоваться также символы «&», «|».

Части запроса могут быть сгруппированы с помощью круг-лых скобок. Возможна многократная вложенность скобок в со-четании с логическими операторами.

Rambler умеет искать слова во всех формах (например, ами-нокислота, аминокислоты, аминокислотой и т.д.). Чтобы слово находилось по всех формах, перед ним надо поставить служеб-ный символ «#». В меню детального запроса такой режим мо-жет быть включен для всех слов: «Расширение запроса: все фор-мы слов». Служебный символ «@» перед словом позволяет на-ходить не только само это слово, но и однокоренные слова. В меню детального запроса символу «@» соответствует режим «Рас-ширение запроса: все однокоренные».

По умолчанию наша система ищет слова запроса так, как Вы их ввели, чтобы уменьшить «шум» в найденных документах. Если Вы не помните, как пишется слово, или хотите расширить зап-рос, можно использовать метасимволы «*» и «?» для обозначе-ния произвольной части слова и произвольного символа.

Ограничить поиск частями документов, такими как назва-ние документа, его заголовок, URL и т.п., можно через меню детального запроса «Искать в...».

Можно ограничить поиск документами только на русском или только на английском языке. Для этого надо выбрать соот-ветствующий режим в меню детального запроса «Язык докумен-та...». По умолчанию поиск выполняется по документам на всех языках.

По умолчанию найденные документы сортируются по реле-вантности (соответствию запросу). Однако вы можете потребо-вать, чтобы вместо этого в начало списка были помещены са-мые свежие (или, наоборот, самые старые документы). Для это-го надо выбрать соответствующую установку в меню «Сортиро-вать по...» на странице детального запроса.

Вы можете также ограничить поиск документами, созданны-ми в определенный период времени: для этого необходимо на странице детального запроса указать «От даты ... до даты ...».

Можно потребовать, чтобы Rambler возвращал только те до-кументы, где слова из запроса находятся на минимальном рас-стоянии друг от друга.

Режим «Ограничить расстояние между словами» может быть включен в детальном запросе. Все перечисленные выше прави-ла могут быть использованы совместно друг с другом в необхо-димой вам последовательности.

По умолчанию результаты поиска выдаются порциями по 15 документов. Меню «Выдавать по...» на странице детального зап-роса позволяет увеличить это число до 30 или 50. Меню «Форма вывода...» позволяет получать описания документов с увеличен-ной или уменьшенной подробностью.

Яаndeх. Яаndeх ежедневно просматривает сотни тысяч Web-страниц в поисках изменений или новых ссылок. Коллекция ссылок постоянно растет.

Яаndeх не требует от вас знания специальных команд для поиска. Достаточно набрать вопрос («где найти дешевые компьютеры» или «нужны телефоны Москвы и Московской области»), и вы получите результат-- список страниц, где встречаются эти слова.

Независимо от того, в какой форме вы употребили слово, и запросе, поиск учитывает все его формы по правилам русского языка. Например, если задан запрос «идти», то в результате по-иска будут найдены ссылки на документы, содержащие слона «идти», «идет», «шел», «шла» и т.д. На запрос «окно» будет вы-дана информация, содержащая и слово «окон», а на запрос «от-зывали» -- документы, содержащие слово «отозвали».

При этом поиск не ограничен лишь словами или фразами. Яаndeх отыщет по названию Web-страницу компании или файл с нужной картинкой.

Aport. Обычно запрос представляет из себя просто одно или несколько слов.

По такому запросу находятся документы, в которых встреча-ются все слова запроса. Есть, правда, ограниченное число слов (союзы, предлоги и т.п.), которые в запросе игнорируются, так как не несут сами по себе смысловой нагрузки.

Например, по запросу: яблоки на снегу будут найдены все до-кументы, в которых встречаются одновременно дна слова: «яб-локо» и «снег». Где в пределах документа расположены слова, в какой грамматической форме они находятся -- не важно.

Стоит еще раз подчеркнуть важное и очень полезное свой-ство Апорта: независимо от того, в какой грамматической фор-ме вы пишите в запросе слово, оно находится в документах во всех своих формах. Например, по запросу: человек шел будут най-дены среди прочих и документы, содержащие текст «люди идут». Распознавание всех форм работает для обычных слов русского языка. Для экзотических слов, неологизмов и т.п. оно не прохо-дит. В этом случае может пригодиться оператор «*».

Например, вы хотите найти все, касающееся деятельности президента России, в том числе и документы, содержащие сло-во «ельцинизм». Воспользуйтесь запросом: ельцин*. Он позво-лит вам найти то, что вы хотите (а также документы со словами Ельцинище, ельцинцы/*/)/, ельцененок и т.п.), поскольку звездочка заменяет собой любое число любых букв.

Вы можете искать документы не только по всему русскоязыч-ному Internet, но и но его части. Самый простой случай -- поиск по определенному серверу. Например: url=www.intel.ru собака.

По данному запросу будут найдены все документы на серве-ре www.intel.ru, содержащие слово «собака». Возможно, вам ин-тересно, а что будет, если написать просто: url=www.intel.ru

К этом случае вы получите список всех документов, распо-ложенных на указанном вами сервере.

Вы можете ограничивать поиск и сильнее -- одним из ката-логов сервера. Например: url=www.in!el.ru/sobaki/cen6epnap

По данному запросу документы, содержащие слово «сенбер-нар», будут искаться только в каталоге /sobaki (и его подкатало-гах) московского сервера корпорации Intel.

List. На главной странице в верхней ее части расположены ссылки на наиболее популярные проекты. Ниже, под логоти-пом каталога, поисковая форма. В правой колонке и нижней части страницы -- блоки самых актуальных новостей. Список ссылок на основные категории каталога занимает централь-ную часть. Цифры рядом с названием категории показывают количество сайтов, содержащихся в ней. Записанные мелким шрифтом заголовки отсылают при нажатии на подкатегории раздела.

Щелкнув по любому из названий, вы попадете в соответству-ющую рубрику и под логотипом List.ru увидите полный путь до нее, начиная с главной страницы. Каждый промежуточный уро-вень структуры доступен по отдельной ссылке. Поиск в катало-ге реализован таким образом, что в результате запроса могут быть найдены как отдельные сайты, так и рубрики.

Допускается использованием языка запросов Яаndeх. Распо-ложенная рядом с поисковой формой ссылка «Структура ката-лога» открывает в отдельном окне полный рубрикатор каталога. Реализована возможность перехода из рубрикатора в любую выб-ранную подкатегорию. Более детальное тематическое деление текущей рубрики представлено списком ссылок.

Помеченные символом «@» приведут в подкатегории, струк-турно входящие в другие разделы, но содержащие близкую по содержанию информацию. Если Вы хорошо представляете, в ка-кой рубрике содержатся нужные ресурсы, лучше перейти в нуж-ную подкатегорию, воспользовавшись любым из предоставляемых средств навигации по каталогу. В противном случае можно искать их в полном списке.

Каталог организован таким образом, что все сайты, содержащиеся на нижних уровнях структуры, представлены и в рубриках. Показываемый ниже список ресурсов упорядочен и алфавитном порядке, но, выбрав соответствующую сортировку («По времени добавления» или «По переходам»), можно просмотреть их по порядку добавления в каталог (начиная с самых «свежих») или в зависимости от популярности среди посетите-лей каталога. Ссылка с названия сайта открывает в отдельном окне его зарегистрированную в данной рубрике страницу. По-метки RUS и ENG означают наличие на сайте страниц, соот-ветственно на русском и английском языках.

4.Заключение

С развитием Internet появилась возможность быстрого и удоб-ного поиска необходимой информации. Теперь можно не зани-маться подбором и изучением огромного количества литерату-ры в книжных магазинах и библиотеках. Информацию можно получить, не выходя из дома или офиса. Для этого нужен толь-ко непосредственно сам компьютер, подключенный к Internet с установленной специальной программой -- браузером, предназ-наченной для просмотра содержимого Web-страниц.

Благодаря разнообразию поисковых систем, специально раз-работанных для рядового пользователя, каждый может без тру-да отсечь заведомо ненужный поток информации, лишь пра-вильно сформулировав цель поиска.

Список использованной литературы

Лучшие рефераты по информатике / Составитель Л 82 М. Семенов. Серия «Банк рефератов». - Ростов н/Д: Феникс, 2002. - 352 с.

Информатика. Серия «Учебники, учебные пособия». И 57 //Под ред. П.П. Беленького. -- Ростов н/Д: Феникс, 2002. -- 448 с.

Крейнак Дж., Хебрейкен Дж. К79 Интернет. Энциклопедия -- СПб: ЗАО «Издательство «Питер», 1999. --560 с.: ил. ISBN 5-314-00119-5


Подобные документы

  • Хранение данных в сети Internet. Гипертекстовые документы, виды файлов. Графические файлы, их виды и особенности. Поисковые системы и правила поиска информации. Обзор поисковых систем сети Internet. Все о поисковых системах Yandex, Google, Rambler.

    курсовая работа [918,3 K], добавлен 26.03.2011

  • Характеристика основных программ-просмотрщиков, используемых пользователями: Мicrоsоft Internet Explorer и Netscape Navigator. Проблемы воспроизведения на Web-страницах разнообразных видов объектов. Основные принципы работы Мicrоsоft Internet Explorer.

    реферат [19,3 K], добавлен 22.11.2009

  • История развития сети Internet. Общая характеристика сети Internet. Протоколы. Услуги предоставляемые сетью. Internet - мировая сеть. Компьютерная зависимость. Internet-2. Нехватка мощностей Internet. Создание Internet-2. Структура Internet-2.

    контрольная работа [19,5 K], добавлен 06.10.2006

  • Принципы формирования имен в сети Internet, элементы браузера Internet Explorer. Добавление Web-страницы в список избранных. Средства ускорения доступа к часто посещаемым страницам. Способы обеспечения доступа к ресурсам сети Internet в автономном режиме.

    лабораторная работа [3,4 M], добавлен 24.05.2015

  • Internet. Протоколы сети Internet. Принцип работы Internet. Прикладные программы. Возможности в Internet? Правовые нормы. Политика и Internet. Этические нормы и частная коммерческая Internet. Соображения безопасности. Объем сети Internet.

    дипломная работа [128,8 K], добавлен 23.06.2007

  • Средства работы с ресурсами Internet. Программы-интерфейсы – www, Lynx, SlipKnot и I-com. Системы Arena, Netscape и Internet Explorer. Отечественная программа Ariadna. JavaScript - средство создания "оживших" страниц Web. Печать документов Internet.

    контрольная работа [22,7 K], добавлен 18.11.2009

  • Что такое Internet? Internet, как средство массовой информации. Службы Internet. Сетевая пресса. Структура Полит.Ру. Статистика. Рейтинг. Из чего состоит Internet? ICQ – новая возможность общения. Административное устройство Internet.

    реферат [20,2 K], добавлен 10.05.2003

  • Всемирная система объединенных компьютерных сетей, построенная на использовании протокола IP и маршрутизации пакетов данных. Домен и его уровни. Основные сервисы Internet. Что нужно для подключения к сети Internet. Правила поиска информации в Интернете.

    курсовая работа [1,5 M], добавлен 10.01.2012

  • Достоинства, недостатки браузеров и их виды - полноэкранные и с поддержкой мультимедиа. Обзор наиболее популярных браузеров: Internet Explorer, Mozilla, Netscape Navigator, Opera, Firefox и Safari. Распространенность браузеров и их возможности.

    доклад [32,2 K], добавлен 21.05.2013

  • Internet - глобальная телекоммуникационная сеть информационных и вычислительных ресурсов. Уникальные возможности дешевой, надежной и конфиденциальной глобальной связи по всему миру. Административное устройство Internet. Потенциальные пользователи.

    реферат [27,6 K], добавлен 30.01.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.