Возможности поисковых систем интернет: сравнительный анализ

Проблема информационного поиска в интернет. Существующие основные поисковые системы. Работа механизмов поиска. Зарубежные и русскоязычные поисковые системы. Особенности поисковой системы МЕТА. Клиенты и партнеры компании "МЕТА". Поисковая система Яndex.

Рубрика Программирование, компьютеры и кибернетика
Вид контрольная работа
Язык русский
Дата добавления 24.04.2012
Размер файла 34,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Контрольная работа

по дисциплине:

«Мировые информационные ресурсы»

Тема:

«Возможности поисковых систем Интернет: сравнительный анализ»

Введение

Контрольная работа на тему: «Анализ поисковых систем Internet».

Анализ поисковых систем Internet.

Цель работы: ознакомится с ресурсами и сервисами наиболее популярных поисковых систем России, Украины и мира, сделать их сравнительный анализ.

Ход работы:

Для поиска нужной информации в Internet существуют специальные информационно-поисковые системы. В принципе, для того, чтобы начать свое путешествие по бескрайней сети Internet, достаточно просто освоить как минимум одну такую систему.

Проблема информационного поиска была всегда актуальна для Интернет. Прежде всего, это обусловлено колоссальным объемом информационных ресурсов. В связи с информационным поиском возникают две задачи: охватить как можно больше ресурсов Сети и повысить точность обработки запросов пользователя.

1. Поисковые системы

Поисковая система состоит из 3 мощных компьютеров, каждый из которых выполняет свои задачи:

WWW-сервер. Отвечает за взаимодействие поисковой системы с пользователем. Предоставляет удобный и наглядный интерфейс для задания запросов.

Поисковая машина. Это, как правило, очень мощный компьютер, который обрабатывает базу индексов в соответствии с полученным запросом.

Поисковый робот. Компьютер, оснащённый специальной программой, которая непрерывно просматривает весь Интернет, индексируя все встречающиеся Web-страницы, и обновляя базу индексов.

Так устроены все поисковые системы, их различие состоит по сути лишь в вычислительной мощности перечисленных элементов и их программном обеспечении.

Подключение новых информационных источников (поисковых ресурсов). Информационными источниками являются любые поисковые системы, включая поисковые машины, типа, Yandex, Rambler, Yahoo, AltaVista и др., Интернет каталоги, информационные и новостные сервера, Интернет порталы и любые другие Интернет ресурсы, имеющие возможности поиска по ключевым словам.

Каждая поисковая система по-своему оценивает местоположение ключевых слов, но в целом для того, чтобы ваше описание попало в число наиболее релевантных, ключевые слова должны находиться в следующих элементах страницы.

1. Заголовок страницы (чем ближе к началу, тем лучше)

2. Web-адрес

3. Подзаголовки в тексте

4. Собственно текст, особенно первые 100-200 слов

5. Meta - дескрипторы

6. Alt-дескрипторы

Кроме того, поисковые системы анализируют плотность критерия поиска, которая означает не число вхождений этого критерия на вашей странице, а его процентное соотношение с остальным текстом. Оценка по параметру плотности может применяться как к заголовку страницы, так и к основному тексту.

Поисковые ресурсы необходимы для первичного поиска информации по ключевым словам, которая в дальнейшем будет отфильтрована и предоставлена пользователю.

Подключение новых информационных источников позволяет расширять область поиска в Интернет, увеличивая вероятность нахождения необходимого пользователю ресурса. Для облегчения и ускорения подключения новых поисковых ресурсов создана подсистема, которая позволяет добавлять новые информационные источники в полуавтоматическом режиме. После указания адреса поискового ресурса пользователь в визуальном режиме указывает необходимые для создания запроса элементы управления, строки редактирования, кнопки и др. На втором этапе, после выполнения фиктивного запроса, пользователь, также в визуальном режиме, указывает необходимые поля в результате запроса в нескольких записях, например, URL, дату, автора, размер и другие, найденного ресурса. По указанным примерам подсистема распознает формат представления результата запроса и создает соответствующий сценарий. Созданный таким образом сценарий будет использоваться для извлечения данных о найденных ресурсах.

Поисковые системы обычно состоят из трех компонент:

агент (паук или кроулер), который перемещается по Сети и собирает информацию;

база данных, которая содержит всю информацию, собираемую пауками;

поисковый механизм, который люди используют как интерфейс для взаимодействия с базой данных.

1.1 Описание работы механизмов поиска

Средства поиска и структурирования, иногда называемые поисковыми механизмами, используются для того, чтобы помочь людям найти информацию, в которой они нуждаются. Средства поиска типа агентов, пауков, кроулеров и роботов используются для сбора информации о документах, находящихся в Сети Интернет. Это специальные программы, которые занимаются поиском страниц в Сети, извлекают гипертекстовые ссылки на этих страницах и автоматически индексируют информацию, которую они находят для построения базы данных. Каждый поисковый механизм имеет собственный набор правил, определяющих, как собирать документы. Некоторые следуют за каждой ссылкой на каждой найденной странице и затем, в свою очередь, исследуют каждую ссылку на каждой из новых страниц, и так далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам, файлам мультипликации; другие игнорируют ссылки к ресурсам типа баз данных WAIS; другие проинструктированы, что нужно просматривать прежде всего наиболее! популярные страницы.

Агенты - самые «интеллектуальные» из поисковых средств. Они могут делать больше, чем просто искать: они могут выполнять даже транзакции от Вашего имени. Уже сейчас они могут искать сайты специфической тематики и возвращать списки сайтов, отсортированных по их посещаемости. Агенты могут обрабатывать содержание документов, находить и индексировать другие виды ресурсов, не только страницы. Они могут также быть запрограммированы для извлечения информации из уже существующих баз данных. Независимо от информации, которую агенты индексируют, они передают ее обратно базе данных поискового механизма.

Общий поиск информации в Сети осуществляют программы, известные как пауки. Пауки сообщают о содержании найденного документа, индексируют его и извлекают итоговую информацию. Также они просматривают заголовки, некоторые ссылки и посылают проиндексированную информацию базе данных поискового механизма.

Кроулеры просматривают заголовки и возвращают только первую ссылку.

Роботы могут быть запрограммированы так, чтобы переходить по различным ссылкам различной глубины вложенности, выполнять индексацию и даже проверять ссылки в документе. Из-за их природы они могут застревать в циклах, поэтому, проходя по ссылкам, им нужны значительные ресурсы Сети. Однако, имеются методы, предназначенные для того, чтобы запретить роботам поиск по сайтам, владельцы которых не желают, чтобы они были проиндексированы.

Агенты извлекают и индексируют различные виды информации. Некоторые, например, индексируют каждое отдельное слово во встречающемся документе, в то время как другие индексируют только наиболее важных 100 слов в каждом, индексируют размер документа и число слов в нем, название, заголовки и подзаголовки и так далее. Вид построенного индекса определяет, какой поиск может быть сделан поисковым механизмом и как полученная информация будет интерпретирована.

Агенты могут также перемещаться по Интернет и находить информацию, после чего помещать ее в базу данных поискового механизма. Администраторы поисковых систем могут определить, какие сайты или типы сайтов агенты должны посетить и проиндексировать. Проиндексированная информация отсылается базе данных поискового механизма так же, как было описано выше.

Люди могут помещать информацию прямо в индекс, заполняя особую форму для того раздела, в который они хотели бы поместить свою информацию. Эти данные передаются базе данных. Когда кто-либо хочет найти информацию, доступную в Интернет, он посещает страницу поисковой системы и заполняет форму, детализирующую информацию, которая ему необходима. Здесь могут использоваться ключевые слова, даты и другие критерии. Критерии в форме поиска должны соответствовать критериям, используемым агентами при индексации информации, которую они нашли при перемещении по Сети.

База данных отыскивает предмет запроса, основанный на информации, указанной в заполненной форме, и выводит соответствующие документы, подготовленные базой данных. Чтобы определить порядок, в котором список документов будет показан, база данных применяет алгоритм ранжирования. В идеальном случае, документы, наиболее релевантные пользовательскому запросу будут помещены первыми в списке. Различные поисковые системы используют различные алгоритмы ранжирования, однако основные принципы определения релевантности следующие:

Количество слов запроса в текстовом содержимом документа (т.е. в html-коде).

Тэги, в которых эти слова располагаются.

Местоположение искомых слов в документе.

Удельный вес слов, относительно которых определяется релевантность, в общем количестве слов документа.

База данных выводит ранжированный подобным образом список документов с HTML и возвращает его человеку, сделавшему запрос. Различные поисковые механизмы также выбирают различные способы показа полученного списка - некоторые показывают только ссылки; другие выводят cсылки c первыми несколькими предложениями, содержащимися в документе или заголовок документа вместе с ccылкой.

Когда Вы щелкаете на ссылке к одному из документов, который вас интересует, этот документ запрашивается у того сервера, на котором он находится.

Существует мета-поисковая система.

Пользоваться мета-поисковыми системами рекомендуется для выполнения запросов, связанных с поиском очень простых, и, предположительно, крайне редко встречающихся в Сети предметах (лекарственных препаратах, химических элементах, редких сочетаниях имен собственных и т.п.). В этом случае результаты поиска сразу же дают представление насколько широко данные ключевые слова (объекты) встречаются в Сети. Другой причиной обращения к мета-поиску является крайний недостаток времени. Однако, поскольку мета-поисковые средства очень часто не в состоянии корректно обработать запрос для различных поисковых систем и правильно совместить полученные из разных источников результаты, их использование не рекомендуется при выполнении сложных запросов. Поисковые предписаниях, включающие несколько словосочетаний с указанием расстояния между терминами и тому подобными условиями заведомо не могут принести правильный ответ.

Единственной мета-поисковой системой, рассылающей запросы в российские поисковые машины является 360.ru (www.360.ru). Она обладает способностью хорошо суммировать и даже ранжировать результаты, осуществляет поиск иллюстраций и MP3 файлов. Помимо России, поиск можно ограничить любым другим регионом мира или не ограничивать совсем. Скорость обработки запросов 360.ru весьма высока.

1.2 Зарубежные поисковые системы

http://www.altavista.com/. Поиск осуществляется по десяткам миллионов WWW-страниц на сотнях тысяч WWW-серверов, свыше 10 тысяч телеконференций. К сожалению, в связи с большим количеством индексируемых серверов - медленный темп обновления индексируемой информации и удаления устаревшей.

http://www.home.netscape.com/escapes/search/ntsrchrnd-2.html. Поиск осуществляется по поисковым серверам AltaVista, Excite, HotBot и других.

http://www.excite.com/. Поисковая система осуществляет тематический поиск в Internet (новости, компьютеры, бизнес, искусство, развлечения, спорт, игры, фильмы, музыка, телевидение, путешествия) и предоставляет возможность поиска по ключевым словам и фразам.

http://www.go.com/. Поисковая система «GO» позволяет осуществлять тематический поиск ресурсов в Internet (фильмы, музыка, МР3, новости, компьютеры, технологии, бизнес, искусство, развлечения, здоровье, спорт, обучение) и предоставляет возможность поиска по ключевым словам и фразам. Поиск компаний, людей, адресов электронной почты. Удобный интерфейс, ориентированный как на опытных пользователей, так и на новичков.

http://search.aol.com/. Поиск по ключевым словам и фразам людей, электронных адресов, работы, авиалинии, отели и многое другое.

http://www.lycos.com/. Поиск осуществляется по таким разделам как: бизнес, работа, компьютеры, образование, юмор, музыка, игры, о детях, людях, новости, спорт, отдых и т.д. Поиск по ключевым словам и фразам.

http://hotbot.lycos.com. Поиск осуществляется по десяткам миллионов WWW-страниц. Довольно высокий темп обновления индексируемой информации и удаления устаревшей.

http://www.yahoo.com/. Поиск осуществляется по десяткам миллионов WWW-страниц, десяткам разделов: новости, бизнес, искусство, развлечения, здоровье, спорт, досуг и т.д.

http://www.teoma.com/. Поиск по десяткам миллионов WWW-страниц, десяткам разделов: новости, бизнес, искусство, развлечения, здоровье, спорт, досуг и т.д.

1.3 Русскоязычные поисковые системы

http://www.google.com/. Один из лучших поисковиков не только по англоязычной или русскоязычной части Intermet, но имеет огромное количество локализаций. «Google» и самый быстрый по релевантности поисковик в интернете.

http://www.rambler.ru/. Одно из лучших средств для поиска по русскоязычной части Intermet - русскоязычная поисковая система по WWW

http://www.yandex.ru/. Один из мощнейших поисковых российских серверов. Поиск осуществляется по нескольким миллионам страниц.

http://www.aport.ru/. Поисковый сервер с возможностью перевода запросов и ответов по почти 11000 серверов.

Есть возможность перенаправления запросов на несколько мировых поисковых машин.

2. Поисковая система МЕТА

Поисковая система МЕТА позволяет искать по всему украинскому Интернету, а также по Реестру украинских сайтов.

Полнотекстовый поиск идет с учетом русской и украинской морфологии. Это значит, что вне зависимости от грамматической формы ключевых слов, Вы получите документы, которые содержат искомые слова во всех формах. Например, по запросу глубокие донья будут найдены документы, содержащие слова глубокое дно, по запросу рушник вишиваний - документы, содержащие слова вишиваному рушникові и т.п.

Обратите внимание на следующую особенность: в многословных запросах система не игнорирует так называемые «стоп-слова», к которым относят предлоги, частицы, союзы и т.п. Большинство поисковых систем при поиске их игнорируют, то есть, при запросе крем от загара предлог «от» будет проигнорирован и среди результатов будут документы со словосочетанием «крем для загара». <META> выдаст документы, которые точно совпадают с Вашим запросом.

Поскольку для большинство украинских пользователей интернета свободно владеют русским языком, провести четкую границу между российскими и украинскими ресурсами достаточно сложно. По статистике, до 70% поисковых запросов из Украины обрабатывает Яндекс. Украинские поисковые системы и каталоги необходимы для работы с украиноязычными ресурсами.

Большая часть украинских поисковых систем плохо доступна из России из-за топологии магистральных каналов: между Москвой и Киевом нет прямого быстрого канала, поэтому загрузка сайтов идет крайне медленно.

Главные порталы Украины расположены на адресах в «чужих» доменных зонах. До недавнего времени зарегистрировать домен второго уровня в зоне ua. было невозможно (см. доменную карту Украины), сейчас для регистрации домена необходима регистрации соответствующей товарной марки. Только украинская поисковая система номер 1 «Мета» имеет собственный домен второго уровня. Остальные порталы расположены в доменных зонах com, net или на доменах третьего уровня.

Мета-Украина - главная поисковая система Украины. Мета-Украина разрабатывается и поддерживается ЗАО МЕТА, которое работает в Харькове. Серверы, обслуживающие поисковую систему, разумеется, стоят в Киеве. Мета-Украина начала работать в 1998 году. С тех пор Мета-Украина стала основным украинским поисковиком (украинские пользователи очень активно обращаются к Яндексу и Google, но для поиска по украинскому контенту Мета вне конкуренции). Запущен ряд новых сервисов: поисковая система для корпоративных сайтов, поиск по новостям, С 2003 года сервер стал доступен по адресу www.meta.ua.

Адрес: www.meta-ukraine.com; www.meta.ua

Компания МЕТА представляет корпоративную поисковую систему для поиска в локальных и распределенных информационных сетях предприятия.

Компания МЕТА разработала программное решение для поиска в локальных и распределенных информационных сетях предприятия.

Система компании МЕТА позволяет организовать поиск в корпоративных базах данных предприятия, хранилищах документов, архивах электронных почтовых сообщений и новостей, рассредоточенных по корпоративной сети предприятия и других источниках информации.

Поисковая система способна обрабатывать информацию во всех наиболее распространенных форматах электронных документов, использующихся на украинских предприятиях, например, MS Word, MS Excel, xml, гипертекстовые и другие. В системе предусмотрена возможность быстрого подключения новых форматов, которые могут появиться в будущем.

Высокая точность поиска обеспечивается специальными алгоритмы ранжирования результатов поиска. При определении релевантности документа учитывается порядок слов, расстояние между ними, форма слова и форматирование документа, возможен поиск по словам, включающим специальные символы, например, «$», «R&D» и т.п.

Специальные модули системы отвечают за корректную обработку слов на украинском, русском и английском языках. При необходимости могут быть подключены модули для работы с другими языками.

Система обеспечивает полную конфиденциальность внутрикорпоративной информации как при доступе из локальной сети, так и при удаленном доступе посредством Интернет. Есть возможность разграничивать области поиска в соответствии с политикой прав доступа, принятой в компании.

Система спроектирована и реализована таким образом, что все его ключевые компоненты могут работать под управлением большинства современных операционных систем, причем разные компоненты - на разных платформах в пределах одной вычислительной сети. Система не требует больших аппаратных вложений, для работы достаточно одного выделенного сервера. Ежесуточно может индексироваться более одного миллиона документов, обработка сложного поискового запроса занимает не более 1 секунды в многопоточном режиме,

Кроме обеспечения поиска система дает статистику по работе поискового механизма и позволяет получить аналитическую информацию по всему массиву документов предприятия в целом. Возможно добавление дополнительных сервисных функций - получение уведомления о появлении интересующего документа, автоматическое рубрицирование полнотекстовых массивов по формальным признакам, по тематике и другое.

Украинская компания МЕТА разработала программное ядро новой поисковой системы. По утверждению компании, оно не только не уступает другим аналогичным продуктам, но и обладает некоторыми уникальными качествами.

В ядре используется собственный алгоритм определения релевантности найденных документов, при котором учитывается частота, с которой искомое слово встречается во всем обрабатываемом пространстве документов, а также близость и порядок слов, форматирование и некоторые другие характеристики.

В отличие от большинства других систем, META принимает их во внимание так называемые «стоп-слова» - короткие малозначимые слова, например, предлоги или союзы, которые встречаются с большой частотой. В итоге, как считает компания, улучшилась обработка запросов на естественном языке.

Новое ядро META изначально рассчитано на работу с запросами на нескольких языках. В настоящее время украинский поисковик поддерживает русский, украинский и английский язык. Обработка запросов на русском и украинском языке происходит с учётом морфологии этих языков.

Сейчас на новое ядро была переведена одна из самых популярных поисковых систем на Украине - (meta-ukraine.com). Компания планирует продолжать развитие системы. В ближайшее время будут добавлены функции поиска похожих документов, реконструкции текста документа и различные виды группировки результатов.

Сфера применений программного ядра не ограничивается использованием в качестве основы для поисковой системы в Интернете. Его можно использовать для создания поисковых систем различных уровней, вплоть до персональных средств поиска информации.

В планах компании - выход на рынок поисковых решений стран восточной Европы.

Украинская компания «Мета», известная как создатель поисковой системы по украинским интернет-ресурсам http://meta-ukraine.com/, представила свою новую разработку - программное решение для поиска в локальных и распределенных информационных сетях предприятия.

Поисковая система способна обрабатывать все наиболее распространенные форматы электронных документов: MS Word, MS Excel, pdf, xml и др. Поиск информации осуществляется на трех языках: украинском, русском и английском. По словам создателей, система позволяет разграничивать области поиска в соответствии с принятой в компании политикой прав доступа и обеспечивает полную конфиденциальность корпоративной информации как при доступе из локальной сети, так и при удаленном доступе посредством Интернета.

Весьма вероятно, что предложение «Меты» будет пользоваться большим спросом и на российском рынке, поскольку новое программное решение может найти применение при создании комплексной информационной системы предприятия.

МЕТА, известная как создатель поисковой системы по украинским интернет-ресурсам МЕТА (meta-ukraine.com), разработала программное решение для поиска в локальных и распределенных информационных сетях предприятия, сообщает iTT News.

Поисковая система способна обрабатывать информацию во всех наиболее распространенных форматах электронных документов, использующихся на украинских предприятиях, например, MS Word, MS Excel, pdf, xml, гипертекстовые и другие. В системе предусмотрена возможность быстрого подключения новых форматов, которые могут появиться в будущем. Поиск информации осуществляется на трех языках - украинском, русском и английском.

Система позволяет разграничивать области поиска в соответствии с политикой прав доступа, принятой в компании Обеспечивается полная конфиденциальность внутрикорпоративной информации как при доступе из локальной сети, так и при удаленном доступе посредством Интернета. Ежесуточно может индексироваться более одного миллиона документов, обработка сложного поискового запроса занимает не более 1 секунды.

Компания «МЕТА» - разработчик информационно-поисковых и аналитических систем.

Наиболее известный проект компании - поисковая система <META> - Украина, наиболее популярная система поиска по украинским сайтам. Услугами поискового сервера ежемесячно пользуются более 250 000 посетителей.

В настоящее время компанией разработаны технологии, позволяющие организовывать поиск по массивам информации различной степени сложности: от системы поиска по серверу и персональному компьютеру, до крупных корпоративных поисково-информационных систем.

2.1 Поисковые технологии компании «МЕТА»

Обеспечение высокоскоростного качественного поиска в локальной корпоративной сети, хранилищах документов, базах данных, электронной корреспонденции. Поддержка различных форматов документов на разных языках с учетом уровня доступа. Cоздание полнотекстовых отраслевых и тематических баз данных.

Поиск для сайта META

Гибкая в настройках, удобная в эксплуатации и экономичная система поиска для веб-сервера.

Поисковый сервис

Сервис, позволяющий быстро создать полнофункциональную поисковую систему для сайта без затрат на оборудование и персонал.

CDМЕТА

Программа для создания CD-архивов с полнотекстовым поиском.

МЕТА PX

Полнофункциональная библиотека для организации индексирования и поиска в больших массивах полнотекстовой информации. Программный интерфейс библиотеки выполнен совместимым с языком «C» и не требует использования компилятора C++, то есть может использоваться в приложениях, разработанных посредством Delphi, Visual Basic и т.д.

Системы мониторинга

Технологии мониторинга открытых источников в Интернете, клиппинг и реферирование конъюнктурной информации, построение отчетов и рейтингов цитируемости, анализ контекстного окружения.

2.2 Клиенты и партнеры компании

Поисковые технологии Мета используют в своей работе:

Национальный Банк Украины

Кабинет Министров Украины

АКИБ УкрСиббанк

Компания Softline

Портал Воля

Еженедельник Зеркало Недели

Информационное агентство Инфинсервис

Корпорация ХАДО

другие коммерческие и государственные организации.

3. Поисковая система Яndex и все об эффективном поиске в интернет

Поиск в сети осуществляется посредством специализированных почтовых серверов; их известно достаточно много (yandex.ru, aport.ru, rambler.ru, google.ru и множество менее распространённых). Но в этом обзоре мы с вами сосредоточимся на рассмотрении поисковой системы Yandex, являющейся бесспорным лидером по качеству и возможности поиска в русскоязычной части интернета.

3.1 Советы по поиску в Яндексе

Самый простой способ. Вы не хотите углубляться в детали техники поиска? Просто задайте Яндексу вопрос так же, как бы вы его задали библиотекарю или всезнайке-эрудиту. Например, «где раки зимуют», «ярчайшая звезда северного полушария» или «как выбрать компьютер».

Проверяйте орфографию. Если поиск не нашел ни одного документа, то вы, возможно, допустили орфографическую ошибку в написании слова. Проверьте правильность написания. Если вы использовали при поиске несколько слов, то посмотрите на количество каждого из слов в найденных документах (перед их списком после фразы «Результат поиска»). Ка кое-то из слов не встречается ни разу? Скорее всего, его вы и написали неверно.

Используйте синонимы. Если список найденных страниц слишком мал или не содержит полезных страниц, попробуйте изменить слово. Например, вместо «рефераты» возможно больше подойдет «курсовые работы» или «сочинения». Попробуйте задать для поиска три-четыре слова-синонима сразу. Для этого перечислите их через вертикальную черту (|). Тогда будут найдены страницы, где встречается хотя бы одно из них. Например, вместо «фотографии» попробуйте «фотографии | фото | фотоснимки».

Ищите больше, чем по одному слову.

Слово «психология» или «продукты» дадут при поиске поодиночке большое число бессмысленных ссылок. Добавьте одно или два ключевых слова, связанных с искомой темой. Например, «психология Юнга» или «продажа и покупка продовольствия». Рекомендуем также сужать область вашего вопроса. Если вы интересуетесь автомобилями ГАЗа, то запросы «автомобиль Волга» или «автомобиль ГАЗ» выдадут более подходящие документы, чем «легковые автомобили».

Не пишите большими буквами. Начиная слово с большой буквы, вы не найдете слов, написанных с маленькой буквы, если это слово не первое в предложении. Поэтому не набирайте обычные слова с Большой Буквы, даже если с них начинается ваш вопрос Яндексу. Заглавные буквы в запросе рекомендуется использовать только в именах собственных. Например, «группа Черный кофе», «телепередача Здоровье».

Найти похожие документы. Если один из найденных документов ближе к искомой теме, чем остальные, нажмите на ссылку «найти похожие документы». Ссылка расположена под краткими описаниями найденных документов. Яndex проанализирует страницу и найдет документы, похожие на тот, что вы указали. Но если эта страница была стерта с сервера, а Яндекс еще не успел удалить ее из базы, то вы получите сообщение «Запрошенный документ не найден».

Используйте знаки «+» и «-». Чтобы исключить документы, где встречается определенное слово, поставьте перед ним знак минуса. И наоборот, чтобы определенное слово обязательно присутствовало в документе, поставьте перед ним плюс. Обратите внимание, что между словом и знаком плюс-минус не должно быть пробела. Например, если вам нужно описание Парижа, а не предложения многочисленных турагентств, имеет смысл задать такой запрос «путеводитель по парижу - агентство - тур». Плюс стоит использовать в том случае, когда нужно найти так называемые стоп-слова (наиболее частотные сло ва русского языка, в основном это местоимения, предлоги, частицы). Чтобы найти цитату из Гамлета, надо задать запрос «+быть или +не быть».

Попробуйте использовать язык запросов. С помощью специальных знаков вы сможете сделать запрос более точным. Например, укажите, каких слов не должно быть в документе, или что два слова должны идти подряд, а не просто оба встречаться в документе.

Искать без морфологии. Вы можете заставить Яндекс не учитывать формы слов из запроса при поиске. Например, запрос иванов найдет только страницы с упоминанием этой фамилии, а не города «Иваново».

Поиск картинок и фотографий. Яндекс умеет искать не только в тексте документа, но и отыскивать картинки по названию файла или подписи. Для этого на первой странице yandex.ru нажмите ссылку «расширенный поиск». Для поиска картинки предусмотрены два поля. В поле «Название картинки» вписываются слова для поиска по названиям картинок, обычно появляющихся, когда к картинке подводится курсор. Например, название картинки «Венера» выдаст все страницы с картинками Венеры (всего, что можно понимать под этим словом). В поле «Подпись к картинке» вписывается название файла, содержащего картинку. Например, запрос dog найдет в Интернете все картинки, в имени файла которых встречается слово «dog». С большой вероятностью эти картинки связаны с собаками.

Результаты поиска

1. Поисковая форма. Главный ее элемент - строка запроса. При желании можно искать только в результатах предыдущего поиска («искать в найденном»). Можно также задать запрос по любому из источников информации («Рунет», «Новости», «Товары», «Энциклопедии», «Картинки»).

2. Статистика поиска: число найденных документов и частота заданных в запросе слов. По ссылке «страниц» можно перейти на несгруппированную по серверам выдачу.

3. Рубрики каталога. По нажатию на ссылку происходит переход в соответствующий раздел каталога (выводится только при точном соответствии запросу).

4. Результаты поиска по вебу. Для каждого документа выдается следующая информация: заголовок - ссылка на ресурс, [Показать найденные слова] - переход на «подсвеченный» документ, в котором контекст запроса выделен стрелочками, поиск похожего документа и, если найденный сайт описан в каталоге, переход в рубрику каталога. Кроме этого, информация о размере, кодировке и, дате документа, его URL.

5. Переход на следующие страницы результата. Сортировка по убыванию дат.

6. «Помощник». Здесь даются советы и предложения по уточнению вашего запроса. Можно сузить поиск по рубрике каталога или по региону.

7. Популярные находки пользователей - ссылки на документы (не с первой страницы результатов!), выбранные пользователями по этому запросу (выводится только при точном соответствии).

8. Возможность поискать в других русскоязычных поисковых машинах.

9. Результат поиска в новостных лентах информационных агентств (выводится только при точном соответствии запросу). При высоком соответствии и актуальности эта секция может оказаться над результатами поиска по вебу.

10. Ссылки на прочие службы Яндекса.

11. Результат поиска в энциклопедических статьях (выводится только при точном соответствии запросу).

12. Результат поиска в базе товарных предложений магазинов (выводится только при точном соответствии запросу).

Доступ к ИПС Яndex был открыт в 1997 году. На сегодняшний день объем проиндексированных в базе ИПС документов составляет более 33 миллионов. Поиск осуществляется не только по web - страницам, но и по специализированным массивам данных, среди которых новости ведущих информационных агентств, товары Интернет-магазинов, ресурсы WAP - серверов, а также каталог Интернет-ресурсов List. ru.

ИПС поддерживает собственный каталог Интернет-ресурсов, формирующийся на основе индекса цитирования Яndex 'а (CY - Citation Yandex). CY какой-либо web - страницы измеряется количеством других страниц, содержащих ссылки на эту страницу. Этот метод оценки ресурсов принципиально отличается от простого учета количества посещений страницы.

ИПС Яndex имеет простой и расширенный поисковые интерфейсы, а также страницу настройки формата выдачи результатов поиска. ИПС использует собственную систему обозначений логических операторов, а также поддерживает большое количество поисковых функций, позволяющих составлять запросы различной степени сложности.

поиск интернет яndex механизм

3.2 Простой поиск

В верхней части домашней страницы ИПС расположено поле для ввода ключевых слов По умолчанию слова запроса связываются оператором OR. Над поисковым полем приводится пример формулировки запроса, меняющийся при каждом новом открытии страницы простого поиска. Селекторные кнопки снизу позволяют ограничивать поиск следующими областями: «новости», «товары» и «картинки».

Поиск ключевых слов производится с учетом их морфологии. Если необходимо осуществить поиск по точной словоформе, то перед ним ставится знак»!» без пробела. Система различает слова, набранные строчными и прописными буквами. Поддерживается поиск по фразе, которая заключается в кавычки. Перед ключевым словом допускается постановка знаков «+» и» -», которые заменяют логические операторы AND и NOT соответственно.

ИПС Яndex использует собственную систему обозначений логических операторов, которая одновременно позволяет задавать степень близости между ключевыми словами. Логические операторы AND и NOT обозначаются символами «&» и «~» соответственно. Употребление этих символов определяет наличие или отсутствие ключевых слов в отдельном предложении документа.

Для того чтобы подняться от уровня предложения до уровня всего документа, необходимо удвоить символ-оператор. Например, по запросу библиотеки && архивы будут найдены документы, содержащие оба слова без учета расстояния между ними, а по запросу библиотеки & архивы - документы, содержащие оба слова в пределах одного предложения.

Логический оператор OR вводится с помощью символа «|» и действует в пределах всего текста документа. Возможно также употребление круглых скобок для составления сложных поисковых предписаний.

Символ «/» ограничивает максимальное расстояние между ключевыми словами определенным числом. Например по запросу библиотеки /5 архивы будут найдены документы, в которых расстояние между ключевыми словами не превышает 5 слов. Комбинация символов «/+» позволяет задать расстояние более точно. Так, запросу библиотеки /2 архивы будут релевантны документы, содержащие фразу «библиотеки, областные архивы».

Также поддерживаются следующие специальные операторы для поиска в определенных областях html - документов:

- $title - в заголовке;

- $anchor - в тексте ссылок;

- #keywords= - в ключевых словах (поле «keywords»);

- #abstract= - поиск в описании (поле «META»);

- #image= - в имени файла изображения;

- #hint= - в подписи к изображению;

- #link= - поиск ссылок на заданный URL-адрес;

- #url= - поиск документов на заданном сайте (странице).

3.3 Расширенный поиск

Интерфейс расширенного поиска ИПС Яndex представляет собой шаблон, состоящий из поля для ввода ключевых слов, словарного фильтра и нескольких областей уточнения запроса.

Словарный фильтр содержит три раскрывающихся меню. Опции меню слева имеют следующие обозначения:

- «обязательно» - слово должно присутствовать в документе;

- «желательно» - наличие слова не обязательно, но если оно есть, документы с ним ранжируются выше;

- «исключить» - слово не должно присутствовать в документе;

- «операторы» - ввод запроса с использованием поисковых операторов ИПС Яndex.

Меню в центре позволяет осуществлять поиск с учетом или без учета морфологических форм слова.

Раскрывающееся меню справа позволяет ограничивать поиска определенной областью html - документа (весь документ, заголовок, URL - адрес, текст гиперссылки) или задавать степень близости между ключевыми словами (точная фраза или наличие всех ключевых слов в пределах одного предложения).

Далее расположены четыре области уточнения запроса в зависимости от местонахождения документа, наличия или отсутствия в нем определенных ссылок, изображений и специальных объектов, используемых для создания web - страницы.

На странице расширенного поиска имеется также раскрывающееся меню «Язык», которое ограничивает поиск документов по алфавитному принципу (латиница или кириллица).

Заключение

После того, как мы ознакомились с ресурсами и сервисами наиболее популярных поисковых систем России, Украины и мира, сделали их сравнительный анализ, мы выяснили, что студенты, использующие Internet могут:

улучшить свои способности познавать и понимать новые и изменяющиеся информационные технологии;

научиться оценивать достоверность информации, приобретенной через Internet ресурсы;

научиться синтезировать данные, приобретенные через Internet;

развивать умение в различных видах деятельности, в соответствии со спецификой своей будущей специальности;

развивать технические умения, требуемые, чтобы использовать Internet для коммуникаций и сбора информации;

приобретать географическое мышление, основанное на понимании глобального характера Internet коммуникаций и связей;

понимать и знать, как использовать, по крайней мере, одну программу просмотра сети (Web Browser);

понимать различия и подобия среди поисковых систем;

понимать, как использовать ряд поисковых систем;

разрабатывать стратегии для нахождения и оценки информации в Internet и ее использования.

Размещено на Allbest.ru


Подобные документы

  • Структура справочно-поисковых систем сети Интернет, работа механизмов поиска. Сравнительный обзор справочно-поисковых систем (Gopher, WAIS, WWW, AltaVista, Yahoo, OpenText, Infoseek). Поисковые роботы, наиболее популярные справочно-поисковые системы.

    реферат [28,4 K], добавлен 14.01.2010

  • Основные протоколы, используемые в Интернет. Инструменты поиска в Интернете. Популярные поисковые системы. Как работают механизмы поиска. Средства поиска и структурирования. Автоматизированная навигация по Сети. Критерии качества работы поисковой машины.

    реферат [19,7 K], добавлен 14.02.2012

  • История развития поисковых систем, особенности механизма поиска. Сравнительный обзор справочно-поисковых систем Интернета. Понятие поисковых роботов. Наиболее популярные поисковики для русскоязычного пользователя. Перспективы развития поисковых систем.

    реферат [64,0 K], добавлен 20.12.2012

  • Определение программного и математического обеспечения ИС. Виды запросов к базам данных в СУБД. Поисковые системы Интернет. Описание принципа работы поисковых систем Яндекс, Рамблер, Апорт. Особенности пересылки файлов средствами электронной почты.

    контрольная работа [271,7 K], добавлен 22.11.2009

  • Характеристика методов поиска информации в Интернете, а именно - с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.

    реферат [17,2 K], добавлен 12.05.2010

  • Средства поиска информации в сети Интернет. Основные требования и методика поиска информации. Структура и характеристика поисковых сервисов. Глобальные поисковые машины WWW (World Wide Web). Планирование поиска и сбора информации в сети Интернет.

    реферат [32,2 K], добавлен 02.11.2010

  • Сущность и принцип работы глобальной сети Интернет. Поиск информации по параметрам в системе Google. Специализированные системы поиска информации: "КтоТам", "Tagoo", "Truveo", "Kinopoisk", "Улов-Умов". Целесообразное использование поисковых систем.

    презентация [572,6 K], добавлен 16.02.2015

  • Хранение данных в сети Internet. Гипертекстовые документы, виды файлов. Графические файлы, их виды и особенности. Поисковые системы и правила поиска информации. Обзор поисковых систем сети Internet. Все о поисковых системах Yandex, Google, Rambler.

    курсовая работа [918,3 K], добавлен 26.03.2011

  • Контекстная реклама как основная статья дохода поисковых систем-лидеров. Понятие цены клика. Формирование цены на основе частот запросов (на примере поисковой системы Рамблер). Основные поисковые системы на российском рынке, перспективы их развития.

    творческая работа [373,4 K], добавлен 07.04.2009

  • Организация хранения данных. Система управления базами данных. Поиск информации, обзор существующих поисковых систем. Особенности работы поискового движка. Использование индексов в поисковых системах. Особенности поиска различных видов информации.

    курсовая работа [4,6 M], добавлен 14.05.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.