Поисковые системы Интернета

Характеристика современных информационных поисковых систем Интернета Сравнение Яндекса и Google. Особенности формирования запроса и критерии ответов. Индексирование пространства для хранения документов. Основные параметры сжатия файлов для веб-страниц.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 23.11.2014
Размер файла 20,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://allbest.ru

Белорусский Государственный Университет

Экономический факультет

Реферат

по курсу "Информатика"

Поисковые системы Интернета

Выполнил студент 2 курса

Лю Цзинюань

Руководитель Александров Б.Г.

Минск-2010

Содержание

Введение

1. Сравнение поисковых систем Яндекс и Google

2. Формирование вопроса и критерий к ответу на него

3. Особенности системы Google Search Engine

Список используемой литературы

Введение

В современном мире трудно представить жизнь без Интернета. С его помощью мы покупаем разнообразные товары, знакомимся, общаемся, работаем, слушаем музыку, смотрим фильмы и т.д. Возможности Всемирной Паутины безграничны, надежными помощниками в виртуальных лабиринтах выступают поисковые системы.

Нет ничего проще, чем написать в строке поисковика нужный запрос, и поисковая система выдаст огромное количество предложений по внесенным словам или фразе. Еще совсем недавно о подобном даже не мечтали.

Российские граждане о возможностях Интернета узнали всего лишь несколько лет назад, несмотря на такой короткий срок, в настоящее время Всемирная Паутина становится доступной даже в отдаленных уголках нашей большой страны.

Например, среди жителей Москвы девяносто процентов молодежи до 30 лет являются активными пользователями Интернета. С каждым днем по всей стране их количество стремительно возрастает, значительно увеличивается и скоростная способность каналов.

Пользователи рунета, число которых неустанно растет, используют для поиска в сети поисковые системы. Если вы имеете свой ресурс в Интернете, для вас нахождение в топе гарантирует его популярность, что благоприятно сказывается на продажах и увеличении прибыли с сайта или интернет магазина.

Умение использовать возможности поиска в интернете является информационной компетентностью любого современного человека.

Мало кто может сейчас поспорить о том, что в Рунете главными поставщиками трафика (потока посетителей) для сайтов на сегодняшний день являются две поисковые системы - это Yandex и Google. Рамблер рассматривать не будем из-за его нынешней маломощности, а новоявленного бренда Bing не будем касаться из-за его непредсказуемости.

Цель моей работы: Определить и сформулировать интересный и одновременно сложный вопрос для студентов по теме "Поиск в интернете".

Задачи:

1.Изучение возможностей поисковых систем Яндекс и Google

2.Сравнение поисковых систем Яндекс и Google

3.Определение и формирование вопроса

4.Разработка критерий оценки ответа на вопрос

1. Сравнение поисковых систем Яндекс и Google

Поисковая система Google была создана в качестве учебного проекта студентов Стэнфордского университета Ларри Пейджа и Сергея Брина. Они в 1996 году работали над поисковой системой BackRub, а в 1998 году на её основе создали поисковую систему Google.

Хотя корпорация была основана 4 сентября 1998 года, а домен Google.com зарегистрирован 15 сентября 1997 года, поисковик (с 2005 года) иногда отмечает свой день рождения и в другой день: как 7, так и 27 сентября.

Название Google произошло от неправильного написания слова Гугол (Googol) Сергеем Брином, которое означает десять в сотой степени - 10100

Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т.д. Например, поиск "intitle: Google site: wikipedia.org" выведет все статьи Википедии на всех языках, в заголовке которых встречается слово Google. Мощный язык запросов в руках хакеров может быть использован для исследования веб-сайтов на уязвимости.

Для некоторых результатов поиска Google ранее предоставлял повторное поле для поиска, которое позволяет пользователю найти то, что он ищет внутри конкретного веб-сайта.

Эта идея возникла из того, как пользователи использовали поиск. По словам инженера-программиста Бена Ли (Ben Lee) и менеджера продукта Джека Менцеля (Jack Menzel)"телепортирование" в сети - это как раз то, что помогает пользователям Google завершить свой поиск. Google развил эту концепцию на шаг вперёд, и вместо просто "телепортирования", что значит для поиска нужного сайта пользователю достаточно ввести часть имени веб-сайта в Google (необязательно помнить весь адрес), пользователи могут вводить ключевые слова для поиска внутри выбранного сайта.

Оказалось, что пользователям часто нелегко найти то, что они ищут внутри корпоративного сайта. С 2011 года эта опция недоступна, что весьма отрицательно сказалось на удобстве, популярности, и востребованности Google.

Несмотря на то, что пользователям в новинку этот поисковый инструмент, он вызвал разногласия среди некоторых издательств и дистрибьюторов. На страницах результатов поиска Google отображаются платные (pay per click) рекламные объявления конкурирующих компаний, которые основывают рекламные объявления на брендах.

В то время как сервис мог бы помочь увеличить трафик, некоторые пользователи „сливаются“, так как Google использует известность брендов для продажи рекламных объявлений, как правило, конкурирующим компаниям. Чтобы сгладить этот конфликт Google предложил отключать эту возможность для желающих компаний.

Поисковая технология, позволяющая пользователю настраивать результаты выдачи по поисковым запросам. Пользователь может удалять результаты из списка и поднимать вверх списка.

Технология была запущена компанией Google весной 2009 года и проработала до осени. В настоящий момент (4 мая 2010 года), в настройках поиска осталась настройка для включения "Википоиска", но в выдаче соответствующие элементы управления отсутствуют. Другие поисковые системы подобной функциональности пока не предоставляли.

22 сентября 2010 года компания запустила голосовой поиск в России. Чтобы осуществить поиск, необходимо нажать в телефоне кнопку рядом со строкой поиска и произнести свой запрос, телефон отправит ваш голос на сервер и браузер выдаст строку с распознанным вашим запросом и результатами поиска по нему.

По случаю праздника или круглой даты какой-нибудь широко известной личности, стандартный логотип Google у региональных доменов может меняться на праздничный, имеющий определённую тематику, смысл. Например, по случаю дня рождения Наполеона Орды 11 февраля 2010 года на логотипе белорусского домена Google появились акварели этого известного художника, 6 июля поздравляли со 121 - летием Марка Шагала (логотип был в виде коллажа из фрагментов его работ). После десятилетнего ожидания 22 марта 2011 года Google выиграл патент на "Google Doodle".

Яндекс (Yandex) появился в 1997 году, и на сегодняшний день это одна из самых востребованных поисковых систем в рунете. Поиск Яндекса позволяет искать документы на русском, татарском, украинском, белорусском, казахском, английском, немецком и французском языках с учётом морфологии этих языков и близости слов в предложении.

Отличительная особенность Яндекса - возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов. Так, например, для операции исключения можно указать область действия: запрос A ~~ B найдёт документы (страницы), в которых присутствует А, но не присутствует В, а запрос А ~ Б - документы, где слово Б не присутствует со словом А в одном предложении. Аналогично, оператор & ищет сочетания ключевых слов в предложении, а && - во всём документе.

Оператор! позволяет отключить морфологию для конкретного слова, позволяет указать нормальную форму, что позволяет обойти некоторые проблемы, связанные с омонимией. Например запрос!! Иванов будет находить Иванова и Ивановых, но не Ивана.

По умолчанию Яндекс выводит по 10 ссылок на каждой странице выдачи результатов, в настройках результатов поиска можно увеличить размер страницы до 20, 30 или 50 найденных документов. Иногда порядок сайтов на этих страницах может отличаться, так как обновление баз для этих результатов происходит не одновременно.

Если по запросу найдено очень много ссылок, страница результатов предлагает ограничить диапазон поиска - по региону (то есть по диапазону IP) или по дате. Если по какому-либо слову или словам ничего не найдено, предлагается заменить его/их на похожие (поскольку предлагаемые варианты зависят от частоты нахождения похожих слов, иногда возникают забавные ситуации). Также, предлагается исправить слова, набранные не в той раскладке клавиатуры.

Время от времени алгоритмы Яндекса, отвечающие за релевантность выдачи, меняются, что приводит к изменениям в результатах поисковых запросов. Такие изменения, официально объявленные, происходили, например, в марте 2004 года, августе 2005 года и январе 2007 года; по неофициальным сведениям, их значительно больше (например, в августе-сентябре 2007 года). Последнее такое изменение произошло в ноябре 2009 года, когда была выложена обновленная версия поисковой программы "Снежинск".

В частности, эти изменения направлены против поискового спама, приводящего к нерелевантным результатам по некоторым запросам (реже - по целым семействам запросов).

Достоверно известно, что алгоритмы Яндекса и Гугла различаются кардинально. Яндекс строит свои позиции исходя из уникальности текстов на сайтах, а Гугл - исходя из количества ссылок, которые ведут на рассматриваемый сайт.

За многие годы работы с этими поисковыми системами можно констатировать тот факт, что с Гуглом работать гораздо проще.

Плохие с точки зрения посетителей сайты он быстро вычисляет, накладывает на них самые разнообразные штрафные санкции (фильтры), а то и вовсе исключает их из поисковой выдачи (отправляет в бан). Работать с ним нелегко, продвижение сайтов в топ-10 Гугла - дело очень трудное, но если сравнивать с Яндексом - то это совершеннейшая детская забава.

Для Яндекса можно сделать прекрасный сайт, буквально набитый самым уникальным контентом, поставить на сайт самые честные ссылки с самых "жирных" сайтов - и всё равно это не гарантия того, что ваш сайт вылезет в выдаче на нормальные места.

Создаётся такое впечатление, что вся выдача первых страниц по абсолютно всем запросам в Яндексе проплачена, потому там часто можно видеть совершенно бездарные сайты. Конечно, это не так, но впечатление складывается именно такое.

Другое дело - Гугл. Сделав нормальный сайт (то есть полезный для посетителей), но набив его заимствованным с других сайтов контентом, можно запросто добиться попадания в топ-10, не по всем, конечно, запросам, но по очень многим низкоконкурентным.

Для этого надо брать ключевые фразы по выбранной теме, которые являются так называемыми "низкочастотными" (НЧ). Но зато таких фраз должно быть много. И дублироваться на каждой странице они должны не менее 5 раз. Чем больше страница, тем больше в неё влезет таких фраз. Естественно, при этом вы не должны забывать и про посетителей.

Для Гугла комфорт и удобство посетителей стоят на одном из первых мест. Для Яндекса, конечно, тоже, но это как-то не замечается. А у Гугла - замечается. Гугл прощает вебмастеру многие ошибки и грехи, если при этом не страдает посетитель.

Так и насчёт ключевых фраз - их плотность может зашкаливать, но если Гугл видит, что посетители на вашем сайте "сидят" довольно продолжительное время, то этот положительный фактор перекрывает многие отрицательные. Гугл готов даже закрыть глаза на обман своих поисковых роботов, если посетителю сайт нравится.

2. Формирование вопроса и критерий к ответу на него

Критерии

Яндекс

Goggle

Глубина индексации

95,13%

114,25%

Частота индексации

раз в два дня,

раз в три дня

Обучаясь по специальности "Психология" и отвечая на задания по теме "Поиск в интернете" меня заинтересовал вопрос о Нобелевских премиях, врученные родственникам. Пока я искала ответ, я попутно думала: "А есть Нобелевская премия в области психологии? Вручалась ли?". Так и появилась идея создания вопроса.

Итак, вопрос: "Психолог, получивший Нобелевскую премию не в области психологии".

Для того чтобы дать верный ответ на данный вопрос необходимо:

1.Узнать имя психолога.

2.Назвать область, в которой он получил данную премию

3.Год получения премии

Чтобы найти верный ответ необходимо сформировать запрос "Нобелевская премия психология". По моему мнению, лучше воспользоваться поисковой системой Яндекс.

3. Особенности системы Google Search Engine

поисковый информационный интернет

Google Search Engine обладает двумя важными функциями, которые помогут получить более точные результаты поиска.

Во-первых, применение ссылки на веб-структуры, называемой PageRank.

Второй момент, использование Google гиперссылок на улучшение результатов поиска. Пренебрегали PageRank: ссылки на Web Page Rank (ссылки) является важным ресурсом в поисковых системах и сегодня в большой степени.

Мы установили, что содержит гиперссылки графа N, которая является значительным образцом. Интернет поисковики могут быстро вычислить значение PageRank страницы, которая является объективным стандартом. Таким образом PageRank может оптимизировать результаты запроса по ключевым словам.

Для большинства заголовков PageRank применяется оптимизация запросов с помощью простого соответствия текста. Для Google основные системы полнотекстового поиска, PageRank, также помогли многим.

Суждения PageRank рассматривается в качестве модели поведения пользователей. Мы предполагаем, что веб-серфинг является случайным, если постоянно нажимать на сылку, чтобы никогда не вернуться назад. Есть возможность произвольного доступа к веб-странице своего значения PageRank. Тормозной фактор D является случайным доступом возможности к веб-странице, выбор случайной страницы. Это позволяет лицам сознательно ввести в заблуждение систему, чтобы получить более высокий PageRank значения. У нас также есть другие алгоритмы PageRank.

Другое интуитивное суждение о веб-странице: если есть много веб-страниц указывающих на неё или некоторые страницы с высоким значением PageRank, то эта страница является очень важной. Интуитивно понятно, что если в Интернете на веб-страницу ссылается много страниц, то эту страницу стоит посетить. Страницу, как ссылку на главную страницу Yahoo, также стоит посетить. Есть страницы качественно не высокого уровня и мертвые ссылки. PageRank имеет дело с этими двумя факторами и рекурсивно проводит через сетевое соединение якорный текст (Anchor Text). Наш поисковик специально обрабатывает текст ссылки. Большинство поисковых систем связаны между собой. Кроме того, они указывают на страницы и ссылки на ссылку. Этот метод имеет несколько преимуществ.

Во-первых, фиксированный текст, как правило, более точен, чем сама страница для описания страницы.

Во-вторых, якорная цепь в тексте документа не может быть восстановлена поисковой машиной, а также изображения, программы и базы данных.

Список используемой литературы

1. Чурсин, Н. А. Популярная информатика / Н. А. Чурсин.- М.: «Вильямс», 2007.- 300 с

2. Байков, В. Д. Интернет. Поиск информации. Продвижение сайтов / В. Д. Байков. - СПб.: БХВ- Петербург, 2000. -- 288 с.

3. Маннинг, К. Введение в информационный поиск / К. Маннинг. - М.: «Вильямс», 2011.- 200 с.

4. Терехов, И. В. Автоматизированные информационные системы в образовании и науке [Электронный ресурс]: семинар

Размещено на Allbest.ru


Подобные документы

  • История развития поисковых систем, особенности механизма поиска. Сравнительный обзор справочно-поисковых систем Интернета. Понятие поисковых роботов. Наиболее популярные поисковики для русскоязычного пользователя. Перспективы развития поисковых систем.

    реферат [64,0 K], добавлен 20.12.2012

  • Рассмотрение поисковых систем интернета как программно-аппаратного комплекса с веб-интерфейсом, предоставляющего возможность поиска информации. Виды поисковых систем: Archie, Wandex, Aliweb, WebCrawler, AltaVista, Yahoo!, Google, Яндекс, Bing и Rambler.

    реферат [24,3 K], добавлен 10.05.2013

  • Анализ возможностей поисковых систем Яндекс и Google, их сравнение с точки зрения полезности. История создания поисковых систем, характеристика их интерфейса, поисковых инструментов и алгоритмов. Формирование вопроса и критерий к ответу на него.

    реферат [30,0 K], добавлен 07.05.2011

  • Определение программного и математического обеспечения ИС. Виды запросов к базам данных в СУБД. Поисковые системы Интернет. Описание принципа работы поисковых систем Яндекс, Рамблер, Апорт. Особенности пересылки файлов средствами электронной почты.

    контрольная работа [271,7 K], добавлен 22.11.2009

  • Основные принципы построения информационно-поисковых систем. Архитектура современных информационно-поисковых систем WWW. Принцип работы поисковых систем. Процесс поиска, информационный язык, перевод, дескриптор, критерий соответствия, индексирование.

    курсовая работа [70,2 K], добавлен 10.06.2014

  • Обеспечение высокой релевантности поиска с помощью поисковой системы Google. Быстрота и надежность работы, большее количество ссылок в русскоязычном секторе Интернета. Службы, отсутствующие у других поисковых систем. Google как законодатель моды.

    презентация [1,5 M], добавлен 10.03.2015

  • Сущность поисковых систем интернета. Google и Yahoo! как крупнейшие в интернете поисковые машины. Характеристика Baidu как лидера среди китайских поисковиков. Обзор технологии QDR SRAM. Архитектура строения памяти QDR, ее достоинства и недостатки.

    реферат [186,5 K], добавлен 27.09.2014

  • Хранение данных в сети Internet. Гипертекстовые документы, виды файлов. Графические файлы, их виды и особенности. Поисковые системы и правила поиска информации. Обзор поисковых систем сети Internet. Все о поисковых системах Yandex, Google, Rambler.

    курсовая работа [918,3 K], добавлен 26.03.2011

  • Понятие, структура и классификация информационных систем. Информационно поисковые системы. Исторические предпосылки развития поисковых систем. Понятие поисковых систем. Особенности поисковых систем: структура сети, структура работы поисковых систем.

    курсовая работа [81,9 K], добавлен 28.03.2005

  • Развитие компьютерной техники. Начало Интернета. Уровни Интернета. Доменные зоны. Сервисы Интернета. Программы-браузеры. Поисковые системы. Вирусы. Проблемы развития Интернета в Беларуси. Каким будет компьютер будущего?

    реферат [935,6 K], добавлен 12.05.2006

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.