Методы и средства поиска информации в сети интернет
Характеристика основных методов поиска информации в Интернете: использование гиперссылок, поисковых машин, специальных средств, новых ресурсов. Преимущества и недостатки работы поисковых машин. Рекомендации для эффективного поиска информации в сети.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | реферат |
Язык | русский |
Дата добавления | 31.03.2018 |
Размер файла | 74,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Методы и средства поиска информации в сети интернет
Количество информации в Интернет растет в геометрической прогрессии.
По данным аналитической службы Netcraft (news.netcraft.com), в Интернете на февраль 2012 г. зарегистрировано 612 843 429 сайтов. За январь 2012 года количество сайтов увеличивалось почти на 32 миллиона (+5,2%).
Поиск информации в Интернете.
Цели поиска:
1. Получить полезную информацию;
2. Найти полезные ссылки на специализированные сайты.
Инструменты поиска:
1. Программы-браузеры Интернет (Internet Explorer, Opera, Firefox, Google Chrome);
2. Программы для захвата и каталогизации содержимого страниц:
- оффлайн-браузеры (Offline Explorer, Teleport Pro, WebCopier, "ДИСКо Качалка");
- надстройки над браузерами (Internet Explorer Text Archiver, CacheX );
3. Программы для захвата и каталогизации ссылок на ресурсы в сети (Compass, LinkSync, Linkman, Links Organizer);
4. Программа почтового клиента для чтения почтовых рассылок;
5. Программы обеспечения безопасности при работе в сети.
Типы поиска:
- Поиск по адресам URL;
- Поисковые системы.
Поисковая система -- программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете.
В просторечии под поисковой системой подразумевают веб-сайт, на которой размещён интерфейс (фронт-энд) системы - yandex.ru, google.com.
Программной частью поисковой системы является поисковая машина (поисковый движок) -- комплекс программ, обеспечивающий функциональность поисковой системы и являющийся коммерческой тайной компании-разработчика поисковой системы: Робот, Индекс, Программа обработки запросов.
Основные методы поиска информации в Интернете
1) Непосредственный поиск с использованием гипертекстовых ссылок (поиск информации производится путем последовательного просмотра связанных страниц с помощью браузера);
2) Использование поисковых машин (использовании ключевых слов, которые передаются поисковым серверам в качестве аргументов поиска: что искать);
3) Поиск с применением специальных средств (применении специализированных программ - спайдеров, которые в автоматическом режиме просматривают Web-страницы, отыскивая на них искомую информацию);
4) Анализ новых ресурсов (необходим при проведении повторных циклов поиска, поиска наиболее свежей информации или для анализа тенденций развития объекта исследования в динамике).
Большинство поисковых машин обновляет свои индексы со значительной задержкой, вызванной гигантскими объемами обрабатываемых данных, и эта задержка обычно тем больше, чем менее популярна интересующая тема.
Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.
Основные критерии качества работы поисковой машины:
- релевантность (степень соответствия запроса и найденного, то есть уместность результата);
- полнота базы;
- учёт морфологии языка.
История поисковых систем
Первой поисковой системой для Всемирной паутины был "Wandex", уже не существующий индекс, который создавал "World Wide Web Wanderer" -- бот, разработанный Мэтью Грэем (англ. Matthew Gray) из Массачусетского технологического института в 1993. Также в 1993 году появилась поисковая система "Aliweb", работающая до сих пор. Первой полнотекстовой, то есть индексирующей ресурсы при помощи робота, поисковой системой стала "WebCrawler", запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице -- с тех пор это стало стандартом во всех основных поисковых системах.
Средства поиска информации:
- Тематические каталоги ресурсов;
- Поисковые системы;
- Метапоисковые системы.
Тематические каталоги.
В каталогах информация о сайтах упорядочена в соответствии с рубрикатором. В отличие от простых подборок ссылок имеется механизм поиска. Работа поисковых механизмов ограничивается поиском в кратких аннотациях сайтов.
Кроме основных разделов многие каталоги имеют дополнительные разделы, в которых сайты классифицированы по другому основанию:
– региону, стране;
– алфавиту;
– популярности.
Информация о сайтах в каталоги может вноситься вручную как авторами сайта через механизм регистрации, так и модераторами - ведущими рубрик каталога. Преимущество каталога - создание списка "отборных" сайтов. Недостатки: неоднозначность структуры, требуется время для поиска нужной категории, количество сайтов в каталоге недостаточно большое.
Особенность каталогов в том, что они более эффективны при поиске подборок информации на определенную общую тему, например, "развитие образования", "состояние промышленности", но не при поиске ответа на конкретный вопрос!
Каталоги могут быть:
– специализированными,
– универсальными.
Специализированные каталоги включают только ссылки на сайты определенной, узкой тематики. Подобные каталоги удобны для поиска информации по конкретной тематике. Пример специализированного каталога: RadioLink - каталог ресурсов о телекоммуникациях.
Универсальные каталоги позволяют производить поиск по различным темам. Информация сгруппирована по разделам. Каждый раздел имеет несколько подразделов.
Проблема классификации каталогов.
В настоящее время в интернете функционируют миллионы каталогов. Они неравнозначны по качеству исполнения, информационному содержанию и функциональности. Значительная часть каталогов не производит индексацию сайтов и, следовательно, не производит поиск по их содержимому. Необходимо различать обычные каталоги от "продвинутых".
"Продвинутые" каталоги отличаются расширенной, а иногда и полной индексацией содержимого сайтов. К имеющимся возможностям каталогов (рубрикатор и поиск по аннотациям) добавляются мощные механизмы поиска в материалах сайтов.
Поиск с помощью каталогов.
Вариант 1. Чтобы найти сайты по определенной теме, необходимо "пройтись" по дереву каталога, постепенно сужая область поиска. Самое главное - изначально определить, в каком разделе начинать поиск.
Вариант 2. Используйте поисковый механизм. Практически все каталоги содержат поисковый механизм, позволяющий искать информацию по ключевым словам или фразам в описаниях и даже содержимом сайтов.
Поисковая система
Механизм работы поисковиков
Таким образом, после получения запроса поисковая система анализирует ту информацию, которую собрала ранее.
Преимущества: многократно повышается скорость обработки запроса.
Недостатки: область поиска ограничена внутренними ресурсами ПС, информация в базе данных быстро устаревает.
Результаты поиска:
- Заголовок найденной страницы;
- Отрывок из текста страницы;
- Полный URL-адрес Интернет-страницы в сети;
- Размер страницы, дата последнего изменения;
- Ссылка на копию страницы в базе поисковой машины (сохранено в кэше);
- "Похожие документы";
- Рубрику каталога или рейтинга поисковой машины.
Современные наиболее быстродействующие поисковые системы стремятся произвести индексацию всего документа, а не только его названия и первых предложений текста. Наиболее совершенные роботы при индексации сканируют не только главную страницу, но и по гиперссылкам заходят вглубь сайта.
Эффективный поиск
Этапы поисковой процедуры.
поиск информация интернет гиперссылка
Стратегии поиска:
1) от общего к частному;
2) от частного к общему.
Рекомендации по поиску:
1) Проверить орфографию в написании слова;
2) Использовать синонимы ключевых слов, если список найденных страниц слишком мал;
3) Проводить поиск больше, чем по одному слову. Максимально сузить предмет поиска;
4) Не начинать обычные слова с прописной буквы, кроме имён собственных;
5) Добавить к своему браузеру панели надстроек;
6) Для ускорения поиска отключить загрузку анимации, видео, звуки и картинок в браузере или воспользоваться облегченными версиями поисковых систем;
7) Настроить поиск: задать удобные параметры описания документов и структуру страницы с результатами поиска;
8) При необходимости использовать язык запросов, чтобы сделать запрос более точным.
Синтаксис оператора |
Что означает оператор |
Пример запроса |
|
пробел или & |
Логическое И (в пределах предложения) |
лечебная физкультура |
|
&& |
Логическое И (в пределах документа) |
рецепты && (плавленый сыр) |
|
| |
Логическое ИЛИ |
фото | фотография | снимок | фотоизображение |
|
+ |
Обязательное наличие слова в найденном документе |
+быть или +не быть |
|
( ) |
Группирование слов |
(технология | изготовление) (сыра | творога) |
|
~ |
Бинарный оператор И НЕ (в пределах предложения) |
банки ~ закон |
|
~~или_ |
Бинарный оператор И НЕ (в пределах документа) |
путеводитель по Парижу ~~ (агентство | тур) |
|
/(n m) |
Расстояние в словах (минус (-) - назад, плюс (+) - вперед) |
поставщики /2 кофе музыкальное /(-2 4) образование вакансии ~ /+1 студентов |
|
" " |
Поиск фразы |
"красная шапочка" Эквивалентно: красная /+1 шапочка |
|
&&/(n m) |
Расстояние в предложениях (минус (-) - назад, плюс (+) - вперед) |
банк && /1 налоги |
Размещено на Allbest.ru
Подобные документы
Характеристика методов поиска информации в Интернете, а именно - с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.
реферат [17,2 K], добавлен 12.05.2010Средства поиска информации в сети Интернет. Основные требования и методика поиска информации. Структура и характеристика поисковых сервисов. Глобальные поисковые машины WWW (World Wide Web). Планирование поиска и сбора информации в сети Интернет.
реферат [32,2 K], добавлен 02.11.2010Организация поиска информации по заданной теме в сети Интернет. Поиск с помощью поисковых машин. Преимущества и недостатки метода поиска по ключевому слову (фразе). Поиск в каталогах информационных ресурсов. Преимущества и недостатки предметных каталогов.
курсовая работа [47,5 K], добавлен 03.11.2010Особенности поиска информации в Интернет: стратегия и методика. Поисковые машины, каталоги и порталы информационных ресурсов. Подбор и введение ключевых слов. Использование режима "расширенный поиск", который имеет каждая из поисковых систем в Интернете.
реферат [27,3 K], добавлен 06.08.2014Методы и инструментарий хранения данных во Всемирной сети. Понятие и разновидности гипертекстовых документов и графических файлов. Принципы работы поисковых систем и правила поиска нужной информации. Характеристика некоторых поисковых систем Сети.
курсовая работа [30,9 K], добавлен 18.04.2010Общие принципы организации поиска информации в сети Интернет. Поиск с помощью каталогов информационных ресурсов и с помощью поисковых машин. Правила поиска информации, касающейся учета текущих обязательств и расчетов с покупателями и заказчиками.
курсовая работа [35,0 K], добавлен 09.11.2010Хранение данных в сети Internet. Гипертекстовые документы, виды файлов. Графические файлы, их виды и особенности. Поисковые системы и правила поиска информации. Обзор поисковых систем сети Internet. Все о поисковых системах Yandex, Google, Rambler.
курсовая работа [918,3 K], добавлен 26.03.2011Сущность и принцип работы глобальной сети Интернет. Поиск информации по параметрам в системе Google. Специализированные системы поиска информации: "КтоТам", "Tagoo", "Truveo", "Kinopoisk", "Улов-Умов". Целесообразное использование поисковых систем.
презентация [572,6 K], добавлен 16.02.2015Изучение классификации поисковых средств по В.В. Дудихину. Поиск информации с помощью поисковых ресурсов. Формирование запросов. Использование ключевых слов. Индексация документов, размещенных на различных серверах. Зарубежные лидеры поисковых систем.
презентация [775,3 K], добавлен 10.03.2015Поиск информации в Интернет с помощью каталогов и поисковых машин. Мгновенный обмен информацией в Интернете. Основные программы и браузеры для поиска и обмена информацией. Программное обеспечение для просмотра веб-сайтов. Программы для обмена файлами.
дипломная работа [81,1 K], добавлен 23.06.2012