Разработка поисковой системы
Анализ существующих поисковых систем в Интернет. Разработка уникального поискового алгоритма системы, предназначенной для Российской Федерации. Выбор критериев его оптимизации. Описание системы на структурно-параметрическом и функциональном уровне.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | реферат |
Язык | русский |
Дата добавления | 21.01.2015 |
Размер файла | 148,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Оглавление
Введение
1. Изучение предметной области
2. Разработка модели системы
3. Разработка системы на структурно-параметрическом и функциональном уровне
4. Выбор критериев, анализ системы и механизма его применения
5. Оптимизация и усовершенствование алгоритма
Заключение
Введение
Постоянно увеличивается объём сайтов в глобальной сети под названием интернет. Существует несколько крупнейших поисковых систем, но их алгоритмы не совершенны и выдача не всегда релевантна запросу.
Актуальность проекта - На данный момент существует российская поисковая система под названием Яндекс, но в ближайшее время они собираются выпустить новый формат выдачи под названием острова, что может привести к серьёзным последствиям. Многие специалисты считают, что это приведёт к снижению трафика данной поисковой системы, люди будут искать альтернативу.
Цель курсовой работы - разработать поисковую систему предназначенную для РФ.
Объектом данного проекта является поисковая выдача сайтов.
Предметом является поисковая система.
Гипотеза - при создании поисковой системы учесть особенности русского языка, геозависимость и опыт зарубежных коллег (Гугл) и уже существующих наших аналогов ( Рамблер, Яндекс)
Практическая значимость - При создание хорошего, уникального поискового алгоритма, данная поисковая система будет востребована.
1. Изучение предметной области
В России существуют несколько поисковых систем:
Яндекс, Гугл, Майл, Рамблер
Рассмотрим процент трафика каждой поисковой системы на территории РФ:
Из этих данных можно сделать вывод, что лидерами являются Яндекс и Гугл.
Яндекс - вводит новый алгоритм и с прогнозировать, что будет после полного запуска островов не возможно.
Гугл - мировая поисковая система, вследствие чего не может учитывать особенности каждой страны.
Основные особенности ранжирование
Яндекс - соблюдение тематики сайта и актуальности информации, с недавних пор ПФ (поведенческий фактор).
Гугл - в большей степени на авторитетность сайта и на количество вхождение ключевых слов в тексте.
2. Разработка модели системы
поисковый алгоритм параметрический функциональный
Возьмём за основу базовые алгоритмы Яндекса и Гугла и смешаем их.
Входные параметры:
x1 - Уникальность текста
x2 - Поведенческий фактор
x3 - Авторитетность
Выходные данные:
y1 - позиция сайта в выдачи
Управлен:
U - алгоритм поиска
Возможные Проблемы с алгоритмом:
- Черная оптимизация ( дорвеи, клоакинг и тд).
- Ошибка автоматического алгоритма.
Способ решения:
- Отслеживать резкое изменение параметров.
- При необходимости ручная проверка данных.
3. Разработка системы на структурном, параметрическом и функциональном уровне.
T = 2 недели
4. Выбор критериев, анализ системы и механизма его применения
Критерием для оптимизации алгоритма берём увеличение количества входных параметров:
- Геозависимость ( вплоть до районов/округов)
- Поисковая история пользователя
Рассмотрим новые параметры подробней:
Геозависимость. Нужна при заказе пиццы, выборе автосервиса, музеев, кинотеатров, муниципалитет и тд. Весьма удобно заказывать пиццу, которая расположена недалеко от вашего дома…
Поисковая история пользователя. На некоторые запросы поисковая система не может дать точный ответ.
Например:
Запрос - сталкер
Что пользователь хотел увидеть в выдаче?
- Книгу
- Игру
- Определение, что это за профессия
Анализирую предыдущие запросы пользователя можно выявить его предпочтения.
1 вариант.
Предыдущие запросы - Достоевский, Евгений Онегин, Человек в футляре, Война и мир.
Следовательно скорее всего он хотел увидеть выдачу про книгу.
2 вариант.
Предыдущие запросы - CS 1.6 , GTA 5, WOW, прохождение игры Принц Персии, купить компьютерную игру …
Следовательно скорее всего он хотел увидеть выдачу про компьютерную игру.
3 вариант.
Пользователь частый гость на Wiki, читает форумы диггеров и тд
Следовательно скорее всего он хотел увидеть выдачу про профессию.
5. Оптимизация и усовершенствование алгоритма
1. Проводить анализ запросов за определённый период (например 3 месяца), выводить самые популярные подсказки.
Например:
Компьютер
Подсказки - ремонт, цена, собрать, …
2. Мониторить вручную выдачу по самым популярным тематикам, чистить выдачу от сайтов не отвечающим требованиям алгоритма или не отвечающим удобствам пользователям (юзабилити).
Например:
Черный шрифт на красном фоне.
Заключение
Изучив данную предметную область были выявленные недостатки существующих поисковых систем, найдены нестандартные решение для нового алгоритма, что несомненно способствует увеличению релевантности выдачи, что в свою очередь поможет привлечь большую часть аудитории пользователей.
Размещено на Allbest.ru
Подобные документы
Описание и классификация современных информационно–поисковых систем. Гипертекстовые документы. Обзор и рейтинги основных мировых поисковых систем. Разработка информационно–поисковой системы, демонстрирующей механизм поиска информации в сети Интернет.
дипломная работа [1,3 M], добавлен 16.06.2015Понятие информационно-поисковых систем, их сущность и особенности, история возникновения и развития, роль на современном этапе. Внутреннее устройство и элементы поисковой системы. Принцип работы поисковой машины Рамблер, прядок обработки запроса.
научная работа [222,0 K], добавлен 29.01.2009Анализ существующих поисковых систем и используемых ими алгоритмов поиска документов. Разработка информационно-поисковой системы словарного типа, способной осуществлять релевантный поиск документов, особенности ее структуры и информационно-поисковой базы.
дипломная работа [942,1 K], добавлен 19.05.2011Особенности разработки интернет-ресурса для осуществления коммерческой деятельности. Классификация электронных магазинов. Основы поисковой оптимизации. Использование мета тегов. Разработка интерфейса и новостного блока. Регистрация в поисковых системах.
дипломная работа [2,2 M], добавлен 06.01.2017Описание проектирования электронной библиотеки для размещения в облаке документации кафедры. Планирование базы данных, структуры Web-системы и дизайна страниц. Разработка Интернет-системы в среде Visual Studio.NET. Разработка бизнес-логики системы.
курсовая работа [2,5 M], добавлен 23.08.2014Характеристика методов поиска информации в Интернете, а именно - с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.
реферат [17,2 K], добавлен 12.05.2010Контекстная реклама как основная статья дохода поисковых систем-лидеров. Понятие цены клика. Формирование цены на основе частот запросов (на примере поисковой системы Рамблер). Основные поисковые системы на российском рынке, перспективы их развития.
творческая работа [373,4 K], добавлен 07.04.2009Организация хранения данных. Система управления базами данных. Поиск информации, обзор существующих поисковых систем. Особенности работы поискового движка. Использование индексов в поисковых системах. Особенности поиска различных видов информации.
курсовая работа [4,6 M], добавлен 14.05.2014Структура справочно-поисковых систем сети Интернет, работа механизмов поиска. Сравнительный обзор справочно-поисковых систем (Gopher, WAIS, WWW, AltaVista, Yahoo, OpenText, Infoseek). Поисковые роботы, наиболее популярные справочно-поисковые системы.
реферат [28,4 K], добавлен 14.01.2010Методы продвижения сайтов. Структура поисковой системы "Яндекс". Факторы ранжирования запросов. Фильтры поисковых систем, "Минусинск". Изменение структуры страниц. Применение внешней оптимизации сайта. Панель вебмастера с отображением внешних ссылок.
курсовая работа [2,0 M], добавлен 14.11.2016