Інформаційно-пошукові системи в мережі Internet

Визначення поняття та використання інформаційно-пошукових систем в практичній діяльності. Характеристика видів систем та механізми пошуку в них необхідної інформації. Вивчення найвідоміших сучасних інформаційно-пошукових систем в мережі Internet.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык украинский
Дата добавления 04.10.2014
Размер файла 27,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Міністерство освіти і науки України

Департамент науки і освіти

Харківської обласної державної адміністрації

Харківський коледж

РЕФЕРАТ

на тему: «Інформаційно-пошукові системи в мережі Internet»

Підготувала:

студентка 21-М групи

Островерхова Тетяна

Викладач:

Фоменко Л.М.

Харків 2014

  • Зміст
  • Вступ
  • 1. Поняття та використання інформаційно-пошукових систем
  • 2. Види інформаційно-пошукових систем (ІПС)
  • 3. Механізм пошуку в інформаційно-пошукових системах (ІПС)
  • 4. Найвідоміші інформаційно-пошукові системи (ІПС)
  • Висновок
  • Список використаної літератури

Вступ

Пошукова система - це складний програмно-апаратний комплекс, що призначений для здійснення пошуку ресурсів в Інтернет, збереження відомостей про них в своїх базах і надання користувачу переліку посилань відповідно до його пошукового запиту.

Головним завданням пошукової системи є здатність надавати користувачам саме ту інформацію, яку вони шукають. А навчити користувачів робити «правильні» запити до пошукової системи, які відповідають її принципам роботи неможливо. Тому, розробники створюють такі алгоритми і принципи роботи пошукових систем, які найкраще пристосовані до поведінки і ходу думок пересічного користувача.

Пошукова система повинна діяти так само, як діє користувач при пошуку інформації і надавати за його запитом інформацію максимально швидко і просто. Користувач оцінює роботу системи за кількома основними критеріями. Чи знайшов він те, що шукав? Якщо не знайшов, то скільки разів йому довелося перефразувати запит, щоб знайти потрібне? Наскільки актуальною є надана інформація? Наскільки швидко пошукова машина обробляла запит? Наскільки зручно було представлено результати пошуку? Чи була потрібна інформація серед перших результатів пошуку? Як багато непотрібної інформації було знайдено нарівні з корисною?

Для того, щоб задовольнити зростаючим потребам користувачів, розробники пошукових машин постійно вдосконалюють алгоритми і принципи пошуку, додають нові функції і можливості, всіляко намагаються пришвидшити роботу системи.

1. Поняття та використання інформаційно-пошукових систем

Поняття інформаційного пошуку вперше запровадив в інформатиці американський математик Келвин Муерс в 1947 році. Інформаційним пошуком (ІП) називається деяка послідовність операцій, яка виконується з метою відшукання документів, які містять певну інформацію (з подальшою видачею цих документів або їх копій), або з метою видачі фактичних даних, які надають відповіді на задані питання.

Спонукальним приводом інформаційного пошуку, як було зазначено вище, є інформаційна потреба, яка виражена у формі інформаційного запиту. Об'єктами інформаційного пошуку можуть бути документи, відомості про їх наявність та/або місцезнаходження, фактографічна інформація.

Інформаційний запит представляє собою інформаційну потребу, яка сформульована на природній мові. Результат «перекладу» інформаційного запиту на інформаційно-пошукову мову (ІПМ) називають пошуковим образом запиту (ПОЗ). Синтаксис і семантика ІПМ визначається структурою і наповненням документів, та загальними задачами системи.

Інформаційний пошук розрізняють наступним чином:

в залежності від мети - адресний пошук (формально-механічний) та семантичний (тематичний),

в залежності від об'єкту пошуку - документний та фактографічний,

в залежності від ступіню використання технічних засобів - ручний або автоматизований,

в залежності від функціональної ролі - домінуючі/другорядні, центральні/периферичні, сталі/ситуативні потреби.

Усі види інформаційного пошуку перетинаються, тому що цілі та об'єкти часто взаємопов'язані. Наприклад, документний і фактографічний види пошуку можуть бути як адресними, так и семантичними.

Для організації пошуку інформації в мережі Iнтернет призначено пошукові сервери(пошукові системи). Використовуючи такі сервери, можна подати запит на пошук потрібної інформації, а сервер(система) видасть вам список посилань(адрес) на електронні джерела, при цьому кожна адреса відіграє роль гіперпосилання, активізуючи яке, можна одразу ж відкрити відповідну сторінку. За принципом дії пошукові сервери поділяються на пошукові каталоги і пошукові індекси. Пошукові каталоги дозволяють здійснювати тематичний пошук. Початкова сторінка таких серверів є тематичним рубрикатором верхнього рівня. Вибравши рубрику, підрубрику і т.д., можна поступово опускатися до переліку матеріалів, які присвячені досить вузькій темі. Пошукові індекси працюють як алфавітні вказівники. У них запит робиться в полі пошуку у вигляді послідовності ключових слів, які відповідають змісту шуканої інформації. У відповідь на такий запит буде видано список Web-сторінок, в яких зустрічаються вказані слова. Багато інформаційно-пошукових систем є одночасно і пошуковими каталогами, і пошуковими індексами. Відмітимо, що пошукові системи часто називають пошуковими машинами або машинами пошуку. Всього в світі існують сотні пошукових систем, і вибір якоїсь із них залежить від ваших власних уподобань. Відомими пошуковими серверами є: AltaVista, Yahoo, Rambler, Yandex, Aport, Мета Україна. Деякі з пошукових систем дозволяють шукати інформацію не тільки на Web-сторінках, але й у групах новин і в місцях, де зберігаються файли. Тому надалі будемо вживати замість терміна сторінка більш загальний термін - документ.

В загальному вигляді процедура інформаційного пошуку складається з чотирьох етапів: інформаційний пошуковий мережа іnternet

уточнення інформаційної потреби і формулювання запиту,

визначення сукупності інформаційних масивів,

вилучення інформації з інформаційних масивів,

ознайомлення користувача з отриманою інформацією і оцінювання результатів пошуку.

Постановка пошукової проблеми. На цьому етапі користувач формулює точне визначення і фіксує то, що буде шукати і в якій області знань (предметній області - ПрО). Таким чином множина пошуку звужується визначеними межами.

Створення тезаурусу проблеми. На цьому етапі користувач створює (складає) перелік слів, які найбільш повно відображають ПрО або проблему, що була визначена. Як рекомендують спеціалісти з бібліографічного пошуку, цей перелік повинен мати приблизно 10-15 слів.

В залежності від поставленого завдання тезаурус може бути складений на декількох мовах, для пошуку серед вітчизняних та зарубіжних джерел інформації. Робота над тезаурусом ведеться весь час, і в процесі виявлення нових термінів вони тут же додаються до тезаурусу. Найбільш прийнятною є структура тезаурусу у вигляді семантичних зрізів. У цьому випадку для кожного основного терміну окремо будується таблиця для супутних та шумових слів. Шумових слів у джерелі бути не повинно. Тобто користувач отримує пакет таблиць, які можна окремо розширювати і модифікувати в ході пошуку.

Відбір джерел даних для пошуку. Джерела даних (масив) обираються виходячи з характеру проблеми (тобто де найбільш доступні та повно надані джерела) та можливостей користувача (доступ до інтернету, бібліотеки тощо).

Виконання пошуку засобами, які притаманні джерелу даних. На цьому етапі користувач з тезаурусу складає пошукові запити і реалізує їх методами пошуку, які специфічні для даного ресурсу. В бібліотеці - це пошук в каталогах, якщо інформацією володіють люди або організації - пошук та звернення до них, у мережі Інтернет - використовуються пошукові машини та каталоги, телеконференції та списки розсилки, сайти та інше. Як формат так і семантика запитів варіюється в залежності від предметної області та використовуваного інформаційного ресурсу.

Як рекомендують спеціалісти з бібліографічного пошуку, запити необхідно складати таким чином, щоб область пошуку була максимально конкретизована та звужена. Необхідно віддавати перевагу декільком вузьким запитам ніж одному, але розширеному. В загальному випадку для кожного основного поняття з тезауруса готується окремий пакет запитів. Після чого проводиться пробне виконання запитів - для уточнення та доповнення тезаурусу, в тому числі для відсікання шумової інформації.

Оцінювання отриманих результатів пошуку. В результаті пошуку користувач отримує результуючу множину документів, які надалі необхідно проаналізувати і вирішити наскільки повно вони покривають поставлену пошукову проблему.

Прийняття рішення про продовження (закінчення) пошуку. Якщо, оцінюючи результати пошуку, користувач прийшов до висновку, що необхідна інформація знайдена вся, тоді пошук можна припиняти - подальші пошуки будуть зайвою тратою дорогоцінного часу. У зворотній ситуації (неповні відомості) користувачеві доведеться приймати рішення про те, на якому з етапів була допущена помилка, і спробувати виправити її, після чого повторити процес пошуку з цього місця заново. В цьому випадку можливі три варіанти: невірно складений тезаурус проблеми, невірно обране інформаційне джерело або користувач скористався недоцільними методами пошуку (наприклад, виконував пошук суто наукових даних - статті за допомогою загально використовуваного пошукового інтернет-сервісу).

2. Види інформаційно-пошукових систем (ІПС)

Інформаційно-пошукові системи відрізняються одна від одної за багатьма ознаками, але при вирішенні задач збору, зберігання і передачі інформації мають такі спільні процедури:

аналіз документів і їх підбір;

створення пошукового образу документів;

запис документів і їх пошукових образів на прийняті носії;

зберігання документів;

аналіз запитів;

видача документів користувачам.

Інформаційно-пошукові системи можна класифікувати за такими ознаками:

1) родом виконаних операцій;

2) режимом пошуку;

3) типом інформаційно-пошукової мови;

4) типом критерію відповідності;

5) ступенем автоматизації.

За першою ознакою інформаційно-пошукові системи діляться на документальні, фактографічні, логічні і комплексні.

Документальні інформаційно-пошукові системи на інформаційні запити видають адреси зберігання пошукових образів, оригінали чи копії документів з необхідною інформацією.

Фактографічні інформаційно-пошукові системи у відповідь на введені в них інформаційні запити безпосередньо видають відповідні фактичні дані (структурний склад, формули, характеристики матеріалів і т.д.).

Логічні інформаційно-пошукові системи видають на запит не лише введену раніше інформацію, але, якщо необхідно, виконують логічну переробку цієї інформації для одержання нової, що в систему не вводилась.

Комплексні інформаційно-пошукові системи містять сукупність елементів документальних, фактографічних і логічних інформаційно-пошукових систем.

За режимом пошуку інформаційно-пошукові системи поділяються на системи, що працюють в режимі вибіркового розподілу інформації і системи ретроспективного пошуку.

За типом інформаційно-пошукової мови інформаційно-пошукові системи класифікуються на системи з природними (людськими) і інформаційними мовами. Інформаційно-пошукові мови - це синтетично створені мови для ідентифікації і пошуку документів за запитом.

За критерієм відповідності інформаційно-пошукові системи поділяються на системи з використанням логічних схем, аналітичних функцій (статистичні і векторні), з аналізом критерію відповідності на збіг чи часткове входження.

За ступенем автоматизації інформаційно-пошукові системи поділяються на системи з автоматичною класифікацією масивів, системи з автоматичним пошуком для сортування і порівняння пошуку образу документів з пошуковим розпорядженням, системи з автоматичним індексуванням для автоматизації процесів згортання при реферуванні, анотуванні, виборі ключових слів, системи з автоматичною видачею інформації, системи з автоматичним управлінням.

За принципом дії розрізняють кілька видів пошукових систем:

пошукові каталоги;

рейтингові системи;

індексні бази даних.

Пошукові тематичні каталоги

Принцип дії таких каталогів дуже нагадує організацію тематичних каталогів великих бібліотек. Звернувшись на адресу пошукового каталогу, користувач знаходить на його основній сторінці перелік тематичних категорій, наприклад таких як Освіта, (Education), Наука (Science), Бізнес (Business), Мистецтво (Art) тощо.

Як правило, такі каталоги є ієрархічними гіпертекстовими меню з пунктами і підпунктами, які визначають тематику сайтів, адреси яких містяться в цьому каталозі, з поступовим (від рівня до рівня) уточненням теми.

Працювати з пошуковими каталогами просто. У них пошук інформації відбувається на інтуїтивному рівні і практично завжди закінчується успіхом. Однак за цією простотою приховується найвища складність створення і ведення каталогу. Пошукові каталоги створюються, як правило, вручну. Висококваліфіковані редактори особисто переглядають інформаційний простір Веб, відбираючи те, що на їхню думку становить загальний інтерес, і заносять адреси до каталогу.

Найбільшим пошуковим каталогом світу є Yahoo! Українська meta.ua.

Рейтингова система

Ідея цієї системи полягає у тому, що на головній сторінці розміщується перелік найважливіших тем, які, в свою чергу, містять список тематичних розділів. Вибравши потрібну тему, користувач отримує обмежений перелік веб-ресурсів, присвячених даній темі. Поруч з кожним веб-ресурсом висвітлюється оцінка його популярності, яка вимірюється в кількості переглядів цього ресурсу за останню добу. Проте, потрібно пам'ятати, що не завжди високий рейтинг об'єктивно відповідає якості веб-ресурсу.

В Україні основним засобом рейтингового пошуку є Top Ping - topping.com.ua,

В Росії це: Рамблер - www.rambler.ru.

Індексні пошукові системи

Більшість пошукових систем світу - індексні пошукові системи, які ще називають пошуковими покажчиками, пошуковими серверами, словниковими пошуковими системами, автоматичними індексами, пошуковими машинами, Search Engines - в англомовних джерелах тощо. Їхнє призначення - якнайкраще охопити інформаційних веб-простір і подати його користувачам у зручному вигляді.

Принцип роботи з індексними пошуковими системами (ІПС) засновано на ключових словах. Розпочинаючи пошук інформації з певної теми, користувач має ввести ключові слова у рядок пошуку, які описують його тему і вибрати кнопку Знайти (або Найти, Go, Search), яка розташована поряд з рядком пошуку.

Після вибору кнопки Знайти, ключова фраза посилається на сервер і пошукова система починає пошук у своїх базах даних адреси веб-ресурсів, які містять вказані ключові слова. Як здійснюється пошук, користувач не може бачити, він лише побачить результат запиту - нове вікно в якому відображається перелік веб-ресурсів, які містять ключові слова.

3. Механізм пошуку в інформаційно-пошукових системах (ІПС)

Пошукові cистеми зазвичай мають три компоненти:

агент (павук, кроулер або робот), який переміщується по мережі і збирає інформацію;

база даних(індексатор) яка містить інформацію, що зібрано павуками;

пошуковий механізм(пошукова машина), який користувачі використовують як інтерфейс для взаємодії з базою даних.

Засоби пошуку типу агентів, павуків, кроулерів і роботів використовуються для збору інформації про документи, які знаходяться в мережі Інтернет. Це спеціальні програми, які займаються пошуком сторінок в мережі, збирають гіпертекстові посилання з цих сторінок і автоматично індексують інформацію, яку вони знаходять для побудови бази даних. Кожний пошуковий механізм має власний набір правил, якими визначається збір документів.

1. Спайдери (Spider, Crawler, Robot) -- програма, що відвідує веб-сервери, зчитує й індексує цілком або частково їхній вміст і далі рухається через посилання, знайдені на сервері. Спайдер повертається через визначені періоди часу, наприклад, кожного місяця, і повторює індексацію сторінок.

Кожний пошуковий механізм має власний набір засобів, завдяки якому визначається збір документів. Зупинимось коротко на їх особливостях.

* Агенти є найінтелектуальнішими з пошукових засобів. Вони можуть робити більше, ніж просто шукати: вони можуть виконувати транзакції від імені користувача, а також шукати сайти специфічної тематики і повертати списки сайтів, відсортованих за їх відвідуваністю. Агенти можуть обробляти вміст документів, знаходити та індексувати інші види ресурсів, не лише сторінки. Вони можуть бути запрограмовані для отримання інформації з вже існуючих баз даних. Незалежно від інформації, яку агенти індексують, вони передають її назад до бази даних пошукового механізму.

* Павуки здійснюють загальний пошук інформації в Інтернеті. Павуки повідомляють про зміст знайденого документа, індексують його і добувають підсумкову інформацію. Вони також можуть переглядати заголовки, деякі посилання і відправляти індексовану інформацію до бази даних пошукового механізму.

* Кроулери переглядають заголовки і повертають користувачу тільки перше посилання.

* Роботи можуть бути запрограмовані таким чином, щоб переходити по різним посиланням різної глибини вкладеності, виконувати індексацію і перевіряти посилання в документі. Але, вони можуть застрягати в циклах, адже, проходячи за посиланнями, їм потрібні значні ресурси мережі. Існують методи, що забороняють роботам пошук по сайтах, власники яких не бажають, щоби вони були проіндексовані.

2. Усе, що знаходить і зчитує спайдер, попадає в індекси пошукової системи. Індексатор системи -- гігантське сховище інформації, де зберігаються копії текстової складової усіх сторінок, що відвідав і проіндексував спайдер.

Агенти збирають та індексують різні види інформації. Деякі, наприклад, індексують кожне окреме слово у документі, в той час як інші індексують тільки 100 найбільш важливих слів в кожному документі, індексують розмір документу і кількість слів в ньому, назву, заголовки і підзаголовки і так далі. Вигляд побудованого індексу визначає, який пошук може бути проведений пошуковим механізмом і як отримана інформація буде інтерпретована.

Агенти знаходять інформацію, після чого її розміщують в базі даних пошукового механізму. Адміністратори пошукових систем визначають, які сайти або типи сайтів агенти мають відвідати та проіндексувати. Проіндексована інформація відправляється до бази даних пошукового механізму.

Користувачі можуть розміщувати власну інформацію прямо в індексі, заповнюючи особливу форму для того розділу, в який вони хотіли б помістити свою інформацію. Ці дані передаються базі даних.

Коли користувач хоче знайти інформацію, доступну в Інтернеті, він відвідує сторінку пошукової системи і заповнює форму, що деталізує потрібну йому інформацію. Тут можуть використовуватись ключові слова, дати та інші критерії. Критерії в формі пошуку повинні відповідати критеріям, які використовуються агентами при індексації інформації, яку вони знайшли при переміщені по мережі.

База даних відшукує предмет запиту, що базується на інформації, яка вказана в заповненій формі, і виводить відповідні документи, що підготовані базою даних. Для того, щоб визначити порядок, в якому перелік документів буде показано, база даних застосовує алгоритм ранжування. В ідеальному випадку, розташованими першими в списку будуть такі документи, що є найбільш релевантними до запиту користувача.

Пошуковий механізм - це програма, що відповідно до запиту користувача перебирає індекси пошукової системи в пошуках інформації і видає йому в порядку зменшення релевантності знайдені документи.

Релевантність визначає, наскільки повно той або інший документ (зміст знайденої веб-сторінки) відповідає критеріям, зазначеним у запиті користувача. Але комп'ютер -- не людина, і тому пошукові системи використовують спеціальні алгоритми для визначення релевантності.

Теоретичних методів визначення релевантності веб-сторінок існує більш ніж 20. Але виділяють два основні напрями: лінгвістичне (Rambler, Hndex) і статистичне (Google).

Різні пошукові системи використовують різні алгоритми ранжування, однак основними принципами визначення релевантності є наступні:

* Кількість слів запиту, який є у текстовому вмісті документу (тобто в html-коді).

* Теги, в яких ці слова розташовуються.

* Місцеположення шуканих слів у документі.

* Питома вага слів, відносно яких визначається релевантність сторінки, у загальній кількості слів документу.

Вище вказані принципи застосовуються всіма пошуковими системами, в той час як наведені нижче використовуються лише деякими, але достатньо відомими (наприклад, AltaVista).

* Час -- тобто як довго сторінка знаходиться в базі пошукового сервера. Спочатку здається, що це недолугий принцип. Але в Інтернеті існує багато веб-сайтів, час життя яких складає близько місяця. Якщо ж сайт існує досить довго, то це означає, що його власник є досвідченим за певною темою. Вірогідно, що користувачу більше підійде веб-сайт, що існує вже кілька років, ніж той, який з'явився тиждень тому за цією ж тематикою.

* Індекс цитованості показує як багато посилань на дану веб-сторінку ведеться з інших сторінок, що зареєстровані у базі пошукової системи.

База даних виводить ранжований таким чином перелік документів з html-кодами і повертає його користувачу, який зробив запит. Різні пошукові механізми вибирають різні способи показу отриманого переліку -- деякі відображають лише посилання, інші -- виводять посилання з декількома першими реченнями документу чи заголовок документу разом з посиланням. Коли користувач звертається до посилання на один з документів, цей документ завантажується з сервера, на якому він знаходиться.

Зрозуміло, далеко не завжди документ, визнаний пошуковою системою найбільш релевантним, буде таким на думку самого користувача.

4. Найвідоміші інформаційно-пошукові системи (ІПС)

GOOGLE

Google (ґумґл) - назва однієї з найпотужніших пошукових систем у Всесвітній мережі Інтернет, американська публічна транснаціональна корпорація, заснована в 1998 році аспірантами Стенфордського університету Ларрі Пейджем та Сергієм Бріном, лідер веб-ринку у світі. Назва - спотворене написання слова гугол (анг. googol), та означає число рівне сотому ступеню числа десять. Родоначальником назви і одним з творців пошукової системи Google є Сергій Брін. Це саме він, невідомо, навмисно чи випадково, написав слово «googol» неправильно.

Google керує понад мільйоном серверів у центрах опрацювання даних (ЦОД) у всьому світі, опрацьовуючи більше мільярда пошукових запитів і 24 петабайт користувацьких даних щодня. Швидкий ріст Google з моменту його заснування призвів до виникнення великої кількості продукції, незв'язаної безпосередньо з головним продуктом компанії -- пошуковою системою. Google має такі онлайн-продукти як поштовий сервіс Gmail, соціальні інструменти Google+ та Google Buzz. У компанії є також і десктопні продукти, такі як браузер Google Chrome, програма для роботи з фото Picasa і програма обміну миттєвими повідомленнями Google Talk. Крім того Google веде розробку мобільної операційної системи Android, яка використовується великою кількістю смартфонів, а також операційною системою Google Chrome OS, яку вже тепер можна скачати на офіційному сайті Google.

Yahoo!

Yahoo!(вимовляється як яху!) - американська компанія, яка володіє другою за популярністю (5.88% [1]) в світі пошуковою системою і надає ряд сервісів, об'єднаних інтернет-порталом Yahoo! Directory; портал включає в себе популярний сервіс електронної пошти Yahoo! Mail, один з найстаріших і найбільш популярних в Інтернеті. У 2004 році була запущена нова версія поштового інтерфейсу, заснована на AJAX.

Компанія Yahoo! була заснована аспірантами Стенфордського університету Девідом Файло (англ. David Filo) і Джері Янгом (англ. Jerry Yang) в січні 1994 року; стала корпорації 2 березня 1995 року. Головний офіс компанії знаходиться в місті Саннівейл (англ. Sunnyvale), штат Каліфорнія, США.

Згідно зі статистикою Alexa Internet, на сьогоднішній день [коли?] Yahoo! - четвертий за відвідуваністю веб-сайт в мережі Інтернет, і приблизно 28% відвідувань складаються з перегляду тільки однієї сторінки.

Yandex

Yandex виконує пошук в тій частині Інтернету, яка використовує слов'янські мови, з урахуванням їх специфічної морфології. Маючи могутній механізм підбору сайтів під запити, ця пошукова машина допомагає знайти найбільш відповідні веб-сторінки. Яндекс щодня переглядає сотні тисяч веб-сторінок у пошуках змін або нових посилань і його база постійно зростає.

Основною відмінною рисою Yandex є ретельно розроблений алгоритм оцінки відповідності відповіді запиту (релевантності), який враховує не лише кількість слів запиту, знайдених у тексті, але і "контрастність" слова (його відносну частоту для даного документа), відстань між словами, і положення слова в документі. Другою перевагою цієї пошукової служби є пошук з використанням всіх форм слова. Саме це зробило Яндекс лідером пошукових систем СНД.

Висновок

Головна вимога до будь-якої пошукової системі - швидке формування точної і повної відповіді, адекватного запиту користувача.

Найбільші позитивні результати до теперішнього часу досягнуті в сфері глобального пошуку (ІПС Google , AltaVista , Yahoo! , Yandex , Rambler, ...). Апріорі зрозуміло , що в глобальних базах (внаслідок їх всеосяжного характеру) з дуже великою ймовірністю може бути знайдена підходяща відповідь на більшість запитів користувачів навіть без залучення для цих цілей серйозного методичного апарату . Тому моделі пошукових систем для Інтернет, як правило , базуються, на ймовірно-статистичних алгоритмах , орієнтованих на відбір текстової інформації по відносно простих формальних правил і ознак ( зазвичай по сигнатурам ключових слів або їх поєднань) . У них слабо враховуються (або не враховуються взагалі ) лінгвістичні особливості і граматичний лад мовної основи текстової інформації. Для більш якісного відбору текстових ресурсів , відповідаючих запиту користувача , в глобальних пошукових системах використовуються також деякі штучні прийоми апріорного призначення релевантності ресурсу (у вигляді індексів цитування , частоти народження ключових слів на даному ресурсі і т.п.). Звернення до лінгвістичним методам в глобальних пошукових системах зводиться в кращому випадку тільки до використання морфологічних характеристик лексичних одиниць того чи іншої мови . Тому , незважаючи на широку популярність подібних систем , при реалізації інформаційно-пошукових процедур на великих обсягах інформації поряд з корисною передається багато зайвої , " шумовий " інформації . Завдання власне вибору відповідних відомостей серед відібраної за запитом інформації покладається на користувача.

Размещено на Allbest.ru


Подобные документы

  • Аналіз властивостей безкоштовних пошукових та поштових серверів Інтернету. Огляд методики ранжирування результатів пошуку в інформаційно-пошукових системах бібліотек. Вивчення можливостей пошукової системи "Мета", пошуку по реєстру українських сайтів.

    курсовая работа [142,9 K], добавлен 17.11.2011

  • Національні інформаційні ресурси України, моніторинг згадувань об’єктів, подій у мережі Інтернет. Експертне оцінювання характеристик інформаційно-пошукових систем мережі Інтернет. Організаційне середовище та структура інформаційних потоків організації.

    курс лекций [936,5 K], добавлен 12.11.2010

  • Принципи та особливості роботи пошукових роботів. Аналіз відмінностей каталогів від пошукових систем. Шляхи та параметри оцінювання обсягів індексації сучасних пошукових систем. Загальні рекомендації щодо додавання сайту до пошукової системи чи каталогу.

    реферат [101,3 K], добавлен 18.11.2010

  • Сутність інформаційних технологій та їх основні компоненти. Роль глобальної мережі Інтернет у функціонуванні підприємства туристичної галузі, значення інформаційно-пошукових систем. Основні принципи та етапи роботи програми Microsoft Office PowerPoint.

    курсовая работа [1,7 M], добавлен 09.12.2011

  • Використання автоматичних систем інформаційного пошуку для зменшення "інформаційного перевантаження". Методи організації пошуку: атрибутивний, повнотекстовий і вибірка видань. Тематичні каталоги та пошукові машини. Системи Yandex, Rambler та Google.

    реферат [333,0 K], добавлен 18.05.2011

  • Копіювання або переміщення файлів через буфер обміну або за допомогою правої кнопки миші. Копіювання та переміщення файлів методом перетаскування. Пошукові мережеві системи. Організація пошуку інформації в мережі Iнтернет. Класифікація пошукових систем.

    контрольная работа [855,1 K], добавлен 29.01.2010

  • Інформаційно-вимірювальні системи й імовірнісний підхід. Просторово-часове трактування реальних умов роботи радіосистем. Управління системою обробки та зондувальним сигналом. Задачі, розв'язувані оптимальним оператором інформаційно-вимірювальної системи.

    реферат [121,2 K], добавлен 24.06.2011

  • Характеристика інфологічної та даталогічної моделі бази даних. Поняття та класифікація управлінських інформаційних систем. Інформаційні системи управління технологічними процесами. Інтелектуальні інформаційно-пошукові системи, штучний інтелект.

    контрольная работа [11,9 K], добавлен 29.10.2009

  • Методи результативного пошуку інформації в Інтернеті. Уявлення про пошукові служби, їх призначення та структура. Основні типи пошукових служб: пошукові каталоги, рейтингові системи, індексні бази даних. Спрямованість тематики і широта охоплення ресурсів.

    реферат [33,5 K], добавлен 23.04.2010

  • Специфіка діяльності іноземних спецслужб на сучасному етапі. Аналіз систем контент-моніторингу соціальних ресурсів мережі Інтернет з метою розвідки та інформаційного протиборства. Оцінка впливу віртуальних спільнот на свідомість та підсвідомість людини.

    статья [23,3 K], добавлен 06.09.2017

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.