Ключові слова і вирази, які використовуються для пошуку в Інтернеті документів з питань авторського права на Україні і ЄС
Особливості здійснення пошуку в мережі Інтернет. Перелік виразів, які використовуються для пошуку в Інтернеті з питань авторського права на Україні. Визначення складових пошукових систем. Особливості використання української пошукової системи "Мета".
Рубрика | Программирование, компьютеры и кибернетика |
Вид | контрольная работа |
Язык | украинский |
Дата добавления | 02.05.2019 |
Размер файла | 119,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Ключові слова і вирази, які використовуються для пошуку в Інтернеті документів з питань авторського права на Україні і ЄС
План
пошуковий система інтернет авторський
Вступ
1. Як здійснити пошук у мережі Інтернет
2. Ключові слова, які використовуються для пошуку в Інтернеті з питань авторського права на Україні
3. Перелік виразів, які використовуються для пошуку в Інтернеті з питань авторського права на Україні
4. Ключові слова, які використовуються для пошуку в Інтернеті з питань авторського права в ЕС
5. Складові пошукових систем
6. Українська пошукова система «Мета»
7. Зарубіжні пошукові системи
8. Російські пошукові системи
Висновок
1. Як здійснити пошук у мережі Інтернет
Багато користувачів інтернету недооцінюють його можливості. Є такий вислів "В інтернеті можна знайти все і навіть більше", але щоб повністю оцінити всі можливості пошуку, треба правильно його здійснювати. 90% вдалого пошуку залежать від правильно зіставленого запиту. Як його зробити, я спробую пояснити на прикладі однієї з популярних пошукових систем Google. Для початку трохи історії. Google - це спотворений напис англійського слова "googol", вигаданого Мілтоном Сіроттою, племінником американського математика Едварда Кайзера, для позначення числа, що складається з одиниці і ста нулів. Зараз ім'я Google носить лідер пошукових машин Інтернета, розроблений Google Inc.Google, займає більше 70% світового ринку, а це свідчить про те, що сім із десяти людей, що знаходяться в мережі, звертаються до його сторінки в пошуках інформації в Інтернеті. Зараз щодня реєструє біля 50 млн. пошукових запитів і індексує більше 8 мільярдів веб-сторінок. Google може знаходити інформацію 101 мовою, у тому числі українською.Він використовує інтелектуальну техніку аналізу текстів, яка дозволяє шукати важливі і разом з тим релевантні сторінки за Вашим запитом. Для цього Google аналізує не тільки саму сторінку, яка відповідає запиту, а й сторінки, які посилаються на неї, щоб визначити цінність цієї сторінки щодо мети вашого запиту. Крім того, Google передусім подає адреси тих сторінок, на яких ключові слова, введені Вами, розташовані недалеко одне від одного.Інтерфейс Google містить досить складну мову запитів, яка дозволяє обмежити пошук окремими доменами, мовами, типами файлів і т.д. Використання деяких операторів мови дозволяє зробити процес пошуку необхідної інформації більш гнучким і точним. Розглянемо деякі з них:
Логічне "І" (AND):
За умовчанням при написанні слів запиту через space (пропуск) Google шукає документи, які містять всі слова запиту. Це і відповідає оператору AND. Тобто пропуск і є оператором AND.
Наприклад:
Кішки собаки папуги зебри
Кішки AND собаки AND папуги AND зебри
(Обидва запити однакові)
Логічне "АБО" (OR):
Пишуть за допомогою оператора OR. Зверніть увагу, що оператор OR повинен бути написаним великими літерами. Відносно нещодавно з'явилась можливість написання логічного "АБО" у вигляді вертикальної риски ( | ), подібно до того як це робиться у Яндексі (найпопулярніша російська пошукова система). Використовується для пошуку з декількома варіантами необхідної інформації.
Наприклад:
тексти наукові OR публіцистичні
тексти наукові | публіцистичні
(обидва запити однакові)
Необхідно запам'ятати, що запити в Google не чутливі до регістру! Тобто запити Острів Гренландія і острів гренландія будуть абсолютно однаковими.
Оператор "Плюс" (+):
Трапляються ситуації, коли треба примусово включити в текст яке-небудь слово, яке може мати варіанти написання. Для цього використовується оператор "+" перед обов'язковим словом. Припустимо, якщо запит має вигляд Один будинку (може, удома?) I, у результаті запиту з'явиться непотрібна інформація про "Один удома II", "Один удома III" і зовсім небагато про "Один удома I". Якщо ж у нас запит вигляду Один удома +I, одержимо інформацію тільки про фільм "Один удома I".
Наприклад:
Газета +Заря
Рівняння Бернуллі +математика
Виключення слів із запиту. Логічне «НЕ» (-):
Як відомо, інформаційне сміття часто зустрічається при складанні запиту. Щоб його видалити, стандартно використовуються оператори виключення - логічне «НЕ». У Google такий оператор представлений знаком «мінус». Використовуючи цей оператор, можна виключати з результатів пошуку ті сторінки, які містять в тексті певні слова. Використовується, як і оператор "+", перед словом, що виключається.
Наприклад:
Журавель колодязь -птиця
Мертві душі -роман
Пошук точної фрази (""):
Шукати точну фразу на практиці потрібно або для пошуку тексту певного твору, або для пошуку певних продуктів або компаній, в яких назву або частину опису є словосполучення, що стабільно повторюється. Для того, щоб вдало виконати таке завдання за допомогою Гугла, потрібно взяти запит у лапки (мається на увазі розділовий знак - подвійні лапки, які застосовуються, наприклад, для виділення прямої мови).
Наприклад:
Твір "Тихий Дон"
"На дворе было холодно, хотя это и не мешало Борису осуществить запланированное"
До речі, Google дозволяє вводити в сторку запиту не більше 32 слів!
Усічення слова (*):
Іноді потрібно шукати інформацію про словосполучення слів, в якому невідомі одне або декілька слів. Для такої мети замість невідомих слів використовується оператор "*". Тобто "*" - будь-яке слово або група слів.
Наприклад:
Майстер і *
Леонардо * Вінчи
Оператор cache:
Пошукова машина зберігає версію тексту, яка проіндексована пошуковим павуком, в спеціальному сховищі у форматі, званому кешем. Кешировану версію сторінки можна витягнути, якщо оригінальна сторінка недоступна (наприклад, не працює сервер, на якому вона зберігається). Кеширована сторінка показується в тому вигляді, в якому вона зберігається в базі даних пошукової машини і супроводжується написом нагорі сторінки про те, що це сторінка з кеша. Там же міститься інформація про час створення кешированої версії. На сторінці з кеша ключові слова запиту підсвічуються, причому кожне слово для зручності користувача підсвічується своїм кольором. Можна створити запит, який відразу видаватиме кешировану версію сторінки з певною адресою: cache:адрес_страницы, де замість "адрес_страницы" - адреса збереженої в кеші сторінки. Якщо потрібно знайти в кеш-сторінці певну інформацію, треба після адреси сторінки через пропуск написати запит цієї інформації.
Наприклад:
cache:www.bsd.com
cache:www.knights.ru турніри
Треба пам'ятати, що пропуску між ":" і адресою сторінки бути не повинно!
Оператор filetype:
Як відомо, Google індексує не тільки html сторінки. Якщо, наприклад, знадобилося знайти яку-небудь інформацію у відмінному від html типі файлу, можна скористатися оператором filetype, який дозволяє шукати інформацію в певному типі файлів (html, pdf, doc, rtf...).
Наприклад:
Специфікація html filetype:pdf
Твори filetype:rtf
Оператор info:
Оператор info дозволяє побачити інформацію, яка відома Google про відповідну сторінку.
Наприклад:
info:www.wiches.ru
info:www.food.healthy.com
Оператор site:
Цей оператор обмежує пошук конкретним доменом або сайтом. Тобто, якщо зробити запит: маркетинг розвідка site:www.acfor-tc.ru, то результати будуть отримані із сторінок, що містять слова "маркетинг" і "розвідка" саме на сайті "Acfor-tc.ru", а не в інших частинах Інтернету.
Наприклад:
Музика site:www.music.su
Книги site:ru
Оператор link:
Цей оператор дозволяє побачити адреси всіх сайтів, які посилаються на сторінку, щодо якої зроблено запит. Так, запит link:www.google.com видасть сторінки, в яких є посилання на google.com.
Наприклад:
link:www.ozone.com
Друзі link:www.happylife.ru
Оператор allintitle:
Якщо запит почати з оператора allintitle, що перекладається як "все в заголовку", то Google видасть тексти, в яких всі слова запиту містяться в заголовках (всередині тега TITLE в HTML).
Наприклад:
allintitle:Безкоштовний софтвер
allintitle:Скачати музичні альбоми
Оператор intitle:
Показує сторінки, в яких тільки те слово, яке стоїть безпосередньо після оператора intitle, міститься в заголовку, а решта всіх слів запиту може бути в будь-якому місці тексту. Якщо поставити оператор intitle перед кожним словом запиту, це буде еквівалентно використанню оператора allintitle.
Наприклад:
Програми intitle:Скачати
intitle:Безкоштовно intitle:скачати софтвер
Оператор allinurl:
Якщо запит починається з оператора allinurl, то пошук обмежений тими документами, в яких всі слова запиту містяться тільки в адресі сторінки, тобто в url.
Наприклад:
allinurl:rus games
allinurl:books fantasy
Оператор inurl:
Слово, яке розташовано безпосередньо перед оператором inurl (без пробілу між ними), буде знайдено тільки в адресі сторінки Інтернету, а решта слів - в будь-якому місці такої сторінки.
Наприклад:
inurl:books скачати
inurl:games crack
Оператор related:
Цей оператор описує сторінки, які "схожі" на якусь конкретну сторінку. Так, запит related:www.google.com видасть сторінки з схожою з Google тематикою.
Наприклад:
related:www.ozone.com
related:www.nnm.ru
Оператор define:
Цей оператор виконує роль своєрідного тлумачного словника, що дозволяє швидко отримати визначення того слова, яке введене після оператора.
Наприклад:
define:Кенгуру
define:Материнська плата
Оператор пошуку синонімів (~):
Якщо ви хочете знайти тексти, що містять не тільки ваші ключові слова, але і їх синоніми, то можна скористатися оператором "~" перед словом, до якого необхідно знайти синоніми.
Наприклад:
Види ~метаморфоз
~Об'єктне орієнтування
Оператор діапазону (..):
Для тих, кому доводиться працювати з цифрами, Google дав можливість шукати діапазони між числами. Для того, щоб знайти всі сторінки, що містять числа в якомусь діапазоні «від, - до», треба між цими крайніми значеннями поставити дві крапки (..), тобто, оператор діапозону.
Наприклад:
Купити книгу $100..$150
Чисельність населення 1913..1935
Ось всі відомі нам оператори мови запитів в Google. Сподіваюся, вони хоч якось полегшать процес пошуку потрібної Вам інформації. В усякому разі,ми ними користуюся дуже часто і можемо з упевненістю сказати, що при їх використанні витрачаэмо на пошук значно менше часу.
Використання названих операторів можливе у багатьох інших пошукових системах.
2. Ключові слова, які використовуються для пошуку в Інтернет з питань авторського права на Україні
Весь успіх просування сайту в пошукових системах цілком і повністю залежить від правильного підбору ключових слів. Проте багато хто до цих пір не здогадується, що ж таке «ключові слова»? Ключові слова: це слова, по яких ви хочете, щоб знайшли ваш сайт в мережі через пошукові системи.
Ключове слово, яке використовуються для пошуку в Інтернет з питань авторського права на Україні
Ключові Слова |
Пошукова машина |
Сайт(інформація) |
|
Авторське |
|
http://zakon.rada.gov.ua/cgi-bin/laws/main.cgi?nreg=3792-12 |
3. Перелік виразів, які використовуються для пошуку в Інтернеті з питань авторського права на Україні
У відмінності від ключових слів, ключові вирази мають на увазі два і більше слів, з яких користувачі конструюють запит, наприклад, «автомобілі» - це ключове слово, а «вантажні автомобілі» - ключова фраза.
Вирази |
Пошукова машина |
Сайт (інформація) |
|
Авторське право і суміжні права. |
|
http://zakon.rada.gov.ua/cgi-bin/laws/main.cgi?nreg=3792-12 |
|
Авторське право в інтернеті. |
|
http://www.vlasnasprava.info/ua/interview?page=interview&id=30 |
|
Авторське право в Україні. |
Yandex |
http://www.madeinua.info/view.aspx?type=ja&lang=1&jaid=619 |
|
Авторське право в журналістиці. |
Yandex |
http://www.yurradnik.com.ua/stride/ur/index.php?m=archive&y=2008&mag=29&art=599 |
4. Ключові слова, які використовуються для пошуку в Інтернеті інформації з питань авторського права в ЕС
Ключові Слова |
Пошукова машина |
Сайт(інформація) |
|
Copyright Law |
Yandex |
http://en.wikipedia.org/wiki/Copyright_Directive |
Сучасний інтернет представляє унікальне безмежне сховище знань, де можна отримати відповідь практично на будь-яке питання. Фактично, тут зібрано все краще, що винайдено і створено людством як за всю його довгу історію, а також новинки, що з'явилися щойно.
Проте поява такої величезної і обширної бібліотеки не може не привести до перевантаженості інформаційного простору. Фахівці по-різному оцінюють розміри Інтернету, проте в більшості сходяться на думці, що зараз тут знаходяться мільярди сторінок, причому велика частина їх зникає або оновлюється протягом нетривалого періоду часу. Чи існує яка-небудь можливість орієнтуватися в цьому практично нескінченному невичерпному швидкозмінному потоці інформації?
Частково цю проблему вирішують спеціальні інформаційно-пошукові системи, які вміють самостійно збирати інформацію. Якщо розумно використати пошукову систему, можна на протязі достатньо короткого часу знайти інформацію, на пошук якої без використання Інтернет можна витратити місяці і навіть роки. Але, практика доводить, що ефективно і правильно використовувати пошукові системи вміють не більше 3% чоловік і в результаті на запит з 1-2 слів отримують абсолютно даремну для себе інформацію.
5. Складові пошукових систем
Пошукові cистеми зазвичай мають три компоненти:
· агент (павук, кроулер або робот), який переміщується по мережі і збирає інформацію;
· база даних, яка містить інформацію, що зібрана павуками;
· пошуковий механізм, який користувачі використовують як інтерфейс для взаємодії з базою даних.
Засоби пошуку типу агентів, павуків, кроулерів і роботів використовуються для збору інформації про документи, які знаходяться в мережі Інтернет. Це спеціальні програми, які займаються пошуком сторінок в мережі, збирають гіпертекстові посилання з цих сторінок і автоматично індексують інформацію, яку вони знаходять для побудови бази даних. Кожний пошуковий механізм має власний набір правил, якими визначається збір документів.
· Агенти є найінтелектуальнішими з пошукових засобів. Вони можуть робити більше, ніж просто шукати: вони можуть виконувати транзакції від імені користувача. Вже зараз вони можуть шукати сайти специфічної тематики і повертати списки сайтів, відсортованих за їх відвідуваністю. Агенти можуть обробляти вміст документів, знаходити та індексувати інші види ресурсів, не лише сторінки. Вони можуть бути запрограмовані для витягання інформації з вже існуючих баз даних. Незалежно від інформації, яку агенти індексують, вони передають її назад до бази даних пошукового механізму.
· Павуки здійснюють загальний пошук інформації в Інтернет. Павуки повідомляють про зміст знайденого документа, індексують його і добувають підсумкову інформацію. Вони також переглядають заголовки, деякі посилання і відправляють проіндексовану інформацію до бази даних пошукового механізму.
· Кроулери переглядають заголовки і повертають тільки перше посилання.
· Роботи можуть бути запрограмовані таким чином, щоб переходити по різним посиланням різної глибини вкладеності, виконувати індексацію і перевіряти посилання в документі. Але, вони можуть застрягати в циклах, адже, проходячи за посиланнями, їм потрібні значні ресурси мережі. Існують методи, що забороняють роботам пошук по сайтах, власники яких не бажають, щоби вони були проіндексовані.
Агенти збирають та індексують різні види інформації. Деякі, наприклад, індексують кожне окреме слово у документі, в той час як інші індексують тільки 100 найбільш важливих слів в кожному документі, індексують розмір документу і кількість слів в ньому, назву, заголовки і підзаголовки і так далі. Вигляд побудованого індексу визначає, який пошук може бути проведений пошуковим механізмом і як отримана інформація буде інтерпретована.
Агенти знаходять інформацію, після чого її розміщують в базі даних пошукового механізму. Адміністратори пошукових систем визначають, які сайти або типи сайтів агенти мають відвідати та проіндексувати. Проіндексована інформація відправляється до бази даних пошукового механізму.
Користувачі можуть розміщувати інформацію прямо в індексі, заповнюючи особливу форму для того розділу, в який вони хотіли б помістити свою інформацію. Ці дані передаються базі даних.
Коли користувач хоче знайти інформацію, доступну в Інтернет, він відвідує сторінку пошукової системи і заповнює форму, що деталізує потрібну йому інформацію. Тут можуть використовуватись ключові слова, дати та інші критерії. Критерії в формі пошуку повинні відповідати критеріям, які використовуються агентами при індексації інформації, яку вони знайшли при переміщені по мережі.
База даних відшукує предмет запиту, що базується на інформації, яка вказана в заповненій формі, і виводить відповідні документи, що підготовані базою даних. Для того, щоб визначити порядок, в якому перелік документів буде показано, база даних застосовує алгоритм ранжування. В ідеальному випадку, розташованими першими в списку будуть документи, що є найбільш релевантними до запиту користувача.
Релевантність - основне поняття при індексації документа в пошукових системах. Релевантність - міра відповідності, тобто це відповідність змісту знайденої сторінки до запиту користувача. Але комп'ютер - не людина, і тому пошукові системи використовують спеціальні алгоритми для визначення релевантности. Теоретичних методів визначення релевантності більш ніж 20. Але виділяють два основні напрями: лінгвістичне (Рамблер, Яндекс) і статистичне (Google).
Основні російські пошукові системи (зокрема Рамблер) використовують лінгвістичний напрям, тобто пошуковий робот, переглядаючи сторінку, звертає увагу на "літературність" її написання ("чом ти не прийшов" буде більш релевантною, ніж "чом ти не травень прийшов").
Різні пошукові системи використовують різні алгоритми ранжування, однак основними принципами визначення релевантності є наступні:
· Кількість слів запиту у текстовому вмісті документу (тобто в html-коді).
· Теги, в яких ці слова розташовуються.
· Місцеположення шуканих слів у документі.
· Питома вага слів, відносно яких визначається релевантність, у загальній кількості слів документу.
Ці принципи застосовуються всіма пошуковими системами. А наведені нижче використовуються деякими, але достатньо відомими (наприклад, AltaVista).
· Час - як довго сторінка знаходиться в базі пошукового сервера. Спочатку здається, що це недолугий принцип. Але в Інтернет існує багато сайтів, час життя яких складає близько місяця. Якщо ж сайт існує досить довго, це значить, що його власник є досвідченим за даною темою і користувачу більше підійде сайт, що існує вже кілька років, ніж той, який з'явився тиждень тому за цією ж темою.
· Індекс цитованості - як багато посилань на дану сторінку веде з інших сторінок, що зареєстровані у базі пошуковика.
База даних виводить ранжований таким чином перелік документів з HTML і повертає його користувачу, який зробив запит. Різні пошукові механізми вибирають різні способи показу отриманого переліку - деякі відображають лише посилання, інші виводять посилання з декількома першими реченнями документу або заголовок документу разом з посиланням. Коли користувач звертається до посилання на один з документів, цей документ завантажується з сервера, на якому він знаходиться.
Велика частина цільових відвідувачів приходить саме з пошукових систем. Тому важливо знати деякі особливості найбільш популярних з них.
6. Українська пошукова система «Мета»
Українська пошукова система "МЕТА" є найвідомішим проектом компанії - ЗАТ «МЕТА» - розробника пошукових і інформаційних рішень. Сьогодні "МЕТА" -- один з найбільш відвідуваних українцями сайтів і найбільший рекламний майданчик України.
«Мета.ua» - проект український, він створений і працюватиме тільки для України.
А технології, які були створені в процесі роботи, цілком можуть бути використані в інших країнах.
Пошукові технології компанії працюють у внутрішніх мережах Верховної Ради і кабінету міністрів України, на сайтах національного банку України, фонду Разумкова, сайті Віктора Ющенка.
За 2005 рік аудиторія збільшилася більш ніж в два рази.
«Мета» - це безкоштовний сервіс, який не має ніяких зобов'язань перед власниками сайтів і не гарантує «правильного» місця видачі.
Нові сервіси пошукової системи "МЕТА" можна поділити на три типи: пошукові, інформаційні і комунікаційні.
З пошукових сервісів хочеться відзначити «Метановини». Це найпопулярніший розділ після великого пошуку і каталогу. Зараз там збираються новини від більше як 200 українських інтернет-джерел, близько 10 000 новин в день. Весь цей масив в режимі реального часу індексується, групується по темах і стає доступним для пошуку.
«Пошук рефератів». Практично єдиний сервіс в СНД, що дозволяє шукати не тільки по назві і опису, але і по всьому тексту. В період сесій і іспитів студенти і школярі активно користуються цим сервісом.
З останніх пошукових проектів - інтерфейс до бази законодавства України, що розроблено спільно з апаратом Верховної Ради. У базі більш як 80 000 різних юридичних документів. Автоматичний переклад запитів дає можливість задавати запит на російській або українській мовах.
З інформаційних сервісів цікавими є «Карти» і «Розклади потягів». В «Картах» зібрано найбільшу кількість карт по містах і областях України, що є доступними в Інтернеті, а «Розклади» - є найповнішими та найточнішими.
Комунікаційні сервіси - форум, який став найбільшим українським неполітичним форумом. Поштовий сервіс розроблявся значно пізніше за тих, що є зараз на ринку, тому в ньому вдалося обійти відомі недоліки і він вийшов зручним і функціональним. Пошта зараз самий швидкозростаючий сервіс на «Мете».
Пошуковому сервісу доводиться збільшувати потужність одночасно в двох площинах - з одного боку збільшується кількість запитів, з іншої - зростає об'єм індексу. З схожими проблемами працює всього декілька компаній в світі, і тому на вирішення технічних проблем, пов'язаних з швидким зростанням витрачається багато зусиль. Впроваджено і відпрацьовано технологію, що дозволяє швидко масштабувати систему, Мета може без проблем збільшити розмір індексу і обробити число запитів на порядок більше.
З останніх вдосконалень - «перевірка» правопису в запитах і додавання нових форматів документів - doc, pdf, xls, ppt.
«Повільна індексація» - це вже легенда, яка залишилася у минулому. Черги на розміщення в каталог зараз немає, бо технічних потужностей вистачає. Якщо сайт через 4-5 днів після додавання в каталог не потрапив в індекс, це означає, що він є або недоступним, або не піддається індексації. Окрім цього є спеціальний кластер, документи в якому оновлюються двічі у день.
ПОРАДИ ЩОДО ПОШУКУ
Пошукова система "МЕТА" надає цілий ряд сервісних можливостей, які дозволяють вести більш прицільний пошук. Проте, пошукова система - тільки інструмент, і головний внесок в швидке отримання точних результатів робить користувач, коли формулює свій запит.
Нижче наведено перелік пошукових прийомів, які дозволять ефективніше організувати пошук і оперативно знайти те, що потрібне.
РОСІЙСЬКО-УКРАЇНСЬКІ ЗБІГИ
Однакове написання різних по сенсу слів (омонімія) при пошуку за ключовими словами може привести до появи в списку відповідей досить несподіваних результатів. Наприклад, по слову "лист" додатково до омонімії російської мови: "лист каштана" і "лист бумаги", при пошуку на Мете додається ще значення "лист -- письмо" з українського. Тобто крім омонімії в російському і українських мовах окремо, з'являється ще російсько-українська омонімія: приклад ружья -- приклад перекладу, свято перемоги -- свято верить, важкий стан -- прокатный стан, Влада народу -- позвать Влада і т.п.
Частково зняти подібну неоднозначність можна за допомогою оператора нормальної форми (поставити перед "підозрілим" словом в запиті знак оклику). Якщо ж використовувати пошук по фразі, омонімія мови практично не впливає на видачу результатів пошуку.
7. Опис зарубіжних пошукових систем
Більше як 80% всього пошуку в Інтернеті доводитися на 3 основні системи: Google, Yahoo!, MSN.
GOOGLE - http://www.google.com
З невеликої компанії, яка заснована у вересні 1998 року Ларрі Пейджем і Сергієм Бріном, Google перетворилася на найбільший галузевий концерн, що пропонує послуги простого і швидкого пошуку інформації в Інтернеті по більш ніж 8 млрд. мережних адрес, плюс множина інших, не менш цікавих сервісів. За ці роки багато що змінилося, але незмінною і зростаючою залишилася динаміка розвитку Google. Особливо вражає успішне і послідовне зростання компанії на тлі поголовного краху, що зачепів в минулі роки більшість дот-комів.
Нині феноменальний успіх Google пов'язують не лише з вибраною бізнес-моделлю і вдалим напрямом діяльності. Карколомний успіх компанії не був би досягнутий без тонкого підбору співробітників і вмілого керівництва. З серпня 2001 року на посту CEO компанії знаходиться Ерік Шмідт, якій перейшов в Google з Novell і поставив за головну мету збільшення капіталізації за рахунок виходу на нові ринки. Минулі роки підтвердили правильність вибраної стратегії і тепер Google є тим, чим є - близько 5 тисяч співробітників у всьому світі, бренд, що відомий без коментарів в будь-якому куточку земної кулі.
Бренд Google було введено як співзвуччя математичному терміну Googol (гугол), придуманому Мілтоном Сироттой, племінником американського математика Едварда Каснера. Він позначає одиницю з сотнею нулів і чудово ілюструє невичерпні можливості Інтернету, які компанія Google постійно систематизує і організовує, полегшуючи доступ до різних даних.
Спочатку була поставлена мета по організації всієї світової інформації, щоб зробити її максимально доступною і корисною для кожного відвідувача Інтернету. Для цього засновники компанії Леррі Пейдж і Сергій Брін розробили новий алгоритм пошуку. Ідея створення універсального пошуковика і стала запорукою нинішнього успіху компанії. Більш того, в нинішньому своєму втіленні пошуковий движок доступний не лише з головної сторінки Google: можна вести пошук через панель інструментів Google, через Google Deskbar в панелі завдань Windows без відкривання браузера, а також з різних мобільних платформ, включаючи телефони в режимах WAP та І-mode.
Оскільки пошуковик Google є безкоштовним, основний прибуток компанії складається з надання рекламодавцям можливості поширювати рекламу, що є релевантною до інформації на даній сторінці. Тисячі рекламодавців використовують програму Google AdWords для просування своїх товарів і послуг за допомогою цілеспрямованих оголошень, тисячі менеджерів сайтів використовують Google AdSense для показу оголошень, що є релевантними до змісту сайтів.
Від початку розробники Google відмовилися від типового використання потужностей декількох серверів, продуктивність яких зменшується при пікових навантаженнях, і почали використовувати можливості розподілених у мережі комп'ютерів.
Пошуковий движок Google проводить серії одночасних розрахунків тривалістю частки секунди і використовує технологію PageRank для вивчення всієї структури посилань Інтернету та об'єктивного визначення найважливіших сторінок шляхом розрахунку рівняння з більше як 500 змінними і 2 мільярдами термінів. Пошуковик Google аналізує якісний зміст сторінок - шрифти, підрозділи, точне місцеположення кожного слова, плюс зміст сусідніх сторінок для забезпечення максимальної релевантності результатів пошуку.
В компанії Google створено технологію пошуку для бездротових пристроїв з моментальним перетворенням HTML у формати для режимів WAP, І-mode, J-SKY і EZWeb.
Результатом багаторічного розвитку пошукової системи Google стала поява національних пошукових сервісів: підтримується різномовний інтерфейс і алгоритму пошуку адаптуються до локальних особливостей. Коли пошуковий сервіс Google стартував в Китаї, то, незважаючи на численні складнощі, пов'язані з своєрідним трактуванням свободи слова китайськими властями (Google.com не доступний китайським користувачам приблизно 10% часу; Google News зовсім не працює, Google Images доступний лише час від часу), сервіс працює і набирає популярність.
Google забезпечує пошук по гіпертекстових документах, що знаходяться в різних мовних зонах - українською, російською, англійською, німецькою і ін. Пошукова система Google має власні піддомени для більшості країн, наприклад, для України - google.com.ua, для Росії - google.ru. Це одна з найбільших пошукових баз в світі.
ПЕРЕВАГИ
· Використання механізму PageRank, який відображає "важливість" сайту і впливає на видачу результатів пошуку. PageRank схожий на індекс цитування у Яндекса (теж залежить від кількості і якості посилань на ресурс). Але на відміну від Яндекса, вплив PageRank у Google не настільки значний, тому люди в Google знаходять саме те, що і шукають.
· Google шукає не лише гіпертекстові файли (html), але і файли у форматі PDF, DOC, PostScript, Corel Word Perfect і ін.
· Пошукова система Google має можливість пошуку зображень. При цьому у запиті можна вказати бажаний розмір, глибину кольору, формат файлу.
· На відміну від багатьох пошуковиків, роботи Google індексують всі сторінки, а не лише найголовніші.
· Всі сторінки Google кешує (заносить в свою базу), і дозволяє користувачеві переглядати документ у кеші Google, не відкриваючи його в першоджерелі (що зазвичай є набагато швидше).
· Google дозволяє обрати мову інтерфейсу, мовні зони для пошуку, кількість повідомлень при видачі результатів та ін.
· Користувачі Microsoft Internet Explorer, Mozilla Firefox і Opera можуть встановити собі програму Google Toolbar, яка створює нову панель інструментів, що дозволяє шукати в Google, не заходивши на сам сайт.
· Рядок пошуку в Google можна використати і як калькулятор..
8. Опис росыйських пошукових систем
В Рунеті основними є пошукові системи Яndex, Rambler та Mail.ru На діаграмі представлена питома вага різних пошукових машин Рунету.
YANDEX.RU (Спрощено - http://ya.ru)
Yandex виконує пошук по словяномовній частині Інтернету з урахуванням морфології словянських мов. Маючи могутній механізм підбору сайтів під запити, ця пошукова машина допомагає знайти найбільш відповідні веб-сторінки. Яндекс щодня переглядає сотні тисяч веб-сторінок у пошуках змін або нових посилань, і їх база постійно зростає.
Слово "Яndex" означає "Мовний index", або, якщо по-англійськи, "Yandex" - "Yet Another indexer". За 10 роки публічного існування Яndex виникали і інші тлумачення. Наприклад, якщо в слові "Index" перекласти з англійського першу букву ("I" - "Я"), вийде "Яndex".
Офіційно пошукова машина Yandex.Ru була анонсована 23 вересня 1997 року на виставці Softool. Вже тоді пошуковик мав певні переваги - можливість перевірки документів на унікальність, облік морфології словянських мов, можливість пошуку з врахуванням відстані (наприклад, при пошуку точного словосполучення). Основною відмінною рисою Yandex є ретельно розроблений алгоритм оцінки відповідності відповіді запиту (релевантності), який враховує не лише кількість слів запиту, знайдених у тексті, але і "контрастність" слова (його відносну частоту для даного документа), відстань між словами, і положення слова в документі.
Згідно даних глобальної статистики Рунету, сьогодні більше 50% пошукового трафіку генерується саме цим пошуковиком (для порівняння, на долю Rambler'a доводиться близько 20%, і ще менше - на долю Google'a).
Реєстрація відбувається за адресою http://yandex.ru/addurl.html. В Яндекса достатньо швидкий пошуковий робот. Завдяки ньому реєстрована сторінка з'явиться в пошукових результатах протягом 2-4 годин. Але це лише первинна індексація. Після повної індексації, вона може зникнути з пошукових результатів, якщо пошуковий робот визнає її за спам. Тому положення web-сторінки в результатах пошуку потрібно відстежувати до тих пір, поки не пройде повна індексація. Перелік результатів може мінятися залежно від завантаженості серверів, оскільки база даних Яндекса має кластерну структуру і рознесена на декілька серверів.
Яндекс любить документи середніх розмірів, насичені текстом (статті і т.п.). Слід помірно повторювати ключові слова. Ключові слова можна писати в описі, але вага слів у цьому тегу є нижчою. Добре індексуються сторінки, що створено за допомогою скриптів.cgi,.php. Це стосується гостьових книг, форумів і т.п. Для індексації решти (окрім головної) сторінок сайту потрібно приблизно 2 тижні.
Хороших результатів дозволяють досягати ключові слова в мета-тегах, де слід зазначати слова, які зустрічаються в тексті сторінки. Мета-теги, використовуються також і для видачі опису сторінки в результатах пошуку. Це потрібно враховувати при його складанні, оскільки користувач по цьому приймає рішення відвідати вас, чи ні. Важливо розміщувати ключові слова і в тегу "title", заголовках (h1-h6), змісті сторінки, "ALT"-тегах.
Для визначення релевантности Яндекс використовує Зважений Індекс Цитування, який впливає на рейтинг в результатах пошуку. Звичайний Індекс Цитування використовується тільки при сортуванні сайтів в каталозі Яндекса.
RAMBLER.RU (Спрощений - http://www.r0.ru)
Цей пошуковик займає сьогодні друге місце серед пошуковиків Рунета. Він був першою пошуковою програмою, що створена спеціально для російського Інтернету програмістом компанії Stack Ltd Дмитром Крюком у 1996 році. Слово "Rambler" перекладається як «гуляща людина», «бродяга» по Інтернету.
Rambler постійно вдосконалює свій пошуковий алгоритм. Проводяться роботи по оптимізації роботи системи для точності та актуальності пошуку. Як і більшість російських пошукових машин, Rambler враховує морфологію російської мови. При видачі результатів вплив має положення сайту в рейтингу Rambler's Top100. Rambler індексує сайти в зонах ru.su,.ua,.by,.kz,.kg,.uz,.ge, а також славяномовні сайти в доменах.com,.net або.org.
На сьогодні Rambler є в величезним інтернет-холдингом, до складу якого входять портал Рамблер, інтернет-газета новин Лента.ру, медичний сайт Doctor.ru, онлайновий клуб батьків Mama.ru, картографічний сервіс NaKarte.ru, телекомунікаційний підрозділ "Рамблер Телеком".
На Рамблері реалізовано smart систему, яка виводить в результатах пошуку слова, які є синонімами запиту. Ще однією функцією системи є видача контекстної реклами не лише за конкретними ключовими словами, але і за фразами, що тісно пов'язані з ними.
Реєстрація знаходиться за адресою http://www.rambler.ru/doc/add_site_form.shtml. Не реєструються сайти в доменах.com,.net, або.org. Якщо ж зміст сайту з цих зон має відношення до російськомовного Інтернету, то користувач має відправити лист на search.support@rambler-co.ru з проханням проіндексувати сайт.
Рамблер (на відміну від інших пошукачів) вміє витягувати гіперпосилання з об'єктів Macromedia Flash. Якщо сайт має заставку або навігаційні панелі, що виконані в цій технології, Рамблер обробляє їх, знаходить адреси всіх сторінок сайту і індексує весь сайт. Тексти flash-об'єктів не індексуються. Для сайтів, які цілком складаються з flash-об'єктів, рекомендується створити HTML-копію і зареєструвати її в пошуковій машині. Роботи Рамблера також справляються з конструкціями фреймів.
Роботи Рамблера ігнорують більшість мета-тегів. Коментарі в документі роботи Рамблера теж не сканують, але більшої уваги звертають на заголовки і виділення в документі. Базові поняття і ключові слова доцільно включати в HTML-теги (у порядку значущості): "title", "h1"..."h4", "b", "strong", "u".
Максимальний розмір документа для роботів складає 200 кілобайт. Документи більшого розміру усікаються до вказаної величини.
ПРЕДСТАВЛЕННЯ ШУКАНОГО ДОКУМЕНТА ЯК ОБРАЗУ
Пошук можна істотно спростити, уявивши собі образ сторінки, що містить потрібну інформацію. Існують загальноприйняті правила, яких притримуються практично всі сторінки Інтернет. Основне і головне правило: заголовок кожної сторінки стисло і точно характеризує її вміст. Відшукати, наприклад, певну книгу в електронному вигляді дуже просто. Звичайно, можна спробувати її знайти, якщо задати в пошуковій системі прізвище автора і назву, але тоді витрачається багато часу на переглядання абсолютно непотрібних сторінок із згадкою даної книги або автора, але без її електронної копії.
На допомогу тут знов приходять розширені можливості пошуку, використовуючи які, можна відшукувати потрібну інформацію прямо в заголовках сторінок.
Простій приклад - потрібно знайти, книгу Паоло Коельо "Алхімік". Спершу складаємо образ потрібної сторінки - швидше за все, в її заголовку можуть знаходитися і прізвище автора, і назва твору. Далі потрібно з'ясувати, як включити розширені можливості пошуку по заголовку в пошуковій системі. Наприклад, в Яндекс для пошуку по заголовках потрібно використовувати конструкцію $title(), таким чином, запит може виглядати як: $title(коельо "алхімік"). Результат перевершує всі очікування - перші 7 посилань, які вивів Яндекс в результатах пошуку, містять потрібні дані.
Шукати так само можна не лише книги, а все, що завгодно. Ще один реальний приклад - потрібно знайти, скажімо, результат фіналу футбольного матчу кубка Іспанії між Реалом і Депортіво. Для того, щоб переконатися в правильності вищевикладених принципів, цього разу використаємо іншу пошукову систему, популярну Google. Для пошуку по заголовках в неї використовується інша конструкція - allintitle. Створюємо образ потрібної сторінки - вірогідно, в заголовку новини повинна бути присутньою фраза "кубок Іспанії" і назви команд, що беруть участь, наприклад, мадридський Реал в кубку Іспанії. В даному випадку запит може виглядати приблизно так: allintitle: реал "кубок испанії". Якщо задати щось подібне до allintitle: Реал Депортіво "кубок Іспанії" і пошукова система повідомить, що сторінок, які б задовольняли цьому запиту, немає, оператор allintitle можна не застосовувати і пошукати у всьому тексті: Реал Депортіво "кубок Іспанії". Результат в обох випадках вражає - знайдена одна і та ж потрібна сторінка.
Але не лише заголовки корисні при пошуку потрібної інформації. Велику допомогу надає і текст посилань. Будь-який сайт містить певні посилання, які ведуть на його сторінки або сторінки інших сайтів. Кожне таке посилання має власний опис, по значенню сумірне, а часто і більш інформативне, ніж заголовок самої сторінки, на яку вона веде. Адже і в текстах посилань теж можна шукати, та ще як!
Отже, що ж надає текст в посиланнях? Наприклад, потрібно знайти в Інтернеті певний файл, наприклад, викачати останню версію універсального музичного програвача winamp. Створимо образ сторінки. Оскільки програма ця відома, то, ймовірно, існує багато сайтів, на яких є посилання на сторінку, де можна викачати останню версію winamp. Якщо спробувати пошукати в тексті цих посилань, швидше за все одною з перших в результатах пошуку з'явиться потрібна сторінка, оскільки решта всіх посилань веде саме до неї. Для пошуку в описах посилань в Google використовується оператор allinanchor, отже, запит можна сформулювати приблизно так: allinanchor: winamp download. Для того, щоб упевнитися у вірності приведеного, можна замість winamp поставити іншу програму - якщо в Мережі на неї є хоч одне посилання, система виведе її першою.
Висновок
Авторське право (скор: АП) -- набір виключних прав, які дозволяють авторам отримати соціальні блага від результатів своєї творчої діяльності. АП історично виникло внаслідок потреби захистити права авторів літературних творів та творів мистецтва; нині АП поширюється фактично на будь-які результати творчої діяльності, включаючи комп'ютерні програми, інтернет публікації, бази даних, фільми, фотографії і скульптури, архітектурні проекти, рекламні проспекти, карти і технічні креслення.
Авторське право є ключовою галуззю права інтелектуальної власності; воно призначене захищати лише зовнішню форму вираження об'єкту (твір, малюнок, збірник, фотографія та інше), тобто їх «матеріальне втілення».
Авторське право не може використовуватись для захисту абстрактних ідей, концепцій, фактів, стилів та технік, що можуть бути використані у творі. Іншими словами, якщо ви придумали новий та зручний спосіб або новий склад розчину і видали брошури, у якій було описано ці способи -- то авторське право захищатиме лише текст брошур, а не винайдені вами способи та речовину.
Авторське права в Інтернет нова галузь права, яка має багато недоліків і потребує подальшого розвитку і вдосконалення.
Размещено на Allbest.ru
Подобные документы
Технологія пошуку інформації в мережі Інтернет. Можливості спеціальних служб, індексів. Інформаційні ресурси у каталогах. Системи мета-пошуку, пошуку в конференціях Usenet, пошуку людей. Знаходження інформації із застосуванням серверів глобального пошуку.
реферат [38,8 K], добавлен 20.05.2011Проблема порушення авторських прав в Інтернеті. Системи та сервіси пошуку плагіату. Захист електронних видань від плагіату в Інтернеті. Алгоритми аналізу, подання і порівняння текстової інформації. Вибір методу пошуку текстових документів з запозиченнями.
магистерская работа [1,0 M], добавлен 14.06.2013Аналіз властивостей безкоштовних пошукових та поштових серверів Інтернету. Огляд методики ранжирування результатів пошуку в інформаційно-пошукових системах бібліотек. Вивчення можливостей пошукової системи "Мета", пошуку по реєстру українських сайтів.
курсовая работа [142,9 K], добавлен 17.11.2011Методи результативного пошуку інформації в Інтернеті. Уявлення про пошукові служби, їх призначення та структура. Основні типи пошукових служб: пошукові каталоги, рейтингові системи, індексні бази даних. Спрямованість тематики і широта охоплення ресурсів.
реферат [33,5 K], добавлен 23.04.2010Дослідження можливостей пошуку в Google за тематикою. Використання можливості розширеного тематичного пошуку для підвищення релевантності пошуку за встановленим завданням. Розширений пошук зображень. Особливості пошуку щодо країн та наукових знань.
контрольная работа [4,6 M], добавлен 03.02.2014Використання автоматичних систем інформаційного пошуку для зменшення "інформаційного перевантаження". Методи організації пошуку: атрибутивний, повнотекстовий і вибірка видань. Тематичні каталоги та пошукові машини. Системи Yandex, Rambler та Google.
реферат [333,0 K], добавлен 18.05.2011Історія розвитку і створення Інтернет. Протоколи передачі даних. Способи організації пошуку інформації Інтернет. Пошукові системи та сервіси: Яндекс, Google, шукалка. Послідовність виконання пошуку необхідної інормації за допомогою браузера Mozilla.
дипломная работа [4,9 M], добавлен 22.07.2015Принципові рішення, що покладені в основу концепції створення єдиних реєстрів. Критерії для відбору стратегії пошуку правової інформації в Інтернеті. Модель ділового процесу, її використання у Workflow-системах. Організаційне забезпечення ІС ОВС України.
контрольная работа [23,3 K], добавлен 20.07.2011Особливості та методика пошуку інформації та об’єктів у зовнішній пам’яті комп’ютера, в мережі або операційній системі Windows. Специфіка використання автономної й онлайнової довідки операційної системи. Параметри пошуку в прихованих або системних папках.
конспект урока [885,7 K], добавлен 03.01.2010Принципи та особливості роботи пошукових роботів. Аналіз відмінностей каталогів від пошукових систем. Шляхи та параметри оцінювання обсягів індексації сучасних пошукових систем. Загальні рекомендації щодо додавання сайту до пошукової системи чи каталогу.
реферат [101,3 K], добавлен 18.11.2010