|
|
 |
Розкрутка
Просування сайту у Інтернеті.
Зростання рейтингу. Залучення відвідувачів.
Як працюють пошукові системи
Основні елементи на яких
базується алгоритм роботи пошукових систем і базові принципи пошуку в
Інтернеті |

Абсолютно
всі пошукові системи інтернет мережі – а їх налічується кілька десятків!
- містять основні три складові – це власне пошукова машина, індексатор
та web spider. Найцікавішим елементом є,
безумовно, web spider (в перекладі – веб-павук).
Це програма, з допомогою якої сторінки з готовими
URL завантажуються у задану
базу даних, тоді архівуються та раз на добу «запаковуються» у сховище.
Один робот тримає під контролем кілька машин, кожна з яких активно
виконує виключно своє завдання. Кілька машин водночас – це дуже зручно,
тому що одна машина, наприклад, може завантажувати ті сторінки, які ще
взагалі не відомі для пошукової системи, а паралельно на іншій машині -
сторінки, завантажені вже до року часу. При одночасній роботі машин
використовується одне і те ж
сховище. Звичайно, таку роботу можна
оптимізувати – розбити
URL
на кілька частин і поручивши кожній машині конкретну ділянку роботи.
Найцікавіше те, що при збільшенні навантаження на web spider
автоматично збільшується кількість машин, тобто нагрузка на кожну
конкретну одиницю залишається сталою. Всі дані, які збирає Веб-павук,
акумулюються в індексній базі. Ось тут вже починається робота
індексатора – програми, котра опрацьовує сторінки, завантажені веб
спайдером. Основне завдання цієї програми – розпізнати всі документи та
виокремити необхідні слова. Вилучені слова поміщаються в конкретну базу
даних, тобто індекс. Величезні об'єми інформації заради економії місця
зберігаються у стислому виді, а у сховищі вона ще й поділяється на
декілька частин. Поділ здійснено для оптимальної роботи машин у сховищі,
де працює програма індексатор. Робота здійснюється не хаотично, а
впорядковано – як тільки-но машина завершує опрацювання однієї частини
інформації, вона звертається по іншу. Тому прискорити процес можливо
тільки одним способом – збільшити кількість машин. Отже, і робота
спайдера, і індексатора базується на стабільності нагрузки, що припадає
на робочу одиницю, і збільшити ефективність роботи можна лише за рахунок
розширення, а не внаслідок посилення інтенсивності. Результатом роботи
індексатора є формування великої кількості невеликих індексних
інформаційних баз, кожна з яких відповідає за певну частину інформації
всесвітньої мережі. Після обробки всіх результатів починається їх
об'єднання в одне ціле, та процедура проходить досить швидко і не
потребує ніяких зайвих індексованих модифікацій. Крім упорядкування,
об'єднання баз даних виконує ще одну додаткову функцію – автоматичне
виявлення помилок на найбільш ранньому етапі роботи.
|
Використання матеріалів дозволено з посиланням на джерело
сайт
Розкрутка |
|
|