Как поисковые системы изучают сайт?
Поисковые роботы, появляясь на сайтах, не видят их так, как видят люди, - хотя слыша выражения "оптимизированная вёрстка" или "оптимизированные изображения". Кстати, оптимизированные изображения - это хороший пример. Когда мы забиваем в поиск "фото лошади", мы получаем фото лошади, хотя до сих пор ни одна из поисковых систем не научилась качественно распознавать содержание изображения - а ищет оно его только по тэгам. Вот как робот видит главную страницу сайта Raskrutka.by:
Здесь прописаны мета-тэги, команды, CSS, которые являются "переводчиками" с человечьего на поисковый язык.
По названию html версии робот понимает, на каком языке написан сайт.
По мета-тэгам он определяет:
- адрес сайта (на аудиторию какого региона рассчитан сайт);
- тематику сайта (по ключевым словам);
- "визитку" сайта (тэг описания).
Робот проходит своего рода face-control - файл robots.txt, указывающий запрещённых роботов и запрещенные для индексации зоны (например, страницы с e-mail ваших пользователей или другую конфиденциальную информаицю. Кроме этого, некоторых роботов не пускают на сайт, т.к. они создают дополнительные нагрузки, не принося собой пользы).
Роботы путешествуют по своему "путеводителю" - site-map, которая обязательно должна быть на каждом сайте, так как робот не может переходить по ссылкам, оформленным, скажем, в качестве выпадающего меню на java, или может (Google Bot), но плохо.
Роботы определяют содержание текстов - насколько оно соответствует запросам пользователей, насколько часто встречаются там те или иные слова - естественно это или нет, ищут ссылки и т.д. Определяют, какие изображения есть на сайте - также по описаниям и заголовкам.
Поэтому оптимизация сайта - это способ общения с поисковыми роботами, которая позволяет им определить, что этот сайт можно предложить людям.
_____
Если Вы заметили неточность или хотите дополнить эту статью, пожалуйста, напишите по адресу editor@raskrutka.by
Для добавления комментария надо зарегистрироваться и авторизоваться.
Добавить комментарий можно после авторизации через Loginza.








