Googlebot - руководство по поиску Google

  1. Что такое Googlebot? Googlebot - это веб-сканер, используемый Google. Он используется Google для...
  2. Разница между роботом Google и индексом Google
  3. Гарантируя, что робот Google может видеть ваши страницы
  4. 1. Может ли робот Google "видеть" мои страницы?
  5. 2. Может ли робот Googlebot получить доступ ко всему моему контенту и ссылкам полностью?
  6. Как робот Google видит веб-страницу
  7. 3. Может ли робот Google получить доступ ко всем ресурсам моей страницы?
  8. Могу ли я контролировать Googlebot?
  9. Что такое файл robots.txt?
  10. Sitemaps и Googlebot
  11. Googlebot и консоль поиска Google
  12. Сколько существует роботов Googlebots / Google?
  13. Что такое пользовательский агент Googlebot?
  14. Googlebot и языки / локации
  15. Сканирование с учетом локали Googlebot
  16. Поиск официальных страниц справки Google

Что такое Googlebot?
  • Googlebot - это веб-сканер, используемый Google.
  • Он используется Google для поиска и извлечения веб-страниц.
  • Информация, собранная Googlebot, используется для обновления индекса Google.

Робот Googlebot посещает миллиарды веб-страниц и постоянно посещает страницы по всему Интернету.

Что такое веб-сканер?

  • Сканеры (также известные как боты, роботы или пауки) представляют собой тип программного обеспечения, предназначенного для перехода по ссылкам, сбора информации и последующей отправки этой информации куда-либо.

Что делает робот Googlebot?

  • Робот Googlebot извлекает содержимое веб-страниц (слова, код и ресурсы, из которых состоит веб-страница).
  • Если содержимое, которое он получает, имеет ссылки на другие вещи, это отмечается.
  • Затем он отправляет информацию в Google.

Googlebot и ваш сайт

Информация, которую робот Google отправляет обратно на компьютеры Google, обновляет индекс Google.

Индекс Google - это место, где веб-страницы сравниваются и ранжируются.

  • Чтобы ваши веб-страницы можно было найти в Google, они должны быть видны Googlebot.
  • Чтобы ваши веб-страницы имели оптимальное ранжирование, все ресурсы веб-страниц должны быть доступны роботу Googlebot.

Разница между роботом Google и индексом Google

Googlebot

  • Робот Googlebot извлекает контент из Интернета.
  • Робот Google в любом случае не оценивает контент, а только извлекает его.
  • Единственное, что беспокоит робота Google: «Могу ли я получить доступ к этому контенту?» и "Есть ли еще контент, к которому я могу получить доступ?"

Индекс Google

  • Индекс Google берет контент, который он получает от Googlebot, и использует его для ранжирования страниц.

Первый шаг в рейтинге Google должен быть найден роботом Googlebot.

Гарантируя, что робот Google может видеть ваши страницы

Поскольку Googlebot - это способ, которым Google обновляет свой индекс, очень важно, чтобы Googlebot мог видеть ваши страницы.

Фундаментальные первые вопросы, которые должен задать веб-мастер:

  1. Может ли робот Google "видеть" мои страницы?
  2. Может ли робот Googlebot получить доступ ко всему моему контенту и ссылкам полностью?
  3. Может ли робот Google получить доступ ко всем ресурсам моей страницы?

Давайте посмотрим на каждого из них ближе ...

1. Может ли робот Google "видеть" мои страницы?

Чтобы получить представление о том, что Google видит на вашем сайте, выполните следующий поиск Google ...

Поместив "site:" напротив имени вашего домена, вы будете запрашивать у Google список страниц, проиндексированных Google для вашего сайта.

Подсказка: убедитесь, что между "site:" и именем вашего домена нет пробела. Вот пример использования этого сайта ...

Если вы видите меньше ожидаемого количества страниц, скорее всего, вам нужно убедиться, что вы не блокируете робот Googlebot своим файл robots.txt (файл robots.txt обсуждается далее на этой странице).

2. Может ли робот Googlebot получить доступ ко всему моему контенту и ссылкам полностью?

Следующий шаг - убедиться, что Google правильно видит ваш контент и ссылки.

То, что робот Google может видеть ваши страницы, не означает, что у Google есть идеальное представление о том, что это за страницы.

Робот Google не видит сайт так же, как люди. На изображении выше есть веб-страница с одним изображением. Люди могут видеть изображение, но робот Google видит только код, вызывающий это изображение.

Робот Google может иметь доступ к этой веб-странице (html-файл), но не может получить доступ к изображению, найденному на этой веб-странице, по различным причинам.

В этом случае индекс Google не будет включать это изображение, а это означает, что Google имеет неполное понимание вашей веб-страницы.

Как робот Google видит веб-страницу

Робот Google не видит полные веб-страницы, он видит только отдельные компоненты этой страницы.

Робот Google не видит полные веб-страницы, он видит только отдельные компоненты этой страницы

Если какой-либо из этих компонентов недоступен для робота Google, он не отправит их в индекс Google.

Чтобы использовать наш предыдущий пример, Googlebot видит веб-страницу (html и css), но не видит изображение.

Это не просто изображения. Есть много частей на веб-странице. Чтобы Google мог оптимально ранжировать ваши веб-страницы, Google нужна полная картина.

Существует много сценариев, когда робот Google может не иметь доступа к веб-контенту, вот несколько распространенных.

  • Ресурс заблокирован robots.txt
  • Ссылки на страницы не читаются или неверны
  • Чрезмерная зависимость от Flash или других технологий, с которыми могут столкнуться веб-сканеры
  • Неверный HTML или ошибки кодирования
  • Слишком сложные динамические ссылки

Большинство из этих вещей можно быстро проверить с помощью Инструкции по Google ,

Если у вас есть учетная запись Google, используйте инструмент «Получить и отобразить», расположенный в Консоль поиска Google , Этот инструмент предоставит вам живой пример того, что Google видит для отдельной страницы.

3. Может ли робот Google получить доступ ко всем ресурсам моей страницы?

Если ваши файлы robots.txt блокируют файлы CSS и javascript, это может привести к серьезным недоразумениям относительно содержимого вашей веб-страницы (гораздо хуже, чем просто отсутствующее изображение).

Все более и более верно, что веб-страница может фактически отличаться или иметь другой контент, если ресурсы страницы не загружены.

Примером, иллюстрирующим это, может быть мобильная страница, которая использует CSS или javascript для определения того, что показывать, в зависимости от того, какое устройство просматривает страницу. Если робот Google не может получить доступ к CSS или Javascript этой страницы, он может не осознавать, что страница может быть мобильной.

В этом и других подобных сценариях Google «увидит» вашу страницу и может даже понять ее, но может не знать ее настолько, чтобы понять, что она может быть ранжирована во многих других сценариях, помимо того, что представляет собой только HTML.

Это также можно проверить для использования Инструкции по Google ,

Могу ли я контролировать Googlebot?

Да.

Робот Googlebot следует инструкциям, которые он получает через стандарты robots.txt, и даже предлагает усовершенствованные способы управления им, характерные для Google.

Вы можете управлять роботом Google ...

  • Использование файла robots.txt
  • Включение инструкций робота в метаданные ваших веб-страниц
  • Включение инструкций робота в заголовки
  • Использование файлов Sitemap
  • Использование поисковой консоли Google

На сегодняшний день наиболее распространенным способом является использование файла robots.txt.

Что такое файл robots.txt?

Файл robots.txt контролирует, как пауки поисковых систем, такие как Googlebot, видят и взаимодействуют с вашими веб-страницами.

Короче говоря, файл robots.txt сообщает роботу Google, что делать, когда он посещает ваши страницы, перечисляя файлы и папки, к которым вы не хотите, чтобы робот Google обращался.

Узнайте больше об этом в моем руководстве к файл robots.txt ,

Чтобы увидеть ваш файл robots.txt (или посмотреть, есть ли у вас), вы можете ввести URL (например, свою домашнюю страницу) в инструмент ниже, и он покажет его прямо здесь, на этой странице.

Вот несколько ресурсов от Google, которые говорят о инструкциях робота:

Sitemaps и Googlebot

Файлы Sitemap - это способ помочь роботу Google понять ваш сайт или, как говорит Google ...

«Карта сайта - это файл, в котором вы можете перечислить веб-страницы вашего сайта, чтобы сообщить Google и другим поисковым системам об организации контента вашего сайта. Сканеры поисковых систем, такие как Googlebot, прочитают этот файл, чтобы более разумно сканировать ваш сайт».

Google состояния что карты сайта лучше всего использовать в определенных сценариях, в частности ...

  • Ваш сайт действительно большой.
  • Ваш сайт имеет большой архив контентных страниц, которые изолированы или не связаны друг с другом.
  • Ваш сайт новый и имеет мало внешних ссылок на него.
  • Ваш сайт использует мультимедийный контент, отображается в Новостях Google или использует другие аннотации, совместимые с картами сайта.

Файлы Sitemap в настоящее время используются для многих целей, но в том, что касается Googlebot, файлы Sitemap в основном создают список URL-адресов и других данных, которые робот Google может использовать в качестве руководства при посещении ваших веб-страниц.

Google объясняет, как создавать карты сайта здесь ,

Googlebot и консоль поиска Google

Еще одно место, где вы можете управлять роботом Google, - это консоль поиска Google.

Если робот Googlebot слишком быстро обращается к вашему веб-серверу, вы можете изменить скорость сканирования ,

Вы также можете просмотреть обзор того, как робот Googlebot получает доступ к вашему веб-сайту, протестировать файл robots.txt, увидеть Googlebot. ошибки сканирования и выполнять запросы «извлекать и отображать», которые помогут вам понять, как Google видит ваши веб-страницы.

Сколько существует роботов Googlebots / Google?

Существует девять различных типов веб-сканеров Google.

Существует девять различных типов веб-сканеров Google

  • Googlebot (поиск в Google)
  • Google смартфон
  • Google Mobile (особенность телефона)
  • Изображения Googlebot
  • Googlebot Video
  • Новости Googlebot
  • Google Adsense
  • Google Mobile Adsense
  • Google Adsbot (проверка качества целевой страницы)

Если вы хотите получить подробную информацию о каждом из них, обязательно посетите Сканеры Google Страница справки, предоставленная Google (в ней перечислены сведения о каждом используемом им веб-сканере).

Что такое пользовательский агент Googlebot?

Поскольку существует несколько роботов Google, на самом деле есть несколько пользовательских агентов-агентов Googlebot, давайте рассмотрим основные из них:

Googlebot (веб-поиск Google)

Имена пользовательских агентов: Googlebot

Mozilla / 5.0 (совместимо; Googlebot / 2.1; + http: //www.google.com/bot.html)

Googlebot смартфон

Имена пользовательских агентов: Googlebot

Mozilla / 5.0 (iPhone; процессор iPhone OS 8_3, как Mac OS X) AppleWebKit / 600.1.4 (KHTML, как Gecko) Версия / 8.0 Mobile / 12F70 Safari / 600.1.4 (совместимо; Googlebot / 2.1; + http: // www .google.com / bot.html)

Googlebot Image

Имена пользовательских агентов: Googlebot-Image (Googlebot)

Googlebot Video

Имена пользовательских агентов: Googlebot-Video (Googlebot)

Сканеры Google На странице справки представлена ​​информация агента пользователя обо всех веб-сканерах Google, и именно здесь вам следует искать самую свежую и надежную информацию.

Googlebot и языки / локации

Если на ваших страницах отображаются разные языки или контент в зависимости от местоположения или языка запроса, робот Googlebot может не всегда видеть весь ваш контент (рекомендуется использовать hreflang ).

Но эта статья о Googlebot, и то, что Googlebot начал делать для контента на основе языка и местоположения, интересно.

Давайте взглянем...

Давайте взглянем

Когда пользователи посещают вашу страницу, и у вас есть локационное или языковое решение для другого контента, пользователь в Италии увидит итальянский контент, а пользователь в Америке увидит английский контент.

Googlebot базируется в Америке, так как это работает? Как робот Google увидит этот итальянский контент?

Сканирование с учетом локали Googlebot

Googlebot использует два основных метода (о которых нам сообщает Google) для создания сканирования с учетом локали ...

  • Геораспределенный обход. Похоже, что робот Googlebot использует IP-адреса, расположенные за пределами США, в дополнение к давним IP-адресам, которые использует робот Googlebot, который, по-видимому, базируется в США.
  • Сканирование в зависимости от языка: робот Googlebot сканирует с полем Accept-Language, установленным в заголовке HTTP.

Другими словами, Googlebot использует методы для сканирования Интернета как пользователя из любого места, но (и это большое «но»), Google по-прежнему рекомендует использовать hreflang ,

Всегда проверяйте Сканирующий робот Googlebot сканирует страница в официальных справочных страницах Google для принятия решений !.

Поиск официальных страниц справки Google

Большинство ссылок в этой статье ведут на официальные страницы справки Google.

Хороший способ увидеть все, что Google сказал о Googlebot (или любой другой теме), - использовать инструмент «Спросить Google» на этом сайте. Он ищет только официальную документацию Google.

Вот результаты для Googlebot - Статьи Googlebot от Google ,



от   Патрик Секстон от Патрик Секстон


Похожие

Инструменты Google для веб-мастеров - что это такое?
... google-dla-veb-masterov-cto-eto-takoe-1.jpg> Агенты по недвижимости, которые серьезно относятся к расширению своего веб-сайта и привлечению большего количества трафика из поисковых систем, должны подключиться к инструменту для веб-мастеров. Отслеживание эффективности ваших сайтов имеет решающее значение для того, чтобы увидеть, насколько хорошо он работает. Возможно, вы тратите деньги на онлайн-рекламу, чтобы привлечь новых клиентов, но если вы не отслеживаете результаты, вы можете
Как запятая
... может быть диалог! Эту тропу определенно нужно использовать экономно, если только вы действительно не хотите создать персонажа Лоскут , Слово «как» может использоваться во многих отношениях; Наречия, когда это может означать «почти» или «около» - «Она всего в 5 милях» или «например» - «Вы могли бы заразиться герпесом». Цитаты, когда вы хотите процитировать другого персонажа - «она
Что такое SEO оптимизация, как она работает?
... робот воспринимает оптимизированную, желаемую информацию, ваш сайт будет ранжироваться выше в результатах поиска. Например , если вы занимаетесь торговлей лесоматериалами, и люди будут искать в поисковой системе Google «купить деревянные доски», поисковая система «раскроет» сайты, связанные с этим конкретным ключевым словом или фразой. И, конечно же, обычный пользователь в большинстве случаев будет выдвигать то, что увидит ТОП-3, или лучший результат, предложенный
25 потрясающих бесплатных инструментов Google для маркетологов
... ите ли вы Google или ненавидите Google, вы должны признать одну вещь. Google предлагает множество бесплатных инструментов для удобного доступа к ним с одним логином. Маркетологам, в частности, следует воспользоваться этими инструментами, чтобы извлечь больше пользы из своего поискового движка и опыта маркетинга в социальных сетях. Следующее - некоторые из лучших маркетологов инструментов Google, должны охватить от A до (почти) Z! 1. Google AdSense
Что случилось с Google PageRank?
PageRank, кажется, ушел, но почему? В течение многих лет Google PageRank был одним из лучших способов, с помощью которого SEO могли подвести итог тому, что Google думал о странице. Раньше SEO-специалисты могли смотреть на PageRank и мгновенно узнавать, почему что-то было оценено ниже, чем должно быть. В прошлом году, однако, PageRank упал в рейтинге с точки зрения инструментов SEO. Вопрос почему? Ну, ответ на самом деле удивительно прост. Последний раз PageRank
Интернет-маркетинг: что такое SEM / SEO?
... Google AdWords происходит много событий. Между тем, пользователи могут также на YouTube и Google Maps реклама, классические текстовые объявления были через Динамический
Что такое поисковая оптимизация SEO
... может быть скопировано с других страниц. Возможно, некоторые фирмы могут рационализировать и копировать контент с других страниц в Интернете, вместо того, чтобы готовить свое оригинальное содержание, но в Google - и многих других поисковых системах - поэтому для предотвращения такого метода используются сложные критерии поиска - вы сразу заметите, когда сделаете что-то подобное.
Руководство по поисковой консоли Google
... роботе Google и о том, что он узнал во время сканирование вашего сайта , Он также включает в себя инструмент Fetch as Google, один из самых ценных инструментов, которые вы найдете. Ошибки сканирования
Отзывчивый феномен веб-дизайна: что это такое и что это значит для высшего образования
... ивный веб-дизайн (RWD) является растущей тенденцией в веб-дизайне в последние пару лет. По мере того, как все больше колледжей и университетов внедряют практику RWD и видят ее преимущества, люди в высших учебных заведениях вступают в разговор. Что такое RWD? Что это может сделать для вашей школы? Что включает в себя RWD? Это всегда лучшее решение? Что такое адаптивный веб-дизайн? Адаптивный веб-дизайн - это метод, используемый для создания веб-сайта,
Файл Robots.txt на WordPress: руководство, чтобы понять все
... Googlebot Disallow: / Правила всегда рассматриваются сверху вниз. Помните, они всегда начинаются с оператора User-agent . Во-первых, я прошу всех роботов не индексировать страницу входа (wp-login.php). Во втором я специально прошу сканера Google (Googlebot) не исследовать весь мой сайт. Как разрешить доступ к файлу в заблокированном каталоге User-agent: * Disallow: / wp-admin Разрешить: wp-admin /
Что такое SEO и как оно помогает онлайн-бизнесу?
... Google, Bing, Yandex и т. Д.), Часто используемый на болгарском языке как «SEO оптимизация». По мнению экспертов из Ganbox цель заключается в улучшении позиций в поисковых системах, что приводит к увеличению числа посещений сайта и увеличению продаж. SEO является одним из наиболее эффективных каналов онлайн-маркетинга для увеличения продаж. Процесс SEO является долгим и сложным. Он охватывает множество различных факторов,

Комментарии

Что такое Pogo Stick, что такое LSI, как увеличивается показатель отказов и как выполняется анализ обратных ссылок?
Что такое Pogo Stick, что такое LSI, как увеличивается показатель отказов и как выполняется анализ обратных ссылок? Этот человек, возможно, получил университетское образование, или SEO обучение возможно, взял. Если вы скажете, что будете использовать такие методы, как пакеты обратных ссылок, вас могут оштрафовать. 100% гарантированное ключевое слово, результаты на первой странице или в верхнем ряду, если этого
Но что, если вы все равно обнаружите, что результаты включения вашей страницы в китайских поисковых системах, таких как Baidu, не так много, как в Google?
Но что, если вы все равно обнаружите, что результаты включения вашей страницы в китайских поисковых системах, таких как Baidu, не так много, как в Google? Если это произойдет с вами, я считаю, что ваш веб-сервер, скорее всего, будет размещен за пределами Китая. В этом случае, вы все еще можете улучшить уровень включения страницы? Ответ - да. Сначала проверьте ваш сайт в Baidu Zhanzhang инструмент (Версия Baidu для веб-мастеров).
Проще говоря, Google уже имеет доступ ко всему, что ему нужно - кто, по вашему мнению, в любом случае предоставляет все данные в Google Analytics?
Проще говоря, Google уже имеет доступ ко всему, что ему нужно - кто, по вашему мнению, в любом случае предоставляет все данные в Google Analytics? Что еще более важно, Мэтт Каттс заявил, хотя и косвенно, Уклонение веб-спама от данных Google Analytics , Цитата: «Вы можете использовать Google Analytics, вы не можете использовать Google Analytics, это не повлияет на ваш рейтинг в результатах
Он несколько раз спрашивал меня: «Действительно ли мне нужен SEO, и если я это сделаю, могу ли я сделать это сам?
Он несколько раз спрашивал меня: «Действительно ли мне нужен SEO, и если я это сделаю, могу ли я сделать это сам?» По словам Трафагена, «правильного ответа нет». Вы можете многое сделать самостоятельно. Но, в конце концов, вы должны принять решение о том, стоит ли тратить время на изучение чего-то нового или стоит нанять профессионала. Здесь Марк Трафаген иронично сослался на одного из наших общих друзей в Google Plus,
Но что это такое, почему это так важно и как вы можете оптимизировать его для поисковых систем?
Но что это такое, почему это так важно и как вы можете оптимизировать его для поисковых систем? Что такое бюджет обхода? Проще говоря, бюджет сканирования - это воображаемое количество страниц, которые робот Google потратит, пытаясь просканировать и проиндексировать ваш сайт. Если у вас есть веб-сайт с более чем 1000 URL-адресов и всего лишь несколькими обратными ссылками, есть вероятность, что робот Googlebot не будет сканировать весь ваш сайт на регулярной
Что такое консоль поиска Google?
Что такое консоль поиска Google? Google Search Console или GSC для краткости - это инструмент, который Google предоставляет бесплатно, чтобы помочь веб-мастерам управлять
Что такое полезный и увлекательный контент и как роботы распознают, имеют ли они дело с отличным контентом, и предпочитают показывать его в результатах поиска?
Что такое полезный и увлекательный контент и как роботы распознают, имеют ли они дело с отличным контентом, и предпочитают показывать его в результатах поиска? Google предоставляет информацию о том, как защитить от спама в комментариях и сообщениях на форуме, как оптимизировать сайт для мобильного просмотра, как социальные сети влияют на рейтинг Google. И, конечно же, Google дает советы о том, как правильно создавать обратные ссылки (страницы, указывающие на ваш сайт) и как измерять успех
В более ранней статье Партнерский маркетинг: что это такое и как это работает?
Что такое полезный и увлекательный контент и как роботы распознают, имеют ли они дело с отличным контентом, и предпочитают показывать его в результатах поиска? Google предоставляет информацию о том, как защитить от спама в комментариях и сообщениях на форуме, как оптимизировать сайт для мобильного просмотра, как социальные сети влияют на рейтинг Google. И, конечно же, Google дает советы о том, как правильно создавать обратные ссылки (страницы, указывающие на ваш сайт) и как измерять успех
Стоит ли читать контент сайта и предоставляет ли он пользователю ценную информацию, «добавленную стоимость», как ее называет Google?
Стоит ли читать контент сайта и предоставляет ли он пользователю ценную информацию, «добавленную стоимость», как ее называет Google? Являются ли тексты оптимально подготовленными как с технической, так и с точки зрения содержания (ключевое слово: WDF-IDF ... см. Статью " Оптимальные SEO-тексты напишите сами / как выглядят хорошие тексты для Google? «)? Как выглядит профиль
Ранее мы уже обсуждали, что такое SEO и как он работает, но что делать, если вы хотите улучшить свой SEO-рейтинг?
Ранее мы уже обсуждали, что такое SEO и как он работает, но что делать, если вы хотите улучшить свой SEO-рейтинг? Существует несколько способов улучшить положение вашего сайта в результатах поиска Google. Если вы только начинаете использовать SEO и хотите знать, с чего начать, или вы уже некоторое время занимаетесь этим и задаетесь вопросом, почему вы не видите значительных улучшений, мы вас обеспечим.
Делает вывод, что в то же время, когда создается блог, еще один человек начинает поиски этой цели, но знает ли он, почему он должен это делать?
Делает вывод, что в то же время, когда создается блог, еще один человек начинает поиски этой цели, но знает ли он, почему он должен это делать? Насколько важно появляться в Google? Или она просто делает это, потому что все делают? Несколько блогов создаются ежедневно, и для того, чтобы выделиться , требуется кропотливая работа, связанная с терпением, потому что вам нужно будет применять методы, чтобы начать видеть первые положительные

Что такое Googlebot?
1. Может ли робот Google "видеть" мои страницы?
2. Может ли робот Googlebot получить доступ ко всему моему контенту и ссылкам полностью?
3. Может ли робот Google получить доступ ко всем ресурсам моей страницы?
Могу ли я контролировать Googlebot?
Txt?
Что такое пользовательский агент Googlebot?
Что такое веб-сканер?
Что делает робот Googlebot?
Единственное, что беспокоит робота Google: «Могу ли я получить доступ к этому контенту?