Здравствуйте, читатели блога Сайт с нуля.
Чтобы ваш интернет-ресурс был проиндексирован, на него должны регулярно заходить роботы от поисковых систем — Яндекс, Google, Mail.ru и других.
Но иногда в процессе получения данных о вашем сайте у этих роботов могут возникнуть трудности — невозможность загрузить страницу, документ, файл, не удается распознать dns или кодировку.
Если взять к примеру Яндекс, вы можете узнать о таких проблемах в Яндекс.Вебмастер.
О возможных видах проблем, с которыми может столкнуться робот этой поисковой системы мы и расскажем.
Ошибки загрузки
Перечень ошибок, возвращаемых роботом Яндекса в случае, если ему не удалось загрузить какой-либо документ с вашего сайта.
Ошибка |
Описание |
Обрыв соединения |
При попытке загрузить документ произошел обрыв соединения. Загрузка документа была прекращена после нескольких попыток. |
Размер текста превышает заданный предел |
Документ слишком длинный, попробуйте разбить его на части. |
Документ запрещен в файлеrobots.txt |
Документ не индексируется, так как запрещен вами или другим администратором сайта в файле robots.txt. |
Неверный адрес документа |
Адрес документа не соответствует стандарту HTTP. |
Формат документа не поддерживается |
Сервер не указывает тип документа, указывает неправильно или указанный тип не поддерживается Яндексом. |
Ошибка DNS |
Ошибка DNS. Не удается определить IP-адрес хоста по его имени. |
Статус-код HTTP не соответствует стандарту |
Сервер возвращает код статуса не соответствующий стандарту HTTP. |
Неверный HTTP-заголовок |
Заголовок HTTP не соответствует стандарту (включая расширение от Яндекса). |
Не удалось соединиться с сервером |
Не удалось соединиться с сервером. |
Неверная длина сообщения |
Не указана или неправильно указана длина сообщения. |
Неверная кодировка |
Неправильно задан заголовок transfer-encoding или указан неизвестный тип кодирования. |
Передано неверное количество данных |
Длина переданных данных не соответствует заявленной длине, то есть передача данных завершается до или продолжается после получения заявленного количества данных. |
Длина HTTP-заголовков превышает предел |
Длина HTTP-заголовков превысила предел. Возможно, это вызвано попыткой передать слишком много cookies. |
Длина URL превышает предел |
Длина адреса (URL) превышает предел. |
Ошибки обработки
Перечень ошибок, возвращаемых роботами в случае, если после удачной загрузки документа дальнейшая обработка оказалась невозможной.
Ошибка |
Описание |
Документ содержит мета-тег noindex |
Документ не индексируется, так как содержит мета-тег noindex. |
Неверная кодировка |
Документ содержит символы не соответствующие заявленной кодировке. |
Документ является логом сервера |
Документ распознан как лог сервера. Если это страница, созданная для посетителей сайта, попробуйте изменить ее так, чтобы она не была похожа на лог сервера. |
Неверный формат документа |
При анализе документа обнаружено несоответствие документа заявленному формату (HTML, PDF, DOC, RTF, SWF, XLS, PPT). |
Кодировка не распознана |
Кодировка документа не распознана. Возможно, документ не содержит текста или содержит текст в различных кодировках. |
Язык не поддерживается |
Язык документа не распознан или не поддерживается. Подробнее ознакомиться со всеми поддерживаемыми языками можно в соответствующем разделе помощи. |
Документ не содержит текста |
Сервер возвращает пустой документ. |
Слишком много ссылок |
Количество ссылок на странице превышает допустимый предел. |
Ошибка распаковывания |
Произошла ошибка при распаковывании GZIP- или DEFLATE-потока данных с сервера. |
Пустой ответ сервера |
От сервера получен ответ нулевой длины. Обратитесь к администратору сервера, на котором находится сайт. |
Документ не является каноническим |
В коде документа элемент link содержит атрибут rel со значением canonical, который указывает на другой (канонический) документ. Вместо данного документа проиндексирован канонический. |