Google: принципы индексации PDF

Поисковые роботы нередко сталкиваются с файлами в формате pdf, презентациями и электронными таблицами. Поисковик Google поделился информацией, каким образом происходит индексация страницы с подобным содержимым. Как выяснилось, поисковый сервис Google может осуществлять индексацию текста из документов в формате pdf, без разницы на каком языке составлен последний. Единственным условиям является то, чтобы файл не был защищен паролем либо зашифрован.

При помощи OCR-алгоритмов Google производит извлечение текста, даже в том случае, когда текст является изображением. Картинки же в таких файлах не индексируются. В отношении ссылок, которые содержаться в PDF-файлах, то их индексация проводится по схеме, аналогичной индексированию ссылок HTML.

Было отмечено, что HTML-файлы не имеют никакого приоритета при ранжировании, и документы PDF могут занимать довольно высокие позиции в результатах поисковой выдачи. Все что необходимо для достижения такого результата — это качественное содержимое и ссылки со сторонних ресурсов.

Вы можете заказать продвижение вашего сайта с помощью внешних ссылок тут: http://www.seo-forum.ru/showthread.php?t=1876. В итоге вы можете получить рост позиций и показателей вашего сайта.

Добавить комментарий

Ваш адрес email не будет опубликован.