Появившаяся ещё в июне 2010 года возможность распознавания текста в сервисе Google Docs даёт возможность анализировать PDF-файлы и различные изображения, а также редактировать документы. Благодаря функции OCR — оптического распознавания символов, данный сервис извлекает текст из изображений. Ранее существовала поддержка текстов только на английском, французском, итальянском, испанском и немецком языках.
На сегодня компания Google представила возможность использования ещё 29 языков. В список входит большинство европейских языков, китайский упрощённый, русский и некоторые азиатские языки.
При обработке документа сервис Google Docs старается сохранять основное форматирование текста: выделение курсивом или полужирным шрифтом, размер и тип шрифта, переносы строк. Поскольку довольно сложно обнаружить все характеристики текста, иногда некоторые элементы форматирования не удается сохранить.