Метод, которым пользовалась поисковая система Google, заключается в считывании любого вида печатной литературы, будь то статья или научная работа.
Дубликаты удалялись при помощи метаданных из различных библиотек и каталогов.
Google работает над алгоритмом, который исключит любое совпадение (например, книги под разными заголовками, но одинаковые по содержанию).
Каждый раз, когда производится расчет, итог меняется. Это зависит от настроек алгоритма и дополнительных данных. В конечном итоге на сегодняшний день Google насчитал 129 864 880 объектов, которые, по мнению поисковика, является "книгой".
Новый проект Google задается целью отсканировать и оцифровать все книги мира.