
Эта и другая информация, несоответствующая действительности обнаружилась в книжном поисковике Google. Данный поисковик содержит приблизительно 10 миллионов экземпляров книг, среди которых и некоторые несуразные факты:
• Чарльз Диккенс заявлен автором около 182 книг, которые вышли до его рождения в 1812 году;
• Книга Уильяма Шекспира «Гамлет» находится в разделе «Антиквариат и коллекционирование». Книга об австралийском феминизме находится в разделе иностранных языков, а биография Мэй Уэст является частью религии;
• Автором книги о системе работы веб-браузера является Зигмунд Фрейд. А «Мадам Бовари» написал Генри Джеймс, а не Гюстав Флобер;
• Интернет упоминается в 527 книгах, изданных до 1950 года и т.д.
Профессор Калифорнийского университета Джефри Нунберг, который рассказал обо всех ошибках поисковой системы, отметил, что некоторые из проблем с неверными данными Google в отношении книг могут быть связаны с неиспользованием разделений книг на предметные рубрики, так как книги в настоящее время исследуются не в библиотеках, а в коммерческих магазинах.
Количество категорий и предметных рубрик значительно сократилось, что, в свою очередь, возможно и вызывает возникновение ошибок подобного рода. «Google просто взял коллекцию книг в различных библиотеках и преобразовал её в пригородный книжный магазин», — добавил Нунберг.
«Джефри во многом прав», — отмечает Дэн Клэнси, директор по анализу книжной поисковой системы Google. «Я планирую выяснить откуда мы получаем неверные данные. У нас есть более 80 миллионов записей метаданных, которые мы получаем из различного рода источников. Единственное, в чем я уверен, так это то, что мы не достаточно хорошо и тщательно проверяем все метаданные».
«Я не считаю книжную поисковую систему Google библиотекой номер один и самой лучшей в сети. Я не думаю, что так было или так должно быть… Если Google находит ошибки, он устраняет их». Он добавил, что другие будут сканировать книги, а Google позже будет их исправлять.