+1 Google

Похоже, что даже всемогущий Google не смог противостоять моде Like It. Теперь кнопка +1 будет рядом с каждым результатом поиска, которую можно нажать, если сайт Вам понравился. Безусловно, полученную информацию о сайтах, Google будет использовать в определении более релевантных сайтов для Вас и для людей из Вашего окружения (Google Contacts, Gmail). Другими словами, если человек из Ваших Google Contacts нажал на страницу +1, то данных сайт будет выше в результатах поиска, предоставляемый Google.

История поисковых системы

  1. 93% пользователей всемирной сети Интернет используют поисковые системы, чтобы находить нужные им сайты.
  2. 75% из них никогда не переходят на вторую страницу поисковой выдачи.
  3. 57% пользователей пользуются поисковыми системами ежедневно
  4. 46% поисковых запросов посвящено поиску конкретных продуктов или сервисов

Когда-то было время, когда вам нужно было знать точное название сайта, чтобы найти его в поисковой системе.

Read the rest of this entry »

Google OCR

Сегодня при работе над этой рекламной статьей, использовал инструментарий, который предоставляет Google для распознавания текста.

Изначально был готовый проспект, информацию из которого надо было перенести в цифровой вид и разместить на сайте. Сканировал проспект я с помощью замечательной утилиты под Linux – xsane. Ее преимущества я расписывать не хочу, но такого инструментария под windows просто не существует. Потом сохранил полученные изображения в docs.google, где мне и было предложено воспользоваться услугами по распознаванию моего текста.

В результате в тексте было примерно 0,5 – 1 % ошибок (жить можно), но таблицы или более сложный текст (с использованием английских названий, на темном фоне и объединенных в таблицы) распознан не был вообще. В результате можно сказать, что Google OCR способен распознавать простые тексты (например, книгу), но при наличии какого-либо намека на форматирование, теряется и отказывается работать. К сожалению, в профессиональной работе Google OCR не конкурент коммерческим продуктам.