Навигация

Популярные статьи
  • Как найти достойную работу в Чехии — 4 преимущества рекрутингового агентства «Befind»

  • Авторские и переводные статьи

    Пресс-релизы

    Регистрация на сайте


    Опрос
    Какие телеканалы вы смотрите чаще?







    Google запустил онлайн-убийцу Finereader


    1 марта 2011 | Интернет / На русском языке / Мир | Добавил: Ольга Кравцова
    Среди функций Google Docs появилась возможность распознавания текста с фотографий и сканов документов. Протестировав «онлайн-распознавалку», эксперты Abbyy заявили, что Google еще есть над чем поработать, но похвалили поисковик за пропаганду OCR-технологий.

    Google добавил в свой «облачный» сервис Docs функцию распознавания текстов на 29 языках. Строго говоря, «онлайн-распознавалка» Google была впервые анонсирована и интегрирована в Docs еще в июне 2010 г. Тогда ее способности читать текст ограничивались поддержкой основных языков Европы и Америки: английского, испанского, итальянского, немецкого и французского.

    С сегодняшнего дня OCR-сервис (Optical Character Recognition, оптическое распознавание текстов) Google начал в дополнение к прежним понимать наборы символов нескольких европейских алфавитов, русского, китайского и некоторых азиатских. В числе добавленных языков есть греческий, несколько кириллических (болгарский, сербский и украинский), корйеский, индонезийский и японский. Распознавание китайских текстов ограничивается документами с упрощенным набором иероглифов, принятым сейчас в КНР.

    Для использования «онлайн-распознавалки» от пользователя требуется загрузить в Google Docs графическое изображение документа (или его PDF-версию), указав вручную формат документа и установив на странице загрузки опцию преобразования изображений и PDF-файлов в формат Google Docs. Функциональность доступна как в оригинальной, так и в русской локализации «Документов Google».

    Программист Google Джейрон Шеффер (Jaron Schaeffer) предупреждает в корпоративном блоге, что сервис «лучше всего работает с высоким разрешением изображения».

    CNews протестировал «облачную распознавалку» на двух экзотических для Google языках: русском и китайском. Русский текст с качественного изображения (скриншот 72 пикселя на дюйм) система прочитала весьма средне. Претензии к распознаванию китайского в упрощенном написании свелись к артефактам и добавлению лишних пробелов.

    Ошибки в прочитанном и распознанном тексте Google позволяет исправить средствами сервиса Google Docs либо скопировать в буфер и продолжить редактуру в оффлайновом редакторе.

    Число потенциальных пользователей OCR-сервиса Google равно аудитории сервиса Google Docs, которое компания не сообщает. Это число должно быть близко количеству пользователей Gmail, поскольку сейчас почтового аккаунта достаточно для доступа ко всем сервисам Google.

    На днях во время инцидента с пропажей переписки пользователей Gmail общее число ее подписчиков оценивалось примерно в 200 млн человек. В это число входят все пользователи, когда-либо зарегистрировавшие аккаунт в Gmail вне зависимости от того, посещали ли они почту в дальнейшем.

    Отечественного разработчика OCR-систем Abbyy новый сервис Google не напугал даже невзирая на размер своей потенциальной аудитории. Генеральный директор «Abbyy Россия» Григорий Липич, ознакомившись с возможностями распознавания текстов в Google Docs высказал CNews мнение, что «с анонсированием недостаточно развитой возможности оптического распознавания текстов Google повторяет прошлогоднюю ошибку с Google Maps. Тогда компания объявила о запуске сервиса пробок по Москве, но практической ценности данный сервис не приносил ни во время запуска, ни сейчас, так как пока его качество предоставления информации о движении в городе далеко от аналогичного сервиса от компании Яндекс».

    Григорий Липич подверг критике функциональность «онлайн-распознавалки» Google, заявив, что специалистам поисковика «есть над чем поработать в смысле качества распознавания текстов на русском, так и на английском и других языках», а также «в части сохранения оформления исходного документа». В отсутствие такой возможности пользователь будет тратить на редактуру документа после распознавания такое значительное время, что наличие возможности OCR документа девальвируется, заметил Липич.

    Однако, заметил глава Abbyy, «хорошо, когда такие известные компании как Google добавляют возможности распознавания текста в свои продукты. Это работает на повышение информированности рынка о технологиях распознавания текстов», которые известны не всем покупателям МФУ, фотокамер и сканеров.

    Abbyy владеет собственным сервисом онлайн-распознавания документов FineReader Online, который, по данным на июль 2010 г., посещали около 70 тыс. пользователей. Хотя при регистрации пользователи FineReader Online получают право распознать несколько страниц документов бесплатно, использование сервиса происходит на платной основе.

    Источник: CNews
    Комментарии (0) | Распечатать | | Добавить в закладки:  

    Другие новости по теме:


     



    Телепрограммы для газет и сайтов.
    25-ть лет стабильной работы: телепрограммы, анонсы, сканворды, кроссворды, головоломки, гороскопы, подборки новостей и другие дополнительные материалы. Качественная работа с 1997 года. Разумная цена.

    Форум

    Фоторепортажи

    Авторская музыка

    Погода

    Афиша

    Кастинги и контакты ТВ шоу

    On-line TV

    Партнеры

    Друзья

    Реклама

    Статистика
    Главная страница  |  Регистрация  |  Добавить новость Copyright © 2002-2012 Все о ТВ и телекоммуникациях. Все права защищены.