ИНФОтека

Информационная безопасность

Google

Документы Google - теперь с OCR

OCR бесплатно

Оптическое распознавание символов, OCR — задача очень востребованная. Применений у такого метода много; вряд ли найдётся хотя бы один человек, работающий с книгами и документами вообще, который хотя бы раз не сталкивался с такой задачей: перевести картинку (или PDF файл и т.д.) в текст. Желательно, бесплатно и с наилучшим возможным качеством.

Рассказывать про ABBYY Finereader, видимо, не нужно. Но, поскольку этот продукт коммерческий, следует упомянуть как минимум CuneInform, бесплатную программу того же рода. Если вы не пользовались вторым вариантом, рекомендую проверить в деле.

Начиная с сегодняшнего дня, возможность автоматического распознавания текстов предлагается и для русского языка на Документах Google (в общей сложности для 34 языков и всех вариантов Google Apps). Ниже следует пояснение, где это делается и два примера того, что получается.

Knol logo

«Гуглопедия»

Собственно сервис онлайн-энциклопедии, Кнол, был запущен в конце 2007 года. Поначалу его объявляли очередным «убийцей» (например, убийцей Википедии), о чём несложно найти публикации.

Однако с течением времени стало понятно, что Кнол следует рассматривать скорее как дополнение к уже существующим энциклопедиям, да и сам термин «энциклопедия» к этому сервису вряд ли применим.

Скорее его имеет смысл назвать сервисом публикаций статей, основной упор в которых делается на жизненный опыт. Ближайший пример — Школа жизни. И то, что в Кноле может быть множество одноимённых статей — скорее благо, ведь жизненный опыт у каждого свой, и есть возможность выбрать среди полезных советов, мыслей и прочей пищи для ума ту, что вам лично ближе всего по духу.

infoworld