Rambler's Top100
Все новости Новости отрасли
Александра КРЫЛОВА 26 июля 2012

Внимание: новый рынок

В ближайшие 2-3 года объем мирового рынка программных продуктов для обработки, распознавания, сжатия и хранения документов в формате PDF/A может достигнуть $20 млрд., а его российский сегмент – $1 млрд., считает О. Ускова, президент компании Cognitive Technologies.

В мире сегодня сканируется более 3 трлн. страниц в год, и это количество продолжает расти, а вместе с ним растет и нагрузка на существующие системы хранения. Известно, что для хранения документов, оцифрованных в хорошем качестве, требуется много дискового пространства. Неизбежным следствием этого является затруднение доступа к данным и  поиска среди них необходимой информации. В этом свете опасения экспертов, ожидающих, что современные технологии хранения скоро будут не в состоянии обеспечивать обработку информации, выглядят вполне убедительными, а программные продукты, позволяющие сжимать документ без потери его визуального качества, необычайно востребованными.

В 2005 г. был принят PDF/A - стандарт долговременного хранения документов ISO 19005-1:2005. Сегодня он утвержден в качестве стандарта для архивирования электронных документов, подлежащих длительному хранению, в США, в  Швеции и в Италии, и рекомендован к использованию правительствами ряда других стран Евросоюза.

На протяжении трех лет – с 2008 г. по 2011 г. - ученые и разработчики компании Cognitive Technologies работали над созданием технологии Cognitive PDF/A, обеспечивающей сжатие изображений документов с улучшением их визуального качества. А вчера был представлен разработанный на ее основе программный продукт Compressimo, позволяющий конечным пользователям получать «на выходе» компактные и качественно оцифрованные документы, пригодные, как для полнотекстового поиска по их содержанию, так и для долгосрочного хранения.

Благодаря заложенным в Сompressimo алгоритмам искусственного интеллекта, система может «понимать» структуру введенного в нее документа, а также наличия в нем разнообразных искажений и помех, например, пятен или разводов. После удаления таких "шумов", система автоматически разделяет документ на слои (текст, иллюстрации, печати, подписи, резолюции), затем  распознает текст (обновленное ядро OpenOCR обеспечивает распознавание на 23 языках), после чего сама определяет оптимальный алгоритм сжатия для каждого слоя. В итоге все слои собираются в один документ в формате PDF/A, полностью соответствующем требованиям стандарта ISO 19005-1:2005. При этом объем оцифрованного документа уменьшается, в среднем, в 20 раз. Что немаловажно, в отличие от «тяжелых» и сложных программных продуктов таких компаний, как Luratech Ltd. (Германия) и CVISION Technologies Inc (США), Compressimo быстро устанавливается и с легкостью используется.

После окончания трехмесячной тестовой эксплуатации, к которой привлекались международные эксперты, компания Cognitive Technologies начала продажи этого продукта, как за рубежом – через канадский Интернет-магазин PayProGlobal, так и в России через свой Call-центр, операторы которого работают с клиентской базой компании. По словам А. Назаркина, директора по международным продажам, в настоящее время покупателями, 70% из которых приходится на корпоративных пользователей, из PayProGlobal в сутки скачивается примерно 150-200 лицензий Compressimo (цена лицензии 20 евро). К концу 2012 г. Cognitive Technologies рассчитывает заработать на формирующемся с ее участием рынке не менее 700 тыс. евро.

 

 

   

 

 

 

Поделиться:
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!

Оставить свой комментарий:

Для комментирования необходимо авторизоваться!

Комментарии по материалу

Данный материал еще не комментировался.