Добавить новость
Добавить компанию
Добавить мероприятие
Мировая премьера от Cognitive Technologies
26.07.2012 07:00
версия для печати
Первое впечатление от работы Compressimo - волшебство: в сканер закладывается старый документ, залитый кофе и забрызганный чернилами, а на экране компьютера появляется чистый текст, распознанный без единой ошибки, а сам документ выглядит, как новый. И это еще не все. Размер файла такого документа очень компактен, что удобно как для его архивирования, так и для пересылки по электронной почте, при этом изображение сохраняет высокое качество, лучше, чем на бумажном аналоге. По словам разработчиков, такой результат достигается благодаря использованию новых алгоритмов анализа и обработки изображений. То есть в Compressimo реализована идея возможности выделения на изображении документа его структурных компонентов: текста, иллюстраций, графики, декоративных элементов. Каждый такой компонент – слой – с помощью соответствующего алгоритма сжимается, становясь более компактным без потери информации. При этом текст на изображении распознается и «запоминается» для того, чтобы в дальнейшем была возможность выполнять поиск и обработку информации. Анализ цветовой насыщенности документа аналогичен тому, как это делает человек, а не машина. То есть, распознавание построено по биологической модели. Каждый цвет – это отдельный слой. Подготовленные слои затем совмещаются, в результате чего получается «читабельный документ» - одностраничный или многостраничный файл в формате PDF/A, с которым удобно и просто производить любые необходимые действия. В новом продукте реализован некий аналог экспертной системы, которая умеет «понимать» тип и структуру документа и автоматически подбирает наиболее подходящий режим обработки. Изображение автоматически разделяется на слои после удаления искажений и помех. Оптимальный для каждого слоя алгоритм сжатия система выбирает самостоятельно. В Compressimo предусмотрена возможность распознавания текста на 23-х языках при помощи встроенного и доработанного ядра OCR-системы CuneiForm. По словам разработчиков, данная технология позволяет снизить объем оцифрованных документов в среднем до двадцати раз. Например, одна страница накладной ТОРГ-12 или счета-фактуры при сохранении в формате JPEG (разрешение 300 dpi, цветной режим сканирования, jpeg-компрессия отключена) будет иметь объем файла 2,42 МБ. Это среднее значение. На практике размер итогового файла зависит от марки и модели сканирующего устройства, а также от программного продукта, используемого при сканировании. Сжатие того же документа (накладная или счет-фактура) с помощью Compressimo даст файл объемом 96 Кб при аналогичном (в некоторых случаях лучшем) качестве результата. Система Compressimo базируется на ключевой технологии Cognitive PDF/A, представленной Cognitive Technologies в апреле 2011 года. Разработчиками было затрачено на разработку этой технологии три года – около 45 тысяч человеко-часов. Технология Cognitive PDF/A уже год, как представлена и пользуется спросом на мировом рынке. Представители компании Cognitive Technologies отметили, что мировой рынок продуктов, подобных Compressimo, находится в стадии формировании. Президент Cognitive Technologies Ольга Ускова полагает, что в ближайшие два-три года объем этого рынка в мире может составить до 20 миллиардов долларов, а его российский сегмент – до 1 миллиарда долларов. Правоту таких оценок подтверждает увеличивающаяся потребность хранения огромной массы документов. В мире сегодня, в среднем, сканируется более трех триллионов страниц документов в год. Это количество продолжает расти даже при всех, используемых системах электронного документооборота. До сих пор основными проблемами при работе с оцифрованными документами является их громоздкость, если качество оцифровки высокое, либо, наоборот, неважное качество, если документ является файлом меньшим «по весу». В первом случае быстро заполняется дисковое пространство, с громоздкими оцифрованными документами неудобно работать и дорого хранить, а при их передачи по сетям связи генерируется значительный трафик. Еще одна проблема - зачастую неудовлетворительное качество исходного изображения, которое получается в результате некачественной печати, попадания на документ капель чернил, следов маркера и т.д. Преимущества нового продукта в том, что, во-первых, он прост в освоении и эксплуатации: все операции производятся нажатием двух-трех клавиш. Во-вторых, результирующий PDF/A документ, созданный в Compressimo, полностью соответствует стандарту ISO 19005-1:2005. Третье – цена, которая составляет 799 рублей за одно рабочее место. И, конечно, технологические новшества, о которых мы сказали выше. Сейчас Compressimo можно скачать с сайта компании. За месяц, прошедший с начала выхода продукта на рынок, зафиксировано около двух тысяч скачиваний в сутки по миру. В России в сутки продукт скачивается 60-70 раз. Компания Cognitive Technologies планирует на базе технологий, реализованных в продукте Compressimo, разработать конвертацию в формат PDF/A с полнотекстовым распознаванием фотографий документов, сделанных на iPhone 4S. Автор: Елена Шашенкова (info@mskit.ru) Рубрики: Интеграция, ПО, Web Ключевые слова: лицензионное программное обеспечение, поставка программного обеспечения, программное обеспечение, программное обеспечение виды программного обеспечения, программное обеспечение продажа, разработка программного обеспечения, разработки , разработка программ, soft, программы soft, Cognitive
наверх
Для того, чтобы вставить ссылку на материал к себе на сайт надо:
|
||||||
А знаете ли Вы что?
ITSZ.RU: последние новости Петербурга и Северо-Запада13.11.2024 Т2 запустил первый тариф после ребрендингаз> 31.10.2024 «Осенний документооборот – 2024»: взгляд в будущее системы электронного документооборотаз>
|
||||