Воскресенье, 17.11.2024, 05:02
Приветствую Вас Гость
Главная » 2010 » Апрель » 20 » DjVu - наш ответ PDF
06:40
DjVu - наш ответ PDF
Раз требуется перенести текстовую и графическую часть исходных документов без потери информации, нужно их эффективно сжать в графических файлах, а сами графические файлы-страницы объединить в один многостраничный документ с оглавлением и описанием страниц.Затрудняюсь оценить, насколько формат PDF (Portable Document Format) вошел в жизнь пользователей компьютеров. Интернет-публикации, документация к программам и устройствам, издательство и дизайн, бизнес-презентации, электронные книги - вот лишь часть применения этого во многом незаменимого формата документов. Он стал настолько популярным в сети, что даже заслужил право быть индексируемым наравне с HTML поисковыми машинами (Google).
Нет сомнения в том, что распространять публикации для одинакового отображения и печати на любых устройствах лучше всего в формате PDF. Но у него есть несколько не очень маленьких "но". Во первых, размер больших и сложных публикаций в формате PDF, даже со сжатием изображений, достаточно велик. Во вторых, PDF идеален для переноса документов, созданных в векторных и текстовых редакторах, где исходных текст не является графикой, но совершенно не годится для распространения отсканированных оригиналов текстово-графических документов. Разве что, распознанных OCR-системами и переведенных в те-же документы Word, но при этом часть не правильно распознанной информации не сохранится.
Ну и, наконец, большинство средств создания PDF "с нуля" и конвертации в PDF уже созданных публикаций далеко не бесплатны.
Растущий спрос в сети на доступ к "исходникам" многих документов (в первую очередь, исторических) привел к появлению в лабораториях мегакорпорации At&T нового текстово-графического формата DjVu.
Сущность его, в принципе, проста и логична. Раз требуется перенести текстовую и графическую часть исходных документов без потери информации, нужно их эффективно сжать в графических файлах, а сами графические файлы-страницы объединить в один многостраничный документ с оглавлением и описанием страниц. Сжатие полноцветной информации о документе формата А4 до размера средней Web-странички (около 50кб) теоретически вполне возможно. Существующие компактные форматы JPG, GIF, факс-стандарт CCITT и JBIG обеспечивают достаточное сжатие, однако узко специализированны либо на фотографиях, либо на черно-белой графике и тексте. Разработчики DjVu решили использовать лучшие черты разных форматов, сохраняя те или иные элементы страницы (фоновый рисунок, контрастный текст, иллюстрации) в наиболее эффективном для из них. При этом, текст сохраняется в виде слоя-маски с разрешением 300 dpi, фон - с разрешением 100pdi, параметры цвета текста - с разрешением всего 25dpi.
Вместо стандарного JPG для сжатия фона используется алгоритм IW44, менее требовательный к ресурсам ПК при декомпрессии. При этом, слои-маски в формате JB2 очищаются от шумов, что в результате дает более качественное изображение и меньший размер. Слой текста для индексирования документа сжимается форматом BZZ (сходным с Bzip2).
В результате, средне-статистический документ, сохраненный после сканирования в формате DjVu, в 3-8 раз компактнее его PDF-варианта. Изображения документов в DjVu-формате в 8-9 раз компактнее, чем в JPG, и во многие сотни раз по сравнению с TIFF.
Страница цветного журнала, сохраненная в формате DjVu, будет иметь размер всего лишь 20-80кб, а черно-белый документ - аж 10кб.
Документы в формате DjVu можно просматривать прямо в онлайне при помощи плагина для броузера, печатать на принтере, сохранять в желаемом графическом формате и распознавать при помощи OSR вроде ABBYY Fine Reader.
Осталось только решить вопрос, как создавать DjVu-архивы документов, и как их потом просматривать.

Название: Document Express DjVu Editor
Версия: 4.1
Автор: LizardTech, Inc.
Лицензия: Freeware/Shareware
Размер: 2,44Мб
Сайт: http://www.lizardtech.com>, http://hamradio.online.ru>ftp3/DjVuEditor_Pro.zip

Открытый формат DjVu до поры до времени популяризировался компанией LizardTech, а затем, как обычно, стал ею коммерициализироваться. Сперва был создан пакет DjVu Solo, распространявшийся в Freeware и Shareware вариантах. Затем продукт переименовали в Document Express, также доступный в двух вариантах. Последние версии Document Express вообще не доступны для скачивания в онлайне, но в сети имеется множество архивных копий версии 4.1, в том числе, с полностью русифицированным интерфейсом.
Установка программы не требуется. Достаточно запустить ее и можно начинать работу. Основным действием в DjVu Editor будет сканирование документов или (и) вставка в текущий проект уже отсканированных изображений.
Далее вам нужно будет разместить страницы нужным образом, при необходимости повернуть их в нужном направлении, настроить параметры по умолчанию (режим и масштаб открытия, цвет фона, и т.п.), откорректировать что-либо при помощи инструментов рисования и ввода текста, и можно сохранять документ. При сохранении потребуется указать исходное разрешение и тип документа.
При помощи DjVu Editor-а можно открывать уже созданные DjVu-документы, просматривать их, редактировать, добавлять новые страницы или убирать ненужные, печатать на принтере, а главное, экспортировать в растровые форматы BMP, JPG, TIFF и другие.
В бесплатную русифицированную версию DjVu Editor 4.1 не входит OCR, справка и слайд-шоу, хотя основная функциональность программы от этого не теряется.

Название: DjVuReader
Версия: 2.0.0.20
Автор: Дмитрий Гарькаев
Лицензия: Freeware
Размер: 1,68Мб
Сайт: http://opendjvu.webhost.r>u

До недавнего времеи для просмотра документов в формате DjVu чаще всего использовался броузер с установленным плагином от At&T или, позже, от LizardTech.
С одной стороны, DjVu-документы чаще всего появляются на компьютере из сети, но после их сохранения использовать броузер для их просмотра не удобно.
Разумеется, можно воспользоваться для просмотра DjVu Editor-ом, но это не намного удобнее, чем в броузере.
Хорошо, что у нас теперь имеется возможность смотреть DjVu-документы при помощи отдельного просмотрщика DjVuReader, созданного россиянином Дмитрием Гарькаевым.
DjVuReader может отображать список контента и слады страниц, а сами страницы документа - в 4 возможных вариантах расположения и в 4 режимах (слоях).
Можно легко менять масштаб отображения, переходить на нужную страницу, просматривать информацию о странице.
Для дополнительного удобства в DjVuReader имеется возможность изменения яркости и контраста изображений страниц.
Жаль, что в этом просмотрщике нет функции печати файлов. Тогда DjVuReader стал бы для формата DjVu полным аналогом Acrobat Reader.

Кроме вышеописанных программ, работать с DjVu могут просмотрщики XnView и ACDSee. В сети существует проект OpenDjVu (djvu.sf.net), есть бесплатный просмотрщик WinDjView (http://www.sourceforge.ne>tprojects/windjview), пакет программ для Unix-платформ Djvullibre, а также просмотрщики для карманных компьютеров Pocket PC (от Lizardtech) и Sharp Zaurus.
Надеюсь, эта статья поможет вам поближе познакомиться с форматом DjVu, а быть может, решить проблему с сохранением и публикацией сложных документов, чертежей и схем.
Категория: Новости | Просмотров: 339 | Добавил: notlearnin | Рейтинг: 0.0/0
Всего комментариев: 0