06:40 DjVu - наш ответ PDF | |
Раз требуется перенести текстовую и графическую часть исходных документов без потери информации, нужно их эффективно сжать в графических файлах, а сами графические файлы-страницы объединить в один многостраничный документ с оглавлением и описанием страниц.Затрудняюсь оценить, насколько формат PDF (Portable Document Format) вошел в жизнь пользователей компьютеров. Интернет-публикации, документация к программам и устройствам, издательство и дизайн, бизнес-презентации, электронные книги - вот лишь часть применения этого во многом незаменимого формата документов. Он стал настолько популярным в сети, что даже заслужил право быть индексируемым наравне с HTML поисковыми машинами (Google). Нет сомнения в том, что распространять публикации для одинакового отображения и печати на любых устройствах лучше всего в формате PDF. Но у него есть несколько не очень маленьких "но". Во первых, размер больших и сложных публикаций в формате PDF, даже со сжатием изображений, достаточно велик. Во вторых, PDF идеален для переноса документов, созданных в векторных и текстовых редакторах, где исходных текст не является графикой, но совершенно не годится для распространения отсканированных оригиналов текстово-графических документов. Разве что, распознанных OCR-системами и переведенных в те-же документы Word, но при этом часть не правильно распознанной информации не сохранится. Ну и, наконец, большинство средств создания PDF "с нуля" и конвертации в PDF уже созданных публикаций далеко не бесплатны. Растущий спрос в сети на доступ к "исходникам" многих документов (в первую очередь, исторических) привел к появлению в лабораториях мегакорпорации At&T нового текстово-графического формата DjVu. Сущность его, в принципе, проста и логична. Раз требуется перенести текстовую и графическую часть исходных документов без потери информации, нужно их эффективно сжать в графических файлах, а сами графические файлы-страницы объединить в один многостраничный документ с оглавлением и описанием страниц. Сжатие полноцветной информации о документе формата А4 до размера средней Web-странички (около 50кб) теоретически вполне возможно. Существующие компактные форматы JPG, GIF, факс-стандарт CCITT и JBIG обеспечивают достаточное сжатие, однако узко специализированны либо на фотографиях, либо на черно-белой графике и тексте. Разработчики DjVu решили использовать лучшие черты разных форматов, сохраняя те или иные элементы страницы (фоновый рисунок, контрастный текст, иллюстрации) в наиболее эффективном для из них. При этом, текст сохраняется в виде слоя-маски с разрешением 300 dpi, фон - с разрешением 100pdi, параметры цвета текста - с разрешением всего 25dpi. Вместо стандарного JPG для сжатия фона используется алгоритм IW44, менее требовательный к ресурсам ПК при декомпрессии. При этом, слои-маски в формате JB2 очищаются от шумов, что в результате дает более качественное изображение и меньший размер. Слой текста для индексирования документа сжимается форматом BZZ (сходным с Bzip2). В результате, средне-статистический документ, сохраненный после сканирования в формате DjVu, в 3-8 раз компактнее его PDF-варианта. Изображения документов в DjVu-формате в 8-9 раз компактнее, чем в JPG, и во многие сотни раз по сравнению с TIFF. Страница цветного журнала, сохраненная в формате DjVu, будет иметь размер всего лишь 20-80кб, а черно-белый документ - аж 10кб. Документы в формате DjVu можно просматривать прямо в онлайне при помощи плагина для броузера, печатать на принтере, сохранять в желаемом графическом формате и распознавать при помощи OSR вроде ABBYY Fine Reader. Осталось только решить вопрос, как создавать DjVu-архивы документов, и как их потом просматривать. Название: Document Express DjVu Editor Версия: 4.1 Автор: LizardTech, Inc. Лицензия: Freeware/Shareware Размер: 2,44Мб Сайт: http://www.lizardtech.com>, http://hamradio.online.ru>ftp3/DjVuEditor_Pro.zip Открытый формат DjVu до поры до времени популяризировался компанией LizardTech, а затем, как обычно, стал ею коммерициализироваться. Сперва был создан пакет DjVu Solo, распространявшийся в Freeware и Shareware вариантах. Затем продукт переименовали в Document Express, также доступный в двух вариантах. Последние версии Document Express вообще не доступны для скачивания в онлайне, но в сети имеется множество архивных копий версии 4.1, в том числе, с полностью русифицированным интерфейсом. Установка программы не требуется. Достаточно запустить ее и можно начинать работу. Основным действием в DjVu Editor будет сканирование документов или (и) вставка в текущий проект уже отсканированных изображений. Далее вам нужно будет разместить страницы нужным образом, при необходимости повернуть их в нужном направлении, настроить параметры по умолчанию (режим и масштаб открытия, цвет фона, и т.п.), откорректировать что-либо при помощи инструментов рисования и ввода текста, и можно сохранять документ. При сохранении потребуется указать исходное разрешение и тип документа. При помощи DjVu Editor-а можно открывать уже созданные DjVu-документы, просматривать их, редактировать, добавлять новые страницы или убирать ненужные, печатать на принтере, а главное, экспортировать в растровые форматы BMP, JPG, TIFF и другие. В бесплатную русифицированную версию DjVu Editor 4.1 не входит OCR, справка и слайд-шоу, хотя основная функциональность программы от этого не теряется. Название: DjVuReader Версия: 2.0.0.20 Автор: Дмитрий Гарькаев Лицензия: Freeware Размер: 1,68Мб Сайт: http://opendjvu.webhost.r>u До недавнего времеи для просмотра документов в формате DjVu чаще всего использовался броузер с установленным плагином от At&T или, позже, от LizardTech. С одной стороны, DjVu-документы чаще всего появляются на компьютере из сети, но после их сохранения использовать броузер для их просмотра не удобно. Разумеется, можно воспользоваться для просмотра DjVu Editor-ом, но это не намного удобнее, чем в броузере. Хорошо, что у нас теперь имеется возможность смотреть DjVu-документы при помощи отдельного просмотрщика DjVuReader, созданного россиянином Дмитрием Гарькаевым. DjVuReader может отображать список контента и слады страниц, а сами страницы документа - в 4 возможных вариантах расположения и в 4 режимах (слоях). Можно легко менять масштаб отображения, переходить на нужную страницу, просматривать информацию о странице. Для дополнительного удобства в DjVuReader имеется возможность изменения яркости и контраста изображений страниц. Жаль, что в этом просмотрщике нет функции печати файлов. Тогда DjVuReader стал бы для формата DjVu полным аналогом Acrobat Reader. Кроме вышеописанных программ, работать с DjVu могут просмотрщики XnView и ACDSee. В сети существует проект OpenDjVu (djvu.sf.net), есть бесплатный просмотрщик WinDjView (http://www.sourceforge.ne>tprojects/windjview), пакет программ для Unix-платформ Djvullibre, а также просмотрщики для карманных компьютеров Pocket PC (от Lizardtech) и Sharp Zaurus. Надеюсь, эта статья поможет вам поближе познакомиться с форматом DjVu, а быть может, решить проблему с сохранением и публикацией сложных документов, чертежей и схем. | |
|
Всего комментариев: 0 | |