Возможности формата DJVU
Графический формат DjVu, который в 1996 году был разработан фирмой AT&T, прежде всего, предназначался для размещения в Сети отсканированных изображений. DjVu, который произносится, как «Дежавю», что по-французски обозначает «уже виденное», англоязычные пользователи понимают по своему – "Digital View" - «цифровой вид». И то и другое, подходит под определение, потому что этот формат представляет собой технологию сжатия изображений с незначительной потерей качества. В основном его появление было вызвано потребностью качественного отображения справочных книг, рукописей, принципиальных схем телевизоров, радиоприемников, усилителей и иных устройств, где имеется обилие формул, схем, рисунков и рукописных символов делало довольно трудоёмким их полноценное распознание.
В основу формата DjVu положено несколько технологий, среди которых: алгоритм отделения текста от фона на отсканированных изображениях, вейвлетный алгоритм сжатия фона IW44, мощный алгоритм сжатия чёрно-белых изображений JB2, эффективный универсальный алгоритм сжатия ZP, алгоритм распаковки «по запросу», алгоритм «маскировки» изображений. Первые четыре алгоритма обеспечивают чрезвычайно высокую степень сжатия. Изображение автоматически разбивается на несколько участков (к примеру, текст, логотип фирмы и растровая фотография), и для каждого участка выбирается оптимальный для конкретного графического образа алгоритм сжатия. При технологии DjVu для файлов с чёрно-белыми монохромными изображениями обеспечивается сжатие в пределах 500:1. По сравнению с форматом GIF выигрыш в размере файла в среднем составляет 20 раз. А TIFF-файл, получаемый после сканирования изображения формата А4 на цветном сканере 300 dpi, размером 25 Mb, может быть преобразован в файл DjVu, размером 80 kb без видимых на глаз потерь качества. Для черно-белого изображения, размер файла DjVu может получиться ещё меньшим - около 30 kb. Можно повысить сжатие до отношения 1000:1, но при этом потеря качества станет заметной. Хотя можно заметить, что искажения, вносимые вейвлетным сжатием, гораздо меньше заметны, чем искажения в JPEG файлах.
Алгоритмы распаковки дают возможность показывать часть изображения, не разворачивая всей картинки в оперативной памяти, а также без проблем масштабировать изображение. При этом можно быстро просматривать файл даже на компьютере со слабым процессором. Другой интересной особенностью алгоритмов распаковки является инкрементальное восстановление рисунка. При просмотре через Сеть сначала выводится только текст, потом фон в низком разрешении и лишь затем появляется фон в высоком разрешении, что даёт возможность быстрой оценки документа, без его полного скачивания.
Отделение текста от фона может значительно повысить его разборчивость, особенно, если текст отпечатан на цветной бумаге или располагается поверх рисунка. Также возможен отдельный просмотр фона, при этом алгоритм «маскировки» восстановит те части фона, которые были скрыты текстом. Изображения, которые не содержат текст, могут преобразовываться в формат IW4, соответствующий части формата DjVu, которая отвечает за хранение фона.
Формат DjVu – иногда сравнивают с форматом PDF, с тем, что DjVu при почти том же качестве является в несколько раз более ёмким. Есть ещё одно отличие. Если нужно передать все нюансы оформления, к примеру, в исторических документах, где важное значение имеет не только содержание, но также цвет, фактура бумаги, дефекты пергамента (трещинки, следы от складывания), исправления, кляксы, отпечатки пальцев, следы, оставленные иными предметами, то это возможно обеспечить только в формате DjVu. Использование формата DjVu по сравнению с форматом PDF – это, прежде всего, экономия при достаточном качестве. Сравнительная оценка качества если сравнивать его с иными известными форматами также покажет, что незначительное ухудшение качества цветных изображений сполна окупается степенью сжатия, а при черно-белых изображениях этого ухудшения вообще трудно заметить.
Программного обеспечения, предназначенного для чтения в формате DJVU, в сети можно найти огромное количество. Большинство этих продуктов предоставляется пользователям совершенно бесплатно, поэтому данный формат весьма популярен.
PG: Надо сказать, что многие книги в формате Djvu, доступные для скачивания в Сети, довольно низкого качества. Но это не из-за слабости данного формата, а только вследствие использования низкокачественных сканеров и программ, применяемых для создания книг в данном формате. Часто издатели идут намеренно на ухудшение качества, чтобы выиграть на размере. Но это никак не проблема формата.
Алгоритмы распаковки дают возможность показывать часть изображения, не разворачивая всей картинки в оперативной памяти, а также без проблем масштабировать изображение. При этом можно быстро просматривать файл даже на компьютере со слабым процессором. Другой интересной особенностью алгоритмов распаковки является инкрементальное восстановление рисунка. При просмотре через Сеть сначала выводится только текст, потом фон в низком разрешении и лишь затем появляется фон в высоком разрешении, что даёт возможность быстрой оценки документа, без его полного скачивания.
Отделение текста от фона может значительно повысить его разборчивость, особенно, если текст отпечатан на цветной бумаге или располагается поверх рисунка. Также возможен отдельный просмотр фона, при этом алгоритм «маскировки» восстановит те части фона, которые были скрыты текстом. Изображения, которые не содержат текст, могут преобразовываться в формат IW4, соответствующий части формата DjVu, которая отвечает за хранение фона.
Формат DjVu – иногда сравнивают с форматом PDF, с тем, что DjVu при почти том же качестве является в несколько раз более ёмким. Есть ещё одно отличие. Если нужно передать все нюансы оформления, к примеру, в исторических документах, где важное значение имеет не только содержание, но также цвет, фактура бумаги, дефекты пергамента (трещинки, следы от складывания), исправления, кляксы, отпечатки пальцев, следы, оставленные иными предметами, то это возможно обеспечить только в формате DjVu. Использование формата DjVu по сравнению с форматом PDF – это, прежде всего, экономия при достаточном качестве. Сравнительная оценка качества если сравнивать его с иными известными форматами также покажет, что незначительное ухудшение качества цветных изображений сполна окупается степенью сжатия, а при черно-белых изображениях этого ухудшения вообще трудно заметить.
Программного обеспечения, предназначенного для чтения в формате DJVU, в сети можно найти огромное количество. Большинство этих продуктов предоставляется пользователям совершенно бесплатно, поэтому данный формат весьма популярен.
PG: Надо сказать, что многие книги в формате Djvu, доступные для скачивания в Сети, довольно низкого качества. Но это не из-за слабости данного формата, а только вследствие использования низкокачественных сканеров и программ, применяемых для создания книг в данном формате. Часто издатели идут намеренно на ухудшение качества, чтобы выиграть на размере. Но это никак не проблема формата.