DJVU

DJVU (DjVu, djvu, deja vu) — технология и формат динамического сжатия отсканированных страниц изданий, содержащих текстовые и иллюстративные материалы. Разработка выполнена в 2000 году сотрудниками исследовательской лаборатории фирмы AT&T Labs-Research Леоном Боттоу (Leon Bottou), Яном ЛеКуном (Yann LeCun), Патриком Хаффнером (Patrick Haffner). Особенностями формата являются:
Сохранение приемлемого для электронных изданий качества цветных изображений, сопоставимое с форматом JPEG, однако существенно более экономичное (сжатое цветное изображение, содержащее текст и рисунки, в 5-10 меньше сжатого по методу JPEG, черно-белые страницы сжимаются в 10-20 раз лучше, чем JPEG);
Качество передаваемого текста удовлетворительное, хотя и несколько хуже, чем в формате PDF;
Сохранение формата страницы в издании, содержащей оцифрованный текст и изображение;
Динамическое раскрытие скачиваемого из сети и выводимого на экран изображения страницы при скроллинге (оперативная память ПК не «держит» невидимых частей документа);
Быстрая загрузка изображения.
Недостатками формата (например, по отношению к HTML) являются его сложность, необходимость использования специального редактора, громоздкая кодировка, не безупречное качество изображения. В DJVU применяется специальная технология, отделяющая от сканированного образа весь текст и сжимающая его, сохраняя первоначальное качество. Картинки же переводятся в 100 dpi и подвергаются сжатию с использованием техники «вейвлетов» (метод, часто использующийся для онлайновой декомпрессии данных). Дополнительно происходит обработка фоновых частей образа. При этом удается исключить из конечного файла фрагменты изображения, которые не видны (к примеру — стоят за картинками или за текстом). Каждая картинка подвергается преобразованиям, призванным сократить размер файла. Она разделяется на несколько слоев (подложку, маску, передний план). Для этого растровый файл просматривается пиксель за пикселем. Все светлые точки автоматически причисляются к фону, темные — к маске или переднему плану. Все пиксели, выводимые на экран, получают цвет на базе логических вычислений, построенных на значениях соответствующих цветов из всех слоев. Такое разделение помогает эффективно сжимать графику. При воспроизведении изображения слои соединяются. Маска, имеющая обычно всего один цвет, архивируется по методу сжатия документов, используемому в факсимильных аппаратах.
Сферой применения технологии DJVU разработчики называют обработку отсканированных книг, журналов, каталогов, руководств, исторических и редких документов и размещение их цифровых копий в Интернете. По оценкам разработчиков технология позволяет добиться коэффициента сжатия 1000:1 (отсканированная при 300dpi цветная страница занимает — 30-80 Кбайт, черно-белая — 10-30 Кбайт).
Статья находится в рубриках
Яндекс.Метрика