01К вашим услугам:

      Главная
      Программы
      Скрипты
      Графика
      Обои
      Игры
      Музыка
      Кино и Видео
      Книги
      Железо
      Юмор
      Linux
      КПК
       Игры для X-Box
      Разное
      Сборки Windows
      DVD/HD/Blue-ray Video
           FAQ по сайту
      Контакты
           Кушаем вкусно!
ФОТОрецепты на BonAppetit

Сейчас на сайте:

ЛУЧШИЕ БЛОГИ САЙТА
Постоянное обновление!


02Наш опрос

Вы зашли на lugarus.com чтобы:

Скачать программы
Скачать фильмы
Скачать игры
Скачать книги
Скачать музыку


03Программы

   
Loading ...

04ТОП новостей

    » Антивирусники на войне
» Lavasoft Ad-Aware 2008 Pro 7.1.0.10
» WinRAR 3.80 Final Русская версия
» Screensaver Russia Clock 2.0
» Punto Switcher 3.0
» Как работать ... с оф ...
» Говорящие часики LugaRus Edition
» Изящные рамки с неж ...
» Donna Summer - Crayons (2008/MP3/FLAC)
» Alien Skin Photoshop Plugins Pack для PS CS3
» Stars on 45 - Stars on 45
» Пикник - Только Лучшее 2008
» Metallica - 2008 - Death Magnetic (FLAC + MP3)
» O&O Defrag 11.0 Build 3265 Professional Eng + Rus
» Пуленепробиваемый ASUS?
» В часы досуга
» K-Systems 8.07.1
» Микки Маус (6 дисков ...
» m0nkrus x86-x64 System Boot DVD 6.0 ...
» Chessmaster: Grandmaster Edition

05Друзья


Download Портал LugaRus.Com обновляется ежедневно!
У нас всегда можно скачать свежий Софт, Программы, mp3 Музыку, Книги и многое другое.


Полный спектр лучших азартных игр: Рулетка, Покер, Блэкджек, Видео Покер, Игровые автоматы, Слоты, Кено... Наличие системы контроля честности во всех азартных играх казино. Возможность начать игру - на интерес (без денег)!!! Большое количество способов пополнения игрового счета и вывода выиграша: Webmoney, Яндекс.Деньги,Кредитные карты, SMS платежи …             Играть в Grand Casino                               Скачать Grand Casino

Надежная защита - реальные подарки!
Lan2net NAT Firewall
С 25 августа компания NetSib проводит уникальную акцию - покупатели Lan2net NAT Firewall получают КПК HP iPAQ 114 бесплатно!
Только до 31 октября 2008 года
Количество подарков ограничено - приобрети популярную лицензионную программу и получи великолепный подарок!



Сведения о DjVu формате

Другое

Grant

8 июня 2008

Просмотров: 1465 / Комментов: 8

Напечатать

Сведения о DjVu формате

DjVu - графический формат, оптимизированный для хранения отсканированных документов. В частности он идеально подходит для создания электронных книг. Существует два традиционных способа хранения отсканированной книги: для энтузиастов это распознавание (OCR) с последующей подготовкой полноценного текстового электронного документа, менее терпеливые люди выкладывают непосредственно "сканы" - отсканированные картинки, часто собранные в pdf документ. В первом случае требуется прорва работы, во втором получаются файлы размером в десятки и даже сотни мегабайт.
Отныне существует компромиссный вариант - перевод отсканированных картинок в формат DjVu (дежа-вю). При этом текст и контрастные рисунки сохраняются с разрешением 300dpi, все остальное считается фоном и сохраняется с пониженным разрешением. Это позволяет хорошо сжать электронный документ без потери его читаемости. В DjVu размер файла отсканированной книги оказывается в пределах нескольких мегабайт, что вполне приемлемо.
Особое значение этот формат приобретает для переноса в сеть математической и вообще технической литературы, где обилие схем и формул делает распознавание и перевод в текстовый формат практически невыполнимым. В настоящее время формат DjVu становится фактическим стандартом для электронных библиотек. Файлы с расширением DjVu, перестают быть экзотикой на просторах сети.

DjVu: Краткое техническое введение

Несмотря на растущую важность Интернета, большая часть знаний в виде культурного и образовательного материала уже существующего сегодня, всё ещё доступна лишь в бумажной форме. Внедрение данного информационного богатства в цифровую область, в схожем с оригиналом виде, с лёгким доступом и поиском, является основным шагом к созданию Всемирной Интернет Библиотеки.
DjVu (произносится как "дэжа вю") это технология сжатия, файловый формат и универсальная платформа специально спроектированная для создания цифровых библиотек на основе печатного, сканированного или цифрового материала. Так например для сканированного документа, размер DjVu файла обычно в 3-10 раз меньше чем чёрно-белый TIFF или PDF и в 5-10 чем цветной JPEG.
Обычная страница из книги, журнала или древней рукописи отсканированная в цвете и 300dpi содержит порядка 8 миллионов пикселей и занимает 24MB в несжатом виде. Традиционные технологии сжатия такие как JPEG обладают следующими минусами:
• Типичные размеры JPEG файла на страницу находятся в рамках между 400KB и 2MB в лучшем качестве, что является абсолютно непригодным для удалённого доступа.
• Острые грани (в символьных структурах) - причина многочисленных потраченных впустую бит и/или неприятных артефактов.
• Большие изображения очень медленно рендрятся, требуя объёмный буфер памяти для распаковки в клиенте, а ещё их проблематично увеличить или распечатать в существующих браузерах.
• Текст обычно не отделяется от изображения и по этому не может быть подвергнут OCR, индексированию и поиску.
• Ничего не сделано для многостраничных документов, потому приходиться формировать изображения в контейнерный формат типа PDF, ещё больше теряя в эффективности.
DjVu избавляет от этих проблем обрабатывая двутональные документы, низкоцветовые (индексированные) изображения, изображения с непрерывным спектром тонов (фотографии и т.д), сканированные цветные и чёрно-белые документы, цифровые документы (например в Postscript или формате PDF).
Двутональные документы закодированы методом JB2 который формирует сжатую библиотеку из повторяемых форм в документе (например символов) и кодирует их место появление на каждой странице. Низкоцветовые изображения сжаты аналогичным путём, с добавлением цветовой палитры и цветового индекса для каждой формы. Изображения с непрерывным спектром тонов сжаты прогрессивным "wavelet-based" методом IW44, равным JPEG-2000 в отношении шумового коэффициента, но чей декодер/рендер более эффективен, занимает меньше памяти и оптимизирован для более быстрой работы (в 3 раза быстрей чем быстрый режим JPEG-2000). Внутренние кодеры обширно используют новый бинарный адаптивный арифметический кодер, названный "Z-coder".
Цветной отсканированный документ разбивается на передний и фоновый план. Передний план содержит текст, линии и кривые сжатые как двутональное или низкоцветовое изображение с максимальным разрешением (используется JB2), сохраняя резкость и удобочитаемость текста. Фоновый план содержит изображения и бумажные текстуры сжатые в уменьшенном разрешении с IW44. Фоновый план, находясь под приоритетными компонентами, сглаживается для уменьшения размера. Сегментатор переднего и фонового плана сначала обнаруживает объекты резко противопоставленные их окружению и затем классифицирует их в передний или фоновый план используя несколько критериев, типа их цветовой однородности, геометрии и веса.
Цифровые PDF и PostScript документы превращаются в список команд рисования нижнего уровня, используя популярный инструментарий GhostScript. Далее этот список транслируется в список форм которые впоследствии классифицируются в передний или фоновый слой используя эвристический анализ. Затем слои сжимаются как сканированные документы.
Двутональные DjVu документы обычно занимают 5-30KB на страницу в 300dpi, что в 3-8 раз меньше чем Group 4 (используемый в Fax машинах, в TIFF файлах и в PDF). Низкоцветовые изображения, например иконки, обычно в 2 раза меньше чем GIF, но могут быть и в 10 раз меньше если содержат много текста. Фотографии в 2 раза меньше чем JPEG и схожи по размеру с JPEG-2000 в быстром режиме для SNR. Интересный аспект "wavelet" кодер-декодера IW44 - то, что он позволяет оперативную декомпрессию/рендеринг области видимой в окне на экрана дисплея (и не больше), если например пользователь увеличивает какие-то фрагменты и балуется с панорамированием. Это позволяет сохранять изображения в сжатой форме в оперативной памяти клиентской машины и отображать больше изображения без требования чрезмерных объёмов памяти. Сканированные цветные и чёрно-белые документы в DjVu обычно занимают 30-100KB на страницу в 300dpi, что в 5-10 раз меньше чем JPEG и около 2-3 раз меньше чем MRC/T.44 или TIFF/FX. Цифровые документы с большим объёмом текста обычно в 1-3 меньше чем PDF или сжатый gzip'ом PostScript в 300dpi, но могут быть и значительно меньше если документ содержит изображения.
DjVu документы могут быть отображены через вэб браузер с помощью очень маленького plug-in'а (доступного для всех основных платформ). Всё в дизайне DjVu было оптимизировано чтобы уменьшить задержку между решением пользователя рассмотреть страницу и её отображением на экране. Многопоточная программная архитектура с умным кэшированием позволяет индивидуальным компонентам документа быть загруженными и преддекодированными по требованию. Страницы загруженные по требованию, дают произвольный доступ без предшествующей загрузки полного документа. Компоненты страницы (передний план, фоновые куски) загружаются последовательно и рендрятся отдельным потоком как только загрузка считается завершённой. Всё это даёт прогрессивный рендеринг и улучшает качество изображения. Страница, которая следует за страницей, в настоящее время отображаемой, предзагружена, преддекодирована и кэширована, посредством чего автоматически уменьшается задержка между перелистыванием страниц. Просмотрщик DjVu файлов обладает своим "независимым" графическим интерфейсом пользователя который позволяет быстро изменять масштаб изображения, панорамирование и зеркальное отражение страницы одним кликом мыши или нажатием клавиши на клавиатуре.
Передний слой может быть подвергнут OCR, а результат внедрён назад в файл DjVu как доступный для поиска уровень "скрытого текста". Существует и соответствующий инструментарий для извлечения такого текста и перевода его в ряд форматов, которые включают каждое слово с координатами его ограничивающего прямоугольника на странице. Форматы также включают структуру документа (страницы, столбцы, параграфы, строки, слова). Гиперссылки, аннотации, эскизы страниц и другие метаданные тоже могут быть внедрены в документы DjVu.
DjVu может рассматриваться как основная открытая платформа для обмена документами так как библиотека DjVu, включая многопоточный декодер/рендер, кодер IW44, кодер палеттизированного изображения, а также кодеры простых двутональных и цветных документов теперь являются свободным программным обеспечением доступным под GNU GPL и могут быть использованы как платформа для разработки новых кодеков, схем сегментации, механизмов передачи данных, интерфейсов просмотрщика и систем контент-анализа.
• Бумаги, примеры, тесты и цели доступы на http://www.djvuzone.org.
• Исходные коды доступы на http://djvu.sourceforge.net.
• Plug-in'ы, компрессоры, SDK и коммерческое программное обеспечение может быть найдено на http://www.djvu.com.
• Сервера которые способны конвертировать почти любой формат в DjVu доступы на http://openlib.djvuzone.org, http://bib2web.djvuzone.org и http://any2djvu.djvuzone.org.
DjVu как формат состоит как бы из целых четырёх технологий сжатия:
• DjVuPhoto (то есть IW44): это как вы уже наверное поняли как раз таки сжатие с потерей качества. Потери ощутимые и артефакты присутствуют, правда здесь главное найти золотую середину в настройках и тогда действительно можно получить изображение в несколько раз меньшее чем аналог в JPEG, да и опять же не забывайте про такие вещи как zooming, быструю загрузку (помните сжатое изображение в RAM?) всякое там разное сглаживание.
• DjVuBitonal (это JB2): здесь красота разумеется уже другая, красота жёстких линий, китайских иероглифов и индексированного изображения. И всё это удаётся сжать до невероятных размеров. Здесь выигрыш у PDF огромный.
• DjVuDocument: сам документ действительно делится на передний и задний слой. Передний как несложно догадаться JB2, а задний IW44.
• BZZ: это обычное подобие bz2 для "скрытого текста", очень полезная вещь.
Любопытное чудо в виде DjVuDocument которое бы мне вам хотелось показать наглядно на примере карты Ирака.
Сведения о DjVu формате

Именно так выглядит обычный Багдад на обычной карте Ирака, в необычном DjVuDocument файле. Что собственно необычного? Ну мы же с вами проходили, помните? Передний план, фоновый план, а вот как это выглядит на деле.
Сведения о DjVu форматеСведения о DjVu формате

Несложно догадаться где передний, а где фоновый. Передний (первое изображение) сжат JB2 и содержит всё основное, фоновый (второе изображение) сжат IW44 и ничего важного не содержит. Более того, если вы обратили внимание он очень сильно сглажен/сжат, в общем то сделано это специально, для уменьшения размера. На обычном изображении где передний план накладывается на фоновый, данное сглаживание/сжатие не очень то и бросается в глаза, а вот если бы его не было, размер файла вырос бы в два, а то и три раза. Более того обратите внимание как DjVu самостоятельно определил где у изображения важные детали, а где второстепенные. Все эти его хваленные анализы действительно работают, чёрт побери, да ещё как работают. Ни одного названия, или даже символа не уехало на фоновый план.
При подготовке информаци использованы открытые источники сети Интернет.

На мой взгляд лучшая на сегодняшний день программа для просмотра книг в djvu формате WinDjView-0.5 (русская версия)


А здесь находится архив в котором:
- Вышеописанные сведения (в формате PDF)
- Сведения по созданию книг в формате DjVu (в формате PDF)
- Пособие по Сканкромсатору (в формате PDF)
- Мануал по Сканкромсатору (в формате PDF)
- Инструкция ScanAndShare 1.07 с примерами (в формате PDF)
- ScanKramsator v 5.81 rus
- Office2DjVu (небольшое дополнение в Office 2007, позволяющее сохранять документы напрямую из Word в DjVu)
Rapidshare
Easy-share



Я хочу добавить страницу в закладки на:



Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо зайти на сайт под своим именем.

Похожие новости:





Рейтинг статьи по 5-ти бальной шкале (выберите нужное количество звездочек)
 (голосов: 10)




Добавил: lsk47 | ICQ: -- (15 июня 2008 20:01) | #8

Спасибо! DjVu -это вещь!!!


Добавил: grustetz | ICQ: 234234234 (11 июня 2008 16:08) | #7

Нужная и качественая новость. Отличный набор. Огромное спасибо!


Добавил: garUs | ICQ: -- (9 июня 2008 11:23) | #6

Программа для чтения PDF-документов. Русская версия.
Adobe Reader 8.1.2 RU
23MB


Добавил: Grant | ICQ: -- (8 июня 2008 20:09) | #5

В том то и дело, что информация для любителей PDF, зачастую не имеющих под рукой DjVu вьювера.


Добавил: Yava68186 | ICQ: -- (8 июня 2008 19:18) | #4

Спасибо


Добавил: buzlik | ICQ: -- (8 июня 2008 16:11) | #3

Огромное спасибо за полезную информацию!!!


Добавил: urgins | ICQ: -- (8 июня 2008 08:30) | #2

Если DjVu лучше сжимает чем PDF, то почему не выложить (описание,мануал,инструкции) в нем а не в PDF?


А вообще спасибо.


Добавил: garUs | ICQ: -- (8 июня 2008 00:43) | #1

Нет слов,одни эмоции winked smile !СПАСИБО GRANT !!!

Информация

Посетители, находящиеся в группе Гости, не могут комментировать Сведения о DjVu формате скачать.

Календарь

    «    Октябрь 2008    »
    ПнВтСрЧтПтСбВс
     
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
     

Панель управления


Рекомендуем




LUGARUS.COM РЕКОМЕНДУЕТ!
Лучшая онлайновая игра всех времён и народов!
Загрузка ...