Интернет-журнал 'Домашняя лаборатория', 2008 №3 - Журнал «Домашняя лаборатория»
Шрифт:
Интервал:
Закладка:
Расширенные установки меню "Advanced"
После отправки документа на печать через VPP и открытия диалога, щелкните на кнопке "Advanced", там находятся дополнительные установки параметров кодирования:
Установка разрешения в DPI
Допустимые значения от 50 до 4800 dpi, по умолчанию стоит 300 dpi, обычно этого достаточно для большинства случаев. Более высокое разрешение приведет к увеличению размера файла, хотя и не пропорциональному. Здесь должен быть разумный подход — если в документе нет мелких фонтов и других деталей, требующих высокого разрешения, то не имеет смысла необоснованно увеличивать число dpi. Особое внимание следует обратить на сканированные документы, разрешение djvu файла не стоит устанавливать выше разрешения оригинала, это не может увеличить его четкость. И наоборот, если оригинал был сканирован на 600 dpi, то лучше выбрать такое же разрешение и при кодировании, в этом случае мелкие детали будут лучше читаться, а возрастание размера файла будет оправданным.
Примечание для опытных пользователей: параметр "Разрешение" выбирается в зависимости от установки "Субвыборки фона", это будет описано ниже.
Создание текстового слоя (OCR)
Эта опция находится в закладке "General" меню "Advanced" и позволяет включить в djvu файл возможность поиска по тексту и копирования текста в буфер обмена. При просмотре такого файла в плагине к IE или редакторе djvu последних версий, кнопка "Текст" становится активной. Если она неактивна, то файл djvu не содержит распознанного текста.
Поскольку VPP использует OCR от Lizardtech Document Express Editor, то при отсутствии этого редактора распознавание текста будет невозможным. Также не удалось обнаружить в VPP переключения языков распознавания. Поэтому целесообразнее производить OCR в самом редакторе, если язык документа не английский.
Для извлечения текста из файлов pdf, перед печатью нужно выбрать в свойствах принтера извлечение текста во время печати, до появления диалога печати самого VPP. Для этого в меню печати программы (обычно Acrobat Reader) выберите пункт "Print — Печать". После выбора принтера в списке, щелкните на кнопке "Properties — Свойства" справа от списка, появится соответствующий диалог:
Здесь же выбирается разрешение для графики, формат бумаги, ее ориентация и т. д. Об этом чуть ниже:
Щелкните на закладке "File Formats", отметьте пункты "Write Text File" и "Save Position and Style", затем нажмите "OK". У VPP есть проблема с фонтами, не все они правильно распознаются, при этом из самого Acrobat Reader текст корректно копируется в буфер обмена. Кроме того, в меню "Properties" выбираются линейные размеры файла по стандартным форматам бумаги. Но есть возможность выбора произвольных размеров в десятых долях миллиметра или в пикселях. Соответственно это будут пункты "Variable Paper Size" и "Variable Paper Size in Pixels". Нажатие кнопки "Advanced Papersize" добавит в список форматов бумаги дополнительные пункты. Есть также возможность выбрать разрешение для графики в dpi, в закладке "File Formats" можно выключить графику — "Disable Images" и включить/выключить поддержку иероглифов для восточных языков — "Eastern Character Support".
Уменьшение размера документов Minimize document dimensions
Эта опция доступна в меню "Advanced" на закладке "General". Ее использование позволяет уменьшить белый фон вокруг прямоугольных объектов, таких как текст и графика. У принтеров небольшое количество форматов бумаги, если печатается только небольшой участок — одна линия или строчка текста, то вокруг них останется очень много белого фона. Вы можете уменьшить файл, выбрав минимальный формат бумаги, на который полностью поместится выводимое на печать.
Сохранять промежуточные файлы Keep intermediate files
Если необходимо, то есть возможность сохранять файлы, которые VPP создает в процессе кодирования djvu. Обычно этого не требуется.
Выбор максимального количества цветов маски Maximum Number of Colors
Настройка этого параметра доступна в закладке "Foreground" меню "Advanced", можно ограничить количество цветов для объектов в маске, которые VPP будет кодировать. Маска может содержать от 1 до 4000 цветов, но следует учитывать, что в большинстве случаев нет необходимости выбирать их максимальное количество, поскольку это приведет только к необоснованному увеличению размера файла. Здесь вступает в силу правило разумной достаточности: чем меньше цветов без потери качества, тем лучше. По умолчанию задается 256 цветов, этого достаточно для большинства цветных документов.
Установка количества страниц в общих "словарях" Pages per shared dictionaries
Во время кодирования, VPP проверяет страницы всего документа, пытается найти повторяющиеся формы и на основе анализа создает общий "словарь" этих форм. Так как "словарь" таких форм можно использовать для всех остальных страниц, то размер файла djvu и затраченное время на кодирование резко уменьшаются. Можно устанавливать размер "словаря" форм от 1 до 10000 страниц, по умолчанию это значение равно 20, что достаточно для большинства случаев.
Подбор этого значения производится приблизительно так: меньшие значения при большом количестве страниц приводят к увеличению количества "словарей" форм. Например, если кодируемый документ содержит 100 страниц, а значение устанавливается равным 5, то VPP создаст 20 общих "словарей". При открытии djvu файла, программа просмотра может обработать эти 20 "словарей" достаточно быстро, поскольку они небольшие и открытие файла будет без задержек. С другой стороны, если на 100 страниц установить значение "словаря" в 50 страниц, то VPP создаст всего два "словаря", при этом размер файла уменьшится, но увеличится время на его открытие при просмотре, поскольку сами "словари" будут иметь большие размеры. Оптимальное значение выбирается равным приблизительно одной пятой от количества страниц в документе и может уточняться экспериментально.
Сжатие маски Foreground compression
Может принимать значения: Lossless, Quasi Lossless, Conservative, Lossy, Aggressive — Без потерь, Почти без потерь, Консервативное, С потерями, Агрессивное. Обычно бывает нужно использовать только первый и последний пункт, вот их характеристики:
• Lossless является кодированием без потерь, использует разделение маски и фона, применяется почти во всех случаях для черно-белых документов. Если использовался какой-либо другой режим и появились искажения, типа отсутствия точек над "i" или же черно-белое изображение слишком смазано, то лучше всего будет переключиться на Lossless;
• Aggressive является полной противоположностью Lossless, при его использовании делается попытка удаления шума из маски, размер файла в этом случае минимален, его следует использовать только в том случае, если есть гарантия получения качественного djvu файла;
Для остальных режимов даны такие рекомендации:
• Quasi Lossless более умеренный режим, чем Conservative, но с большими потерями, чем при Lossless;
• Conservative вносит изменения в текст, хотя не такие серьезные, обычно они