Чистка и редактирование сканов

Здравствуйте!

В этом уроке я покажу вам, как я чищу сканы старых книг и сохраняю их в едином PDF файле для последующей печати. Для работы я использую программу «Adobe Photoshop» и графический планшет «Wacom».

Сразу хочу обратить внимание, что мой способ основывается только на чистке (ретуши) изображения без распознавания текста в программе «ABBYY FineReader». Это целесообразно, когда необходимо сохранить первоначальную верстку, например если в тексте много изображений, сложно подобрать шрифт или же издание слишком ценное и необходимо печатать так как есть.

Заранее предупреждаю, что наличие графического планшета обязательно. Без него качественно почистить сканы не получится. Совсем. Но не стоит отчаиваться, если у вас его нет. Купить планшет можно не так дорого, тем более, всегда можно заказать такую технику напрямую из Китая. Как раз об этом на сайте propereplet.ru есть замечательная обзорная статья.

Для урока я выбрал брошюру «Приготовленіе макаронъ, вермишели и лапши домашнимъ способомъ» автора А.Румянцева. Она напечатана в 1914 году изданием журнала «Домашній ремесленникъ». Для примера чистить буду только одну страницу.

Исходник в формате PDF. Имеем даже не сканы, а фотографии разворотов брошюры. Сложности в обработке вызывают неравномерное освещение страниц, искажение перспективы от съемки под углом, изгиба страниц и от объектива (дисторсия). Хуже быть не может. Это как раз то, что нам нужно!

Шаг 1. Импортируем PDF
Для начала открываем PDF файл в программе. Я использую версию CC 2015.5. Выбираем ту страницу, которая нам нужна. Не обязательно открывать все страницы, скорее всего вы не успеете обработать все за один раз. Настройки не трогаю, нажимаю ОК.
Чистка сканов
Шаг 2. Кадрируем изображение
Выбираю инструмент «Рамка» Чистка сканов и выделяю первую страницу с разворота. Нажимаю клавишу «Enter». Все что было за рамкой удаляется.

Чистка сканов
Шаг 3. Исправление перспективы
Выбираю инструмент «Кадрирование перспективы». Чистка сканов Четырьмя точками обозначаю прямоугольник текстового блока. Затем с помощью потягивания за стороны выделенной области произвольно расширяю зону выделения примерно до размера страницы. Нажимаю клавишу «Enter».
Чистка сканов

Чистка сканов
После применения изменений, очертания текстового блока приобретают прямоугольную форму. Готовый результат.
Чистка сканов
Строчки и края текстового блока могут остаться неровными. Эти искажения появляются от изгибов бумаги, зачастую у корешкового поля. Далее я постараюсь исправить все неровности текста с помощью инструмента «Деформация».

Шаг 4. Деформация изображения
Выбираю инструмент Редактирование > Трансформирование > Деформация
Чистка сканов
С помощью потягивания за опорные точки и рычаги, или же за само изображение деформирую его так, как мне нужно. Для удобства выставляю вспомогательные направляющие по краям блока. Они вытягиваются из боковой и верхней линеек. При достижении нужного результата нажимаю клавишу «Enter».
Чистка сканов
Вспомогательные направляющие можно убрать обратно в линейки. При этом на панели инструментов должен быть выбран инструмент «Перемещение» Чистка сканов

Шаг 5. Создание маски слоя с текстом
Выбираю инструмент «Прямоугольная область» Чистка сканов и выделяю текстовый блок вместе с номером страницы.
Чистка скановДалее в панели «Слои» выбираю слой с текстом и нажимаю кнопку «Добавить слой-маску»
Чистка сканов
Часть изображения, которая была за границей выделения скрылась. У слоя с текстом появится значок маски Чистка сканов

Шаг 6. Обесцвечивание текста
Для того, чтобы убрать весь цвет из текста создаю новый корректирующий слой «Черно-белое…» в панели «Слои». Чистка сканов

Затем в открывшейся панели «Свойства» нажимаю «Авто» а потом выставляю «Желтые» примерно на 200. Также можно попробовать подтянуть «Красные». Зависит от того, какого цвета бумага страницы. Делается это для высветления фона страницы и настраивается сугубо индивидуально.
Чистка сканов
Шаг 5. Создание белого фонового слоя
Далее создаю слой-заливку «Цвет…» в панели «Слои» Чистка сканов

Выбираю белый цвет (#ffffff) и располагаем слой ниже слоя с текстом.

Шаг 6. Высветление фона
Создаю новый корректирующий слой «Уровни…» в панели «Слои». Тут нужно поиграть с настройками двигая три бегунка так, чтобы в самом светлом месте фон стал абсолютно белым а буквы черными, но без сильной грязи.
Чистка сканов
Если страница сканирована/сфотографирована с неравномерной яркостью фона, то фон будет высветляться не полностью, а только пятном, и некоторые участки фона останутся темными. Не пытайтесь высветлить все за раз. Иначе в светлых участках текст будет блекнуть.

Для решения этой проблемы я буду использовать несколько дублей слоев с текстом для разных частей изображения, к каждому из которых будет привязан свой корректирующий слой-маска «Уровни» в виде обтравочной маски.

Привязываю корректирующий слой «Уровни» к слою с текстом. Для этого располагаю корректирующий слой выше, чем слой с текстом, кликаю слой «Уровни» ПКМ и выбираю «Создать обтравочную маску». Чистка сканов
Если все сделать правильно, то у слоя «Уровни» сбоку появится характерный значок со стрелкой Чистка сканов
Это означает, что этот корректирующий слой влияет только на нижележащий слой.

После этого дублирую слой с текстом и привязанный к нему корректирующий слой. Для этого выделяю оба стоя, зажимаю клавишу «Alt» и ЛКМ и тяну оба слоя в окне «Слои» вниз до изменения курсора на двойную стрелку. Затем отпускаю ЛКМ и слои дублируются.
Чистка сканов
Далее убираю видимость нижележащего слоя с текстом. Для этого нажимаю на значок глаза рядом со слоем. Корректирующий слой тоже скроется автоматически.

Переходим к вышележащему слою с текстом. Кликаем по значку маски у данного слоя.
Чистка сканов
Выбираю инструмент «Кисть» Чистка сканов (автоматически должен выставиться черный цвет т.к. выбран режим маски) и стираю кистью весь текст, вид которого меня не устраивает. Если стерли лишнее, выбираете белый цвет на панели инструментов и восстанавливаете кистью те места, которые хотите вернуть.

В этом и заключается принцип работы с маской. Черный цвет скрывает, а белый выявляет изображение. И всегда можно вернуть, то что скрыто.
Чистка сканов
Далее делаю видимым второй слой с текстом. Захожу в настойки корректирующего слоя «Уровни» (для этого дважды кликаю ЛКМ по специальному значку рядом со слоем в панели «Слои») и меняю настройки так, чтобы фон становился светлее. Тот текст, что был в самом светлом месте не будет пропадать т.к. он дублирован на вышележащем слое.
Чистка сканов
Дублирую второй слой вместе с обтравочной маской ниже и скрываю дубликат. Чтобы не запутаться в слоях, их можно переименовать так, как удобно вам.

Перехожу на второй слой с текстом в режиме маски и скрываю все темные участки текста.
Чистка сканов
Далее делаю видимым третий слой с текстом и повторяю тот же алгоритм:
1) настраиваю корректирующий слой «Уровни»
2) дублирую слой с текстом вместе с обтравочной маской и скрываю их
3) перехожу на нужный нам слой с текстом в режиме маски и скрываю темные участки
4) делаю видимым и перехожу на следующий слой с текстом

Так делается до тех пор, пока весь текст не высветлится. После окончания этих действий всегда можно вернутся к любому слою и подправить как маску, так и корректирующий слой. В конечном итоге у меня получился вот такой результат.
Чистка сканов
Шаг 7. Чистка (ретушь) текста
Когда текст высветлен и вы полностью удовлетворены результатом, необходимо объединить все слои.

После объединения изменить маски и корректирующие слои будет не возможно.

Для объединения кликаю ПКМ любой слой и выбираем во всплывающем меню «Объединить видимые». Перед этим убедитесь в том, что не осталось скрытых слоев. В итоге получился один слой с текстом.

Создаю новый слой-заливку «Цвет…» в панели «Слои». Выбираю белый цвет и располагаю его ниже слоя с текстом.

Создаю новый корректирующий слой «Уровни…» в панели «Слои» все три маркера передвигаю в крайнее правое положение. Этот слой временный и нужен для выявления всех дефектов фона.

Располагаю его выше слоя с текстом.
Чистка сканов
Далее создаю маску у слоя с текстом и выбираем на панели инструментов инструмент «Кисть» Чистка сканов

Выбираю черный цвет (он должен выставиться автоматически) и начинаю удалять все дефекты изображения. Для регулировки размера кисти кликните ПКМ на любой участок изображения и появится соответствующая панель. Жесткость советую ставить на 100%.

Если до этого во всех операциях можно было обойтись без планшета, то при ретуши добиться хорошего результата за разумное время при помощи мыши нельзя. Поэтому дальнейшая чистка производится только с помощью графического планшета.

Чищу текст построчно, чтобы не сбиться и не возвращаться к тому, что уже сделал. Чищу как снаружи, так и внутри букв, иногда прорисовываю буквы, если какая-то часть неразборчива (черное пятно).

Также иногда дублирую четкие буквы взамен нечитаемых. Но в пределах разумного.

Вообще степень очистки зависит от важности документа и вашего энтузиазма. Как говорится лучшее – враг хорошего, поэтому лучше заранее определить степень качества ретуши, иначе можно делать эту работу бесконечно долго, особенно когда у вас несколько сотен страниц.
Чистка сканов
После того как весь текст почищен удаляем корректирующий слой «Уровни» и объединяем оставшиеся слои. Сохраняем готовый документ в формате TIFF. Сохранять необходимо именно в этом формате, потому что постоянное пересохранение файла (что неизбежно) в данном формате не приводит к потере качества изображения, чего не скажешь о других форматах, например JPEG.

Шаг 8. Подгонка страниц под единый формат
При исправлении перспективы страниц неизбежно искажается соотношение сторон текстового блока.

Поэтому после всех операций все страницы брошюры получились с разным соотношением сторон.

Далее я подгоняю эти параметры под один размер.

Для того, что бы найти исходное соотношение сторон, можно сопоставить страницу с текстом с тестовым вариантом, набранным похожим шрифтом, например «Old Standard». Или же просто выбрать станицу, подходящую на ваш взгляд в качестве образца, и по ее размерам отредактировать все остальные.

Если же вы обрабатываете сканы, а не фотографии, то исправлять перспективу не требуется, так как при сканировании никаких искажений возникнуть не должно.

Также необходимо сделать у всех страниц одинаковые поля с учетом вылетов под обрезку. Размеры верхнего и нижнего поля я беру, как в оригинале, боковые поля — исходя из размеров текстового поля и самой страницы.

Все эти операции также провожу в программе «Adobe Photoshop». Создаю новый документ по размеру печатной страницы. В моем случае это 148,5*210 мм. Направляющими отмечаю границы вылетов и полей. Располагаю текстовый блок по этому шаблону и пересохраняю все страницы в новом размере.

Пронумеровываю файлы согласно номеру страницы.

На этом этапе нужно быть внимательным, так как количество строк на разных страницах может отличаться. Это нужно учитывать при расположении текстового блока относительно шаблона.

Шаг 9. Создание готового PDF файла для печати
После того, как все страницы готовы, объединяю их в PDF файл. Для этого выбираю инструмент Файл > Автоматизация > PDF-презентация…
Чистка сканов
В открывшемся окне нажимаю кнопку «Обзор…» и выбираю все файлы страниц, которые хотим поместить в документ. Нажимаю ОК. Слева появился перечень файлов в том порядке, в котором они будут располагаться в документе. Параметры вывода оставляю без изменений, нажимаю «Сохранить».
Чистка сканов
Выбираю папку для сохранения файла, нажимаю ОК. Открывается окно с параметрами сохранения PDF. Оставляю все без изменений, единственное — проверяю параметр «Качество изображения». Должно быть выбрано «Наилучшее». Нажимаю «Сохранить PDF». Автоматически начнут поочередно открываться все страницы документа. Не закрывайте программу, пока данная операция не завершится.
Чистка сканов
На этом все. В итоге я получил PDF-файл, готовый для печати.

Спасибо за внимание!

Даниил Лаврентьев
daniil_lavr@mail.ru
Архангельск
2018

Николай Кушнир

Автор и идейный вдохновитель популярного паблика "Ручной переплет, ремонт и реставрация книг" в социальной сети ВКонтакте.

Вам также может понравиться...

Добавить комментарий

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: