Языковая политика
		Общие обсуждения => Компьютеры и интернет => Topic started by: Tanuki-san on 24 May 2021, 11:55:18
		
			
			- 
				Нашёл замечательную программу PDFX-Editor, которая позволяет исправлять текст в pdf! Я с настоящим остервенением стал исправлять свои языковые учебники с опечатками, которые меня давно раздражали. Особо много у меня злости по отношению к классическому самоучителю итальянского Добровольской, переизданному в 2005. Мразотина (нет лучше слов), которая издавала учебник, похоже просто пропустила сканы через FineReader - "и так сойдёт" - в результате в книге навалом "г" вместо "r" или "д" вместо "g", не говоря уже про "i" вместо "l" и т.д.
 
 Но я столкнулся с другой проблемой: есть пдф, где распознанный текст и сам текст - одно и тоже, они исправляются прекрасно, но есть такие, где распознанный текст - отдельным слоем, который участвует только в поиске, а само изображение - вроде картинки. В пдфках второго типа исправления остаются только в распознанном слое, а сам пдф так и остаётся с ошибками. Есть какой-то способ заменить "картинку" распознанным текстом? :-\
- 
				Есть какой-то способ заменить "картинку" распознанным текстом? А если просто удалить картинку, то под ней текста не будет?
- 
				Если не получится, то можно прислать какой-то примерчик? Видел такие pdf-ки, но сейчас под рукой нет...
			
- 
				Есть какой-то способ заменить "картинку" распознанным текстом? А если просто удалить картинку, то под ней текста не будет?
 
 там не "картинка", я просто назвал так - там векторное изображение сканированного текста. Можно ли удалить это? Скорее всего да, но это не решит проблему, так как эта картинка и ОСR находятся в разных слоях, и такой пдф просто будет выглядеть пустым при просмотре. Распознанный ОСR находится в каком-то служебном слое, который обычные просматривали не показывают, он только доступен для функции поиска.
- 
				 там не "картинка", я просто назвал так - там векторное изображение сканированного текста. Хмм, а такого вот даже и не видел. Интересно посмотреть.Распознанный ОСR находится в каком-то служебном слое, который обычные просматривали не показывают, он только доступен для функции поиска. Думаю, возможно будет перенести этот текст на обычный видимый слой.
 
- 
				PDFX-Editor, которая позволяет исправлять текст в pdf! Кстати, конкретно этот редактор в гугле не могу найти. Хотя в принципе можно с торрентов скачать крякнутый Acrobat Pro, там должны быть все нужные функции.