Конвертация PDF в Word проще простого. | MalinaLime

Конвертировать PDF в Word

Конвертация PDF в Word

Под этим термином подразумевается перенос данных, содержащихся в исходном файле в полноценный, редактируемый текст Word. Под привычным названием Word подразумеваем любой идентичный ему редактор, например, бесплатный  Writer от Libre Offiсe. Конвертация из Word в PDF как правило  понятна. Эта функция встроена в текстовые редакторы и не вызывает нареканий. Перевести же файл из PDF в Word бывает практически невозможно.

С конвертацией «простых» файлов PDF, данные которых полностью состоят из текста, как правило ничего сложного. Примером такого файла может быть PDF, созданный из текстовых данных, непосредственно в редакторе типа Word.
Вот несколько вариантов конвертирования, первые два способа применимы offline:

Третий — отличный способ online конвертирования:

А вот как перевести «сложный», состоящий из комбинированных данных файл PDF в Word ? Такие файлы встречаются не редко. И именно с ними возникают трудности. Предыдущие способы тут совершенно не годятся. Изображение, входящее в состав сложного файла никак не редактируется вместе с текстом. Вот пример сложного файла:


Задача — преобразовать все данные исходного файла в полноценный, редактируемый текстовый файл формата Word. Есть два реальных, неплохих online способа решения этой задачи:

Пожалуй, с них, как с наиболее интересных, и начнем.

PDF в Word онлайн конвертером Convertio

Пробуем «Способ распознать текст на изображении:» , описанный в предыдущей публикации: Сделать текст изображением… Напомню, что мы пользовались онлайн конвертером с созвучным названием Convertio. Там все просто. Заходим на сайт (это ссылка именно на нужную страницу), загружаем наш файл и включаем преобразование. Вот сразу результат!

результат после конвертации pdf в Word

Как сделать скриншот страницы, которая не помещается на экране ноутбука можете посмотреть здесь.

Абсолютно все содержимое исходного файла перенесено из пдф в ворд. Текст прекрасно редактируется. Есть и ошибки преобразования.

  1. Видно, например, что вместо исходного слова РЯЗАНЬ получилось РЯЗАНВ.
  2. Часть текста распознана в виде таблицы.

Но в целом, задача неплохо решена! Хочется только обратить внимание на две детали.

  • Первое, это то, что не всякий раз, когда требуется перевести PDF в Word конвертер поступает именно так, как нужно. Иногда он пытается упростить задачу, и по умолчанию делает тот же вариант, что и Adobe Acrobat DC при переводе в Word. В итоговом файле получается картинка плюс текст, а не сплошной текст.Помогает перезагрузка страницы браузера. Хорошим знаком того, что Convertio понял, чего Вы от него хотите будет вот такое сообщение после того, как Вы загрузите в него нужный файл:

Сообщение о распознавании текста с PDF

  • Второе. Количество бесплатных преобразований из пдф в ворд ограничено десятью файлами в день. Проще всего оплатить, особенно, если пользуетесь этой функцией часто. Есть разные тарифные планы. Ну а если не часто, то очень просто, очистить в своем браузере cookie, сменить IP адрес.  Потом перезагрузить страницу сайта и продолжить работу со следующим десятком документов.

Периодически, по мере сил и возможности проверяю сервисы, которые рекомендую в статьях. На февраль 2019 года Convertio в тестовом (бесплатном) режиме работает довольно неплохо.

PDF в Word онлайн конвертером docs.zone

На февраль 2019 года docs.zone при окончании конвертации дает скачать результат без регистрации и подписки на платный тариф в 20$  за год без ограничений по количеству документов. Пользуйтесь!

Наиболее мощный алгоритм в этом конвертере OCR, его и выбираем. Или сразу переходите по этой ссылке.

Загружаем наш сложный файл. Не обращаем внимание на назойливые предложения зарегестрироваться, включаем преобразование. Вот такой получился результат.

После конвертации из пдф в ворд в zone.docs


Можно сказать, что идеально.

  1. Ошибок не нашел, может Вы заметили?
  2. В отличии от Convertio никаких таблиц вместо текста. Кроме того, платный тариф навязывают, но не требуют. Пользоваться можно без ограничений по времени и количеству документов.

Можно сказать, что оба онлайн конвертера с задачей справились. Они сохраняют формат текста. Они умеют распознавать изображение как текст. У Convertio присутствуют ошибки. Задача перевода PDF в Word выполнена. Твердая четверка для Convertio и похоже, пятерка с плюсом для docs.zone.

PDF в Word в бесплатном Adobe Reader

Сначала попробуем, что получится при попытке конвертировать наш сложный исходник из pdf  в Word. Начинаем с самого простого действия. Открываем файл, далее, нажимаем: «Файл», затем «Сохранить как другой…», выбираем «Текст…».

Вот результат. Собственно, что просили, то и получили. Сохранился только текст, который был заполнен на бланке — картинке:

Если  мы в качестве конвертируемого файла возьмем простой pdf, в котором данные представлены в виде текста, то результат получится такой же. Текст в формате .txt, его можно скопировать, перенести в Word или Libre Office, но в любом случае, все фрматирование при этом утрачивается безвозвратно.

Пробуем следующий шаг. Все как и в первом случае, только вместо «Текст» выбираем «Word или Exel онлайн…». Звучит, по крайней мере оптимистично.

При клике на это поле открывается окно браузера с удивительно наивным предложением заплатить 966 рублей в месяц за платную версию. Хорошо, что при этом есть возможность бесплатной тестовой версии в течении 7 дней.

Ну что же, начинаем установку тестовой семидневки. Не буду описывать довольно стандартную и понятную процедуру. Скажу только, что времени ушло изрядно. Дважды потребовалось регистрироваться. Сначала на сайте, просто для того, чтобы скачать установочный файл. Повторно пришлось вводить свои данные уже после установки, или на финальной ее стадии, если быть точным. Установка программы тоже время заняла немало. Не засекал, так как занимался другой работой, но периодически с любопытством поглядывал на прогресс-бар в ожидании успеха.

PDF в Word в платном Adobe Acrobat DC

Итак, платная (7-и дневная тестовая) версия Adobe Acrobat DC установлена.

Пробуем. Открываем наш исходный файл «Сообщение о наличии объектов недвижимого имущества». Кликаем «Файл», затем «Экспорт в», далее, «Microsoft Word”. Отлично! Видим на выбор два варианта: «Документ Word» и «Документ Word 97-2003».

Начнем с первого.

Вот такой результат получился после попытки перевести pdf в Word:

Изображение из исходного документа так и осталось изображением. Видите, значёк «якорь» слева? Практически все данные, как были картинкой формата пдф, так и остались картинкой, которую мы не можем редактировать как текст, только теперь она вставлена в документ ворд. И только те данные, что были изначально в виде текста конвертированы как полноценный текст, который можно редактировать. Форматирование текстовых данных сохранилось.

Пробуем вариант с «Документ Word 97-2003».


Только текст. То же самое , что получилось после попытки конвертации в  Adobe Reader.

Конвертация из PDF в Word в Google Drive

Нельзя не напомнить, что в сервисе Google Drive легко организована конвертация из pdf в Word. Правда, чтобы пользоваться этим сервисом необходимо иметь свой аккаунт в Google, создать который супер просто. У кого учетная запись уже есть, то сразу сюда: https://drive.google.com/

Для преобразования файла достаточно зайти в Google Drive, нажать кнопку «Загрузить», в открывающемся меню выбрать опцию «Загрузить файлы».

После загрузки файла с форматом pdf кликаете по нему правой кнопкой мыши, и из предложенных действий выбираете «Открыть с помощью», и «Google документы». Собственно, все, как только документ открылся, он преобразован.

Осталось его сохранить в нужном нам формате. Нажимаем кнопку «Файл», затем «Скачать как» , выбираем «Документ Word». Пожалуй, это самый простой способ.

Правда, наш тестовый сложный файл, после того как был загружен и открыт с помощью Google Документов перенес в документ только ту часть данных, которая изначально была текстом. Часть данных бывшая изображением не перенесена вообще. То есть получился все тот же вариант, что и в pdf в Word в бесплатном Adobe Reader.

Подводим итог:

Для самых сложных случаев,  файлов, состоящих из комбинированных данных,  можно пользоваться отличным онлайн сервисом docs.zone или Convertio, который чуть похуже, но тоже работает.

Не могу однозначно сказать , что Convertio совсем плох, возможно качество результата в том числе зависит и от исходного документа. В нашем примере на тестовом документе Convertio явно проиграл.

Для повседневного использования в онлайн режиме отлично подходит Google Drive. Основные плюсы по сравнению с Adobe:

  • Не требуется установка дополнительных программ.
  • Бесплатно, без каких либо ограничений.
  • Подходит для большинства конвертируемых файлов.

А у Вас есть другие идеи по преобразованию PDF в Word?

Добавить комментарий

Войти с помощью: 
Закрыть меню