При конвертации в PDF получается много картинок (каждая страница: отдельный графический экземпляр), но кроме картинок в PDF можно насовать очень много всего, в том числе текстовый слой, скрипты, аннотации, примечания и туеву хучу служебной информации, которую потом и юзают разные программы, которые этот файл создавали или умеют работать с данными в PDF, которые создавшая программа в них насовала.
И структура документа Word (то есть разметка в RTF, XML или каком-то внутреннем формате): это самое малое, что Word мог туда напихать.