Вопрос по docx, c++, file-io, ms-word – Чтение .docx в C ++

4

Я пытаюсь создать программу, которая читает файл .docx и публикует его содержимое в блоге / форуме для личного использования. Наконец-то я понял, как использовать libcurl, чтобы сделать то, что я понял, было самой сложной частью программы. Теперь я просто должен прочитать файл .docx, но попал под затруднение. Я не могу найти какую-либо документацию о том, как это сделать. Есть идеи?

Ваш Ответ

2   ответа
7

Самый простой способ - использовать Word для этого. У него есть ограничения на лицензирование.

ТАК вопросСоздание, открытие и печать текстового файла из C ++ имеет несколько хороших ссылок.

Edit:

В соответствии с этими вопросами / ответами можно разархивировать файл Open XML и напрямую обработать файл XML:

Если вы используете .NET, есть еще (C #) вопросы для чтения:

Я изучал это, но, поскольку .docx - это открытый XML, я подумал, что можно было бы обойтись без слов. mcFreid
1

Если вы хотите остаться в мире открытого исходного кода, OpenOffice 3 должен иметь возможность обрабатывать файлы .docx. Существует проект по реализации API для многих языков, я действительно не знаю, насколько он полон или сложен.

Eстьскрипт в PHP, который может конвертировать из .docx в обычный текст. То есть если вам не страшно, что все документы на русском языке). Это может быть другой вариант (запуск сценария php с помощью системного вызова и анализ результатов из файла)

Похожие вопросы