Техническое задание: Конвертер DOCX в HTML

Цель проекта

Разработать программное решение для автоматического преобразования документов формата DOCX в HTML-файлы с сохранением базового форматирования и структуры исходных документов.

Ключевые функциональные требования

Основные возможности конвертера

  • Преобразование файлов .docx в валидный HTML-код.
  • Сохранение ключевых элементов структуры документа: заголовков (h1-h6), списков (нумерованных и маркированных), таблиц.
  • Применение инлайновых стилей (inline styles) для базовой типографики: жирность, курсив, выравнивание, отступы, шрифты.
  • Поддержка изображений: конвертация картинок из документа в формат Data URI для их встраивания непосредственно в HTML-код.
  • Пакетная обработка: возможность указать целевую папку, все файлы .docx в которой должны быть обработаны автоматически.
  • Формирование отчёта о процессе конвертации (логирование успешных и неудачных операций).

Требования к реализации

  • Решение должно быть готово к использованию (standalone).
  • Код должен быть чистым, документированным и поддерживаемым.
  • Желательна возможность запуска из командной строки с передачей параметров (путь к папке).

Ожидаемый результат

На выходе - набор HTML-файлов, визуально и структурно соответствующих исходным документам DOCX, с изображениями, встроенными в код, и подробный отчёт о выполненной работе.