Описание задачи

Необходимо выполнить корректировку нескольких документов, скачанных из открытых источников. В ходе загрузки в них попали лишние символы и невидимые знаки (служебные символы, скрытые разрывы, некорректные пробелы и пр.).

Требования к работе

  • Удалить все лишние символы и скрытые невидимые знаки.
  • Исправить грамматические и орфографические ошибки.
  • Привести оформление документов в соответствие требованиям ГОСТ (шрифты, отступы, форматирование заголовков, нумерация, поля и т.д.).
  • Соблюсти единообразие оформления во всех предоставленных документах.

Формат сдачи

Готовые файлы в формате .docx.

Семантический анализ философских текстов с построением бинарной матрицы

Требуется разработать скрипт на Python для обработки корпуса текстов восточных мыслителей. Задача включает очистку и лемматизацию текстов на русском языке, сегментацию на смысловые блоки и семантическое сопоставление с ключевыми словами. Результат - бинарная матрица в формате CSV.