Техническое задание: Сбор лексической базы данных
Цель проекта
Создание структурированной базы английских слов, сгруппированных по тематическим категориям, с обязательным переводом на русский язык и транскрипцией.
Основные требования
Структура данных:
- Всего 33 категории (тематические группы слов).
- В каждой категории должно быть более 1000 слов одной тематики.
- Допускается меньшее количество слов только для узких категорий (например, фрукты, овощи, цвета) по согласованию.
Качество и правила отбора слов:
- Слова должны строго соответствовать тематике категории. Например, для категории "Цвета" недопустимы слова вроде "яблочный".
- Одно слово может принадлежать нескольким категориям (например, "apple" - это и еда, и фрукт).
- Не включать слова, не имеющие перевода (артикли, предлоги и т.д.).
Формат выходных файлов:
- Каждая категория сдается в отдельном файле формата .CSV.
- Структура строки в файле: категория, английское слово, русский перевод, транскрипция английского слова русскими буквами.
- Пример строки: food, apple, яблоко, эпл
Ожидаемый результат
33 CSV-файла, каждый из которых содержит корректный, тематически выверенный список слов с полной языковой информацией, готовый к использованию в образовательных или IT-проектах.