Техническое задание: Парсинг контактных данных

Цель проекта

Разработать программное решение для автоматического сбора контактных телефонных номеров с предоставленного списка веб-сайтов.

Основные задачи

  • Реализовать обход заданного списка URL-адресов.
  • Проанализировать HTML-код каждой страницы для поиска номеров телефонов.
  • Извлечь найденные контактные данные, обеспечив их корректность и уникальность.
  • Структурировать и сохранить полученную информацию в удобном формате (например, CSV или JSON).

Требования к реализации

  • Решение должно быть устойчивым к различной структуре веб-страниц.
  • Необходимо предусмотреть обработку ошибок (недоступность сайта, изменения в верстке).
  • Код должен быть чистым, документированным и готовым к передаче.

Ожидаемый результат

Готовый скрипт или программа, которая по списку сайтов возвращает структурированный файл с извлеченными номерами телефонов.

Разработка дизайна многостраничного сайта для медицинского лабораторного сервиса

Требуется разработать дизайн сайта для медицинской лаборатории в соответствии с предоставленным гайдлайном. Пользователи смогут выбирать анализы, составлять заказ, оплачивать онлайн и выбирать пункт для сдачи биоматериала.

Разработка статистического машинного переводчика на Python

Требуется создать систему статистического машинного перевода (SMT), которая обучится на параллельных англо-русских текстовых корпусах. Задача включает реализацию алгоритмов обучения и перевода на чистом Python.