Текущий статус

Сделано:

  • Тестирование объектной модели (scaffold через views), отладка
  • Загрузка файла на сервер (на диск)
  • Чтение из файла с диска
  • Разделение файла на строчки
  • Разделение строчки на буквы
  • Выделение пар гласных

Задачи на следующий раз:

  • Описать в виде диаграммы распознавание слогов
  • Реализовать распознавание дифтонгов
  • Реализовать распознавание позиционных дифтонгов
  • Реализовать распознавание позиционного гласного
  • Сделать заглушку на проверку приставки в начале слова
  • Реализовать обработку знаков препинания

Задачи на через раз:

  • Реализовать выделение приставок
  • Начать реализацию определения долготы слога

Задачи на через-пару-раз:

  • Описание частей приложения в вики

Текущий статус: 2 комментария

  1. Знаки препинания для метрики не важны, они просто игнорируются. Из всех знаков не_букв и не_пробелов важна, пожалуй, только т.н. «трема», которая в печатном тексте выглядит, как точки над нашим «ё». Она означает, что две гласных, в обычном случае представляющие дифтонг, в данном случае читаются раздельно. Т.е. ае=[ай], аё=[аэ]. В техническом формате латинского электронного тезауруса, из которого мы, по видимому, и будем брать тексты, трема обозначается знаком «+». Таким образом, aera=[айра], a+еra=[аэра].

  2. Ок. По поводу знаков препинания — хорошо потому, что мне пришлось бы добавлять лишний столбец в базу данных.
    Трему — учту.

Добавить комментарий