Синтаксический анализ (парсинг)

 

  1. Изучить материалы на странице, взглянуть на материал.

  2. Посмотреть три урока Натальи Остапук  (в 2011 году закончила кафедру прикладной и математической лингвистики СПбГУ, в Яндексе с 2010 года, занимается написанием и поддержкой формальных грамматик)

  1. Изучить материалы по Томита-парсеру:

  • О технологии,

  • Документация (Быстрый старт, Руководство),

  • Видеокурс (уже смотрели, можно с сайта)

  1. Опробовать Томита-парсер в работе, для чего:

  • скачать архив с дистрибутивом tomitaparser для Windows классе, или сайта Яндекса), распаковать в свой каталог.

  • скачать архив с примерами для tomitaparser  (в классе, или сайта Яндекса), распаковать в свой каталог.

  • в каталоге examples открыть папку tutorial1, изучить содержащиеся в ней файлы и в текстовом документе test дополнив фразу своими ФИО (см. образец, для случая Орловой) сохранить его.

  • создать каталог tomita на корневом диске D и поместить tomitaparser + 4 файла из папки tutorial1 (в том числе и отредактированный вами test). В папке tomita на корневом диске D  должно быть 5 файлов - см. образец

  • запустить консоль (Пуск/Программы/Стандартные/Командная строка). Появится окно вида

  • перейти в папку tomita на корневом диске D (для чего поочередно ввести: D: и tomita, нажимая Enter после ввода каждой команды). См. образец

  • запустить парсер, введя в консоли команду tomitaparser.exe config.proto  + Enter(см образец), парсер отработает (см. вид окна после его работы)

  • открыть каталог tomita и обнаружить в нем новые три файла (см. образец)

  • открыть PrettyOutput, насладиться полученным результатом и осознать, что это было легкое прикосновение к "настоящей  компьютерной лингвистике".

Никакие более подробные пояснения невозможны. Внимательно смотрите видео и читайте инструкции, там все изложено детально и понятно!

  1. Изучить материал (рекомендуется познакомиться с комментариями к нему), материал и страницу проекта.

  2. На демонстрационном стенде проверить отработку стандартных правил извлечения фактов из текста. Ввести свой авторский текст (должен включать Ваши ФИО и избранные Вами (произвольные) адреса в двух городах. Осуществить его обработку, сделать скрин результата (согласно образца) в формате PNG под именем Фамилия-Н

  3. Заполнить и отослать анкету

  4. Отослать остальные 7 файлов преподавателю в письме с отзывом и подтверждением выполнения анкеты.

  5. Удалить из каталога tomita программу tomitaparser

  6. Удалить каталог tomita с диска D: и почистить свои файлы на компьютере в учебном классе.

  7. Знать изученные материалы )

 

 

kmp