Корпусное лингвистическое моделирование

 

 Для выполнения работы необходим доступ в Интернет

 

 
  1. Создать документ Фамилия-Корпус формата А3 (чтобы все скриншоты были хорошо читаемы), заполнить его метаданные по образцу

  2. Познакомиться сайтом НКРЯ (новости проекта, о проекте, участники проекта, программные средства, ошибки в корпусе, использование корпуса, другие корпуса).

  3. Посмотреть  видео в классе (в Сети здесь) о консольном морфологическом анализаторе Mystem 3.0 (выступление Алексея Зонбина + ответы на вопросы). В Сети здесь

  1. Познакомиться на сайте с документацией по Mystem 3.0 (использование, примеры вызова, расшифровка граммем)
    Полезно почитать о принципах работы программы)

    Mystem - консольное приложение — программа, предназначенная для работы в окне DOS в режиме отображения символьной информации

    Mystem -  не для рядового пользователя эпохи графических интерфейсов, но можно попробовать работать с ней самостоятельно

    Для примера, в Windows консоль можно запустить так: Пуск -> Программы -> Стандартные -> Командная строка .... и попробовать ввести команды date и time

  1. В документе Фамилия-Корпус (формата А3!) заполнить Таблицу вида:

вопрос

ответ

Фамилия Имя Отчество

 

Избранная Вами новость из рубрики "Новости проекта" (с главной страницы)

 

Известные Вам сотрудники проекта

перечень ФИО тех, кого знаете (читали, слушали, смотрели, ...)

Создатели программы Mystem

  • ....

  • ....

Что за книжку показывал слушателям Алексей Зобнин в  видео

  • название книги

  • автор книги

  • области применения книги

На каких алгоритмах основано снятие омонимии  и какое отношение к этому имеет А.А. Марков

 

 

  1. Руководствуясь Инструкцией произвести поиск в основном корпусе НКРЯ  своего Имени (следует использовать старую поисковую систему, т.к в новой не дает статистику по метаатрибутам), изучить результат и вставить подписанные Фамилией скриншоты в Фамилия-Корпус в соответствии с образцами (следует использовать старую поисковую систему, т.к в новой не дает статистику по метаатрибутам):

  • образец1

  • образец2 - для распределения вхождений Имени по годам (например с 1991), в т.ч. с табличным вариантом;

  • образец3 и образец4 - статистика вхождений по метаданным

  1. В документе  Фамилия-Корпус под скриншотами сделать умный вывод на основании полученных результатов.

  2. Изучая графики распределения частотности слов с 1800 по 2016 год (полезно посмотреть распределение частотности по разным подкорпусам) и заполнить в таблицу вида:

слово

Ваша интерпретация (объяснение) результата

радость

 

доблесть

 

ваше слово

 

ваше слово

 

искусственный интеллект

 

виртуальная реальность

 

ваше словосочетание (биграмма)

 

ваше словосочетание (биграмма)

 

 

  1. Познакомиться со интервью с Рахилиной Е. В. (обратить внимание на очеловечивание (перемены в особенностях словоупотребления) глаголов "грузить" и "тормозить"). kmp рекомендует для самостоятельного просмотра лекцию
    Познакомиться с докладом на конференции Диалог (обратить внимание на перемены в особенностях словоупотребления) преимущественно субъектного предикатов "нужно" и преимущественно безличного "надо"). 
    Познакомиться с докладом на конференции Диалог Беликова В.И. (обратить внимание на очеловечивание (перемены в особенностях словоупотребления) глагола "реагировать"). kmp рекомендует для самостоятельного просмотра лекцию
    На материале НКРЯ получить графики распределения частотность в для коллокаций: "она лишилась чувств", "она потеряла сознание", "она отключилась" (держим в уме: барышни лишались чувств, девицы теряли сознание, ... отключаются). 
    Познакомиться с материалами на странице, обратить внимание на модель
    "Киберперсонализация?" и подумать о том, кого эффективнее было бы учить машине: человека или машину.
    В документе
     Фамилия-Корпус заполнить Таблицу:

  1. Познакомиться с перечнем перечнем других корпусов, посетить некоторые из них и в Фамилия-Корпус заполнить таблицу вида:

 

слово

Ваша интерпретация (объяснение) результата

она лишилась чувств

 

она потеряла сознание

 

она отключилась

 

ваше словосочетание (биграмма)

 

ваше словосочетание (биграмма)

 

 

Избрать на странице корпус (кроме перечисленных в Таблицу), убедиться в его работоспособности и доступности.

  1. Придумать и выполнить для избранного Вами корпуса учебное задание, проверяемое подписанным Фамилией скриншотом, заполнить в Фамилия-Корпус  таблицу вида:

Задание

Ответ

Фамилия Имя Отчество

 

Название корпуса

 

Прямая ссылка на корпус

 

Краткое описание корпуса

что такое,

сколько размечено текстов,

состав словаря,

число и суть шагов осуществления морфологической разметки

Формулировка задания для работы с корпусом

цель создания,

кем поддерживается,

избранная публикация

Описание алгоритма выполнения задания

 

 

  1. В документ Фамилия-Корпус вставить скриншот-образец выполнения задания с Вашей Фамилией.

  2. Сохранить документ Фамилия-Корпус (формата A3) и отослать вместе с паролем и отзывом (строго по форме)

 

kmp