Оценочное тестирование N-корпуса

 

Провести самостоятельное (ну, почти) оценочное тестирование Белорусского N-корпуса:

  • признавая уникальность и полезность данной разработки, значимый и достойный уважения вклад разработчиков в развитие корпусной лингвистики

  • принимая во внимание свою неспособность (по крайней мете, в настоящее время) сделать что-то подобное и лучшее

  • учитывая, что выражение "оценочное тестирование" используется в данной работе метафорически и вне терминосистемы QA (Quality Assurance)

  • знакомясь с общей архитектурой (структурой) и типичным инструментарием лингвистических (текстовых) корпусов

  • открывая для себя способы возможного применения и описания лингвистических корпусов

  • обобщая получаемый опыт на произвольные компьютерные лингвистические сервисы, системы и службы

  • в целях обретения способности без подготовки эффективно решать любые неожиданные проблемы ... (что прямо определяется уровнем самостоятельности в выборе критериев, постановке вопросом и подборе инструментов для поиска ответов)

и сделать итоговое заключение ))

 

 

 

 

  1. Создать документ Фамилия-NC (лучше в редакторе Мой Офис (должен быть установлен в 18-й и, возможно, в 14-й... если нет, то в сетевой версии прямо в браузере здесь)

  2. Повторить дефиницию лингвистического корпуса на странице, выделить его основные структурные компоненты (на основе этой структуры будет осуществляться оценочное тестирование

  3. Протестировать репрезентативность Белорусского N-корпуса, описать алгоритм проверки в Фамилия-NC и сделать вывод, в котом указать языковой объект, которому он может быть репрезентативен и, оценочно, уровень этой репрезентативности (в %), для чего:

    • изучить состав корпуса (на главной странице): сколько и каких текстов содержит
      Сделать вывод в Фамилия-NC о том, корпусом чего именно он (оценочно, предположительно) является (подсказка)

    • познакомиться с презентацией Беларускі N-корпус: гісторыя і перспектывы (в рамках полнения задания 1-2 минуты) и его разработчиками (). В Фамилия-NC оценить уровень презентации и её популярность среди пользователей (отметив текущие дату, время и число просмотров). Вставить в Фамилия-NC подписанные вашей Фамилией скрины разработчиков (Uladzimir Koščanka (Уладзімір Кошчанка), Aleś Bułojčyk (Алесь Булойчы). Можно взглянуть на страничку проекта и оценить число подписчиков.

    • на сайте сделать запросы "N-корпус" "Belarusian N-Korpus" и (проанализировав полученные результаты) в Фамилия-NC оценить востребованность корпуса в научном дискурсе

    • осуществить в N-корпусе поиск слова "Беларусь" (отдельно: лексемы в основной форме и всех словоформ, что задается настройками) за последние 5 лет. Проверить (для сравнения) число включений слова "Россия" в НКРЯ за последние 5 лет (масштабировать на 5 лет, подписать своей Фамилией и вставить в Фамилия-NC. Описать и оценить в Фамилия-NC полученные результаты (подсказка).

    • предложить своё слово (вместо Беларусь) и повторить для него поиск, описать и оценить в Фамилия-NC полученные результаты.

    • осуществить поиск слова "N-корпус" в англоязычном, русскоязычном и двух белорусских языковых разделах Wikipedia. Описать и оценить в Фамилия-NC полученные результаты (подсказка). Проверить (для сравнения) число включений слова "Россия" в НКРЯ за последние 5 лет (масштабировать на 5 лет, подписать своей Фамилией и вставить в Фамилия-NC. Описать и оценить в Фамилия-NC полученные результаты (подсказка).

    • осуществить поиск слова "N-корпус" в Белорусском N-корпусе. Описать и оценить в Фамилия-NC полученные результаты

    • ....

  4. Протестировать доступность электронных текстов, входящих в состав Белорусского N-корпуса, описать алгоритм проверки в Фамилия-NC и сделать вывод ...

    • узнать в Белорусском N-корпусе текстовые источники найденной лексемы "Беларусь" (авторов и названия произведений), найти эти произведения, в Фамилия-NC дать на них прямые ссылки м сделать вывод о доступности электронных текстов

    • узнать в Белорусском N-корпусе текстовые источники предложенной вами (авторов и названия произведений), найти эти произведения, в Фамилия-NC дать на них прямые ссылки

    • сделать в Фамилия-NC вывод о доступности электронных текстов корпуса

  5. Протестировать разметку корпуса: её наличие и функциональность (реализуемую на основе корпусного движка), описать алгоритм проверки в Фамилия-NC и сделать вывод ...

    • Осуществить в Белорусском N-корпусе грамматический поиск:

      • слова "тры" (як дзеяслова (глагола) i як лiчэбнiка (числительного)

      • вашего слова, требующего грамматической настройки

      • вашего слова,  требующего грамматической настройки

    • Описать алгоритмы и результаты проведенного поиска (ка каждому из слов) в  Фамилия-NC. Сделать вывод о возможности просмотра грамматической информации (подсказка) и её практической реализации в поиске (подсказка)

  6. Познакомиться с лицензией корпусного движка. В  Фамилия-NC сделать вывод и описать свободы предоставляемые лицензией.

  7. На страничке оценить пользовательские характеристики движка (его доступность (100%, 51,4 MB), документированность, популярность). В Фамилия-NC сделать вывод. Заполнить и отослать форму и продублировать свой ответ в Фамилия-NC с

  8. Сделать общий вывод в Фамилия-NC (подсказка)

  9. Отослать преподавателю pdf-документ Фамилия-NC

 

 

kmp