Генеральный интернет-корпус русского языка

 

 Для выполнения работы необходим доступ в Интернет

Интернет как корпус – новый семинар в серии ABBYY Open

 

  • Интернет-корпус русского языка университета Лидс (Великобритания)

http://corpus.leeds.ac.uk/ruscorpora.html

 

 

 
  1. Создать документ ФамилияГИК

  2. Познакомиться с  ресурсом (О проекте, Корпус, Скачать, Публикации, Коллектив, Смежные проекты) и заполнить в  ФамилияГИК Таблицу:

Вопрос

Ответ

Фамилия Имя Отчество

Ваши собственные

как связана разметка сущностей с конференцией по компьютерной лингвистике Диалог

Правильный ответ

в чем состоит выделение именованных сущностей

Правильный ответ

что будет следующими этапами разметки коллекции текстов для factRuEval

  • первый этап

  • второй этап

  • третий этап

Вы примите участие в разметке сущностей?

:)

Ваш умный вопрос по разметке Открытого Корпуса

 

 

  1. Познакомиться с ресурсом (внимание разделу: Инструкция по определению именованных сущностей) и выполнить тест

  2. Осознать всю полноту ответственности за свою работу в команде УО "Брестский государственный университет имени А.С. Пушкина", представляющей и Брест, и Беларусь.

  3. Выбрать в разделе Разметка подраздел Сущности, выбрать проблемное поле Персоны и конкретный текст (Размечать), еще раз просмотреть инструкцию (открыв ссылку в новой вкладке) и аккуратно осуществить разметку.

  4. Сделать (с помощью Ножниц) скрин одного из размеченных абзацев, рукописно подписать его своей Фамилией (образец для Орловой) и сохранить в формате PNG под именем Фамилия-сущности.

  5. В разделе Скачать познакомиться с материалами вкладок Скачать и Форматы экспорта

  6. Скачать Подкорпус со снятой омонимией без UNKN, XML  .zip и Распаковать его. Открыть находившийся в архиве файл annot.opcorpora.no_ambig_strict поочередно с помощью 1) Блокнота и 2) программы XML_Notepad (ее также нужно предварительно распаковать, файл открывать через программу  - File \ Open).

  7. В XML_Notepad для текста, который соответствует Вашему номеру в зачетной таблице открыть все вложенные каталоги, изучить полученную структуру и содержание и сделав скрин (с помощью Ножниц) подписать его своим номерм в зачетной таблице, Фамилией и Именем (образец для Орловой Евы под номером 15). Сохранить скрин как PNG-файл под именем Фамилия-XML.

  8. Установив в подразделе Частотные списки "все" для типа n-гамм, учета регистра и токенов скачать zip-архив списка, который соответствует Вашему номеру в зачетной таблице (их всего должно быть 16) и распаковать его. Поочередно открыть находящийся в архиве файл в Блокноте, Excel, Word, браузере... каждый раз делая подписанный Вашей Фамилией скрин фрагмента и сохраняя его в формате PNG под именами: Фамилия-Блокнот, Фамилия-Excel, Фамилия-Word, Фамилия-Chrome.

  9. Познакомиться с материалами разделов Разметка, Словарь, Статистика, Скачать, О проекте, Бейджи.

  10. Выбрать в разделе Разметка подраздел Морфология и самое простое задание (зеленая звездочка), познакомиться с инструкцией (открыв ссылку в новой вкладке) и осуществить простейшую разметку (просите еще примеров, чтобы завершить работу на этом уровне - простейшие задания с зеленой звездочкой станут для Вас, с Вашим опытом (!) недоступны).

  11. Предварительно познакомившись с инструкциями продолжить разметку на следующем уровне (желтые звездочки) до получения третьего бейджа. Получив третий бейдж, сделать скрин и подписав его  1) своими  Фамилией Именем; 2) логином (в учетной записи) - см. образец для случая Орловой Евы Адамовны - сохранить под именем Фамилия3

  12. Получить четвертый бейдж, сделать скрин и подписав его  1) своими  Фамилией Именем; 2) логином (в учетной записи) - см. образец для случая Орловой Евы Адамовны - сохранить под именем Фамилия4.

  13. Перейдя на "Мои бейджи" посомтреть результат, перейти на вкладку "Мои ответы", сделать скрин  (см. образец) и сохранить под именем Фамилия5.

  14. Отослать преподавателю письмо с отзывом, подтверждением выполнения теста и пятью файлами со скринами

  15. На вкладке "О проекте" перейти к разделу Участники, к пункту - Благодарности и, далее, по ссылке всем. Найти себя в списке  порадоваться тому, что жизнь удалась.

  16. Найти, там же, команду БрГУ имени А.С. Пушкина и, ощутив ответственность за ее продвижение в рейтинге команд, продолжить разметку самостоятельно ...

 

 

Тым часам слоўнік для праверкі беларускамоўнай арфаграфіі ў Microsoft Office 2007-2016
даступны для скачвання на сайце «Беларускі N-корпус».

 

kmp