Корпусная лексикография

 В.А. Плунгян

  • Запомните единственное: теперь для овладения языком человеку нужны не две, а три вещи:
    словарь, грамматика и корпус текстов данного языка.

  • Потому что и словарь, и грамматика, в общем-то, бесполезны вне этого живого пространства,
    где язык, собственно, и функционирует.

  • Более того, и словари и грамматики теперь нужны не традиционные, а нового поколения,
    словари такого-то корпуса и грамматики такого-то корпуса
    .

 

 

  1. Создать документ ФамилияDict

  2. Познакомившись с материалом A year of ‘permacrisis’  и  материалом, заполнить в документе  таблицу:

Исследование Ваше доверие результатам исследования

Какие "финалисты слова года" и как часто вам встречались в 2022 году

перечень и частота встречавшихся

Чем вы можете объяснить такой результат

ваше объяснение

Ваше (разумное!) предложение слова 2022 года

одно слово, на любом языке )

Сколько слов в Collins Corpus

 

 Что является истоником всех примеров в COBUILD

 

Что и почему изменилось с 2005 года в использовании слова cloud

 

  1. На сервисе  проверить частотность предложенного вами слова (с оптимальными настройками региона, времени, категорий) и вставить, подписанный Фамилией скрин в документ ФамилияDict

  2. На сервисе  проверить частотность слова permacrisis (по всему миру/за 12 месяцев/все категории) и вставить, подписанный Фамилией скрин в документ ФамилияDict Объяснить в документе ФамилияDict полученный результат (подсказка).

  3. Познакомиться с Корпусным словарем неоднословных лексических единиц (оборотов) и на его основе составить 5 индивидуальных заданий тестового характера для формирования навыков написания конкретного производного предлога (предлог получить от преподавателя или, по его решению, выбрать самостоятельно) по алгоритму:

  • выбираем ОБОРОТЫ В ФУНКЦИИ ПРЕДЛОГА, затем

  • в списке находим нужный предлог (например, "в зачет"),

  • нажимаем на ссылку

  • получаем результат: 72 документа и 90 примеров.

  • выбираем понравившиеся примеры и составляем тестовое задание.

  • описываем все 5 заданий в документе ФамилияDict

  1. Познакомиться с ресурсом, размещенными там словарями, правилами их использования и возможностями

  2. На материале частотнымого спискка лемм в Частотном словаре современного русского языка (НКРЯ) осуществить семантическую интерпретацию частотной сочетаемости пар избранных слов (близости слов в частотном словаре)

Для выполнения работы данного творческого задания следует принять во внимание:

  • Частотную сочетаемость необходимо отличать от статистической сочетаемости (как фундаментального свойства языковых единиц сочетаться в речи при образовании единиц более высокого уровня, отражающее синтагматические отношения между ними).

  • Частотная сочетаемость представляет собой в лингвистическом контексте чистую игру случая.
    Однако:
    И Случай, бог изобретатель (А.С. Пушкин)

  • Частотная сочетаемость вводится и может быть понята в психолингвистическом контексте по модели Ох-карт

  • Таким образом, данное задание может рассматриваться как творческое метафорическое  осмысление ассоциативных частотных группы лемм)

Пример, рассмотрим ближайшее частотное окружение слов "язык" и "речь"

451 против
452 плечо
453 современный
454 цена
455 план
456 приехать
457 речь
458 четыре
459 отвечать
460 точка
461 основа
462 товарищ
463 культура
80 мысль
81 дорога
82 мать
83 действие
84 месяц
85 государство
86 язык 324.9 306
87 любовь
88 взгляд
89 мама
90 век
91 школа
92 цель
  • Заметим, что "слово" язык (и его частотное окружение) значительно чаще встречается слова "речь"...

  • Предположим, что случайный частотный словесный контекст каждой отдельной леммы имеет некое (таинственное?)семантическое измерение (дисперсию или корреляцию) и попытаемся его выявить, аргументировать (обосновать) и вербализовать (описать в документе ФамилияDict.

  • Например тот факт, что язык больше связан с государством и целью, чем речь; а речь больше связана с ценой и культурой, чем язык... и т.д...

  • Примеры других пар слов с указанием номера в частотном словаре (выберите свои собственные):

  • 1153 студент
    7577 студентка

  • 509 девушка
    2695 юноша

  • 1060 учитель
    4089 учительница

  • 784 счастье
    3861 несчастье

  1. Результаты своей семантической интерпретации ассоциативных частотных группы лемм изложить в документе ФамилияDict

  2. Отослать преподавателю письмо с pdf-документами ФамилияDict

 

 

kmp