Построение конкорданса

 

Здесь познакомиться с материалами о статистической обработке текста.

Здесь познакомиться с материалами о применении частотных словарей в языковом образовании.

Здесь можно познакомиться с материалами о статистике документа для переводчика

 

 

КОНКОРДАНС (нем. Konkordanz, англ. concordance, лат. conncordare - согласовываться, приводить к согласию)

  • расположенный в алфавитном порядке перечень встречающихся в книге слов с минимальным контекстом (в несколько слов).

  • особый тип словаря, в котором каждое слово приводится с минимальным контекстом.

 

 

 

1. Создать в своем каталоге папку Фамилия-Стат, скопировать в нее архив (с программой FDC273 и текстовым файлом ЛПСС с полным собранием стихотворений Мирры Лохвицкой), распаковать архив и запустить программу.

2. Открыть текстовый файл ЛПСС и произвести в нем замены: 

  • все слова "я" (в отличие от букв "я" они выделены пробелами с обеих сторон) заменить на "Фамилия" (это должна быть Ваша Фамилия!)

  • все слова "взгляни" заменить на лексему "взгляниФамилия" (одним словом, с Вашей Фамилией!). Сохранить документ именем ЛПСС-Фамилия.

Примечание: Составлять частотный словарь необходимо на основе документа содержащего слова "Фамилия" и взгляниФамилия!
 

3. Построить частотный словарь полного собрания стихотворений Мирры Лохвицкой (выбираете параметр "Для исходного"):

 

4. Заполнить паспорт частотного словаря (поля Автор (Ваша Фамилия Имя Отчество) и Название (Фамилия-статистика). Пример заполнения на рисунке:

 

 

5. Сохранить словарь как HTML-документ в  каталоге Фамилия-Стат под именем вида Фамилия-ст

6.  Открыть страницу, заполнить там таблицы (везде должна быть Ваша Фамилия!) и сохранить страницу как PDF-документ под именем Фамилия-table:

  • в первой таблице записать частотность использования концептов ЖИЗНЬ, СМЕРТЬ в ПСС М. Лохвицкой (установить их можно в документе Excel  Фамилия-статистика с помощью фильтров по значению для столбца Словоформа (использование фильтров см  рисунок1 и рисунок2, полученный результат см рисунок3).
    важно учесть, что концепты лексически отражаются многообразно (например ЖИЗНЬ - как живой, жить, жизнь ... и бессмертие...)

  • во второй таблице записать все контексты употребления лексемы взгляниФамилия (для поиска контекстов лучше всего открыть документ в браузере Google Chrome и использовать Ctrl+F).

  • в третьей таблице записать все контексты употребления слова, которое начинается с той же буквы, что и Ваша Фамилия и имеет частотность 5, 6 или 7.

  • в четвертой таблице должны быть Ваши собственные Фамилия Имя Отчество!
    Для ее заполнения
    надо создать в каталоге Фамилия-Стат 4 текстовых документа под именами вида 1, 2, 3, 4.
    Вве
    сти в каждый из документов текст для анализа (в первый:
    Фамилия Имя Отчество, во второй: Фамилия Имя Имя Отчество, в третий: Имя Имя Имя, в четвертый:
    Имя Имя) и сохранить документы.
    С
    троя по сохраненным документам 1, 2, 3, 4 частотные словари, заполнить таблицу и на основе анализа полученных показателей "Богатство речи" назвать в ней, два параметра, которые учитываются при определении  показателя богатства речи программой FDC273.

Примечание: Не пишите глупости и то, что не сможете объяснить.

 

7. Удалить программу FDC273  и архив с данной программой.

8. Заархивировать папку Фамилия-Стат.

 

 Примечание: В архиве должны быть следующие файлы:

  • ЛПСС-Фамилия.txt

  • Фамилия-Ст.htm

  • Фамилия-table.pdf

  • 1.txt

  • 2.txt

  • 3.txt

  • 4.txt

9. Отослать преподавателю письмо с отзывом архивом

10. Поработать с конкордансом к текстам Ломоносова