Здесь
познакомиться с материалами о статистической
обработке текста.
Здесь
познакомиться с материалами о применении
частотных словарей в языковом образовании.
Здесь
можно познакомиться с материалами о статистике документа
для переводчика |
КОНКОРДАНС
(нем.
Konkordanz,
англ. concordance, лат. conncordare - согласовываться,
приводить к согласию)
-
расположенный в алфавитном порядке перечень встречающихся в
книге слов с минимальным контекстом (в несколько слов).
-
особый тип словаря, в котором каждое слово приводится с
минимальным контекстом.
|
1. Создать в своем каталоге папку Фамилия-Стат,
скопировать в нее
архив (с программой
FDC273
и текстовым файлом ЛПСС с
полным собранием стихотворений
Мирры Лохвицкой),
распаковать
архив и запустить программу.
2.
Открыть
текстовый файл
ЛПСС
и произвести в нем
замены:
(это должна быть Ваша Фамилия!)
все слова "взгляни"
заменить на лексему "взгляниФамилия"
(одним словом, с Вашей Фамилией!). Сохранить
документ именем
ЛПСС-Фамилия.
Примечание:
Составлять частотный словарь
необходимо на основе документа содержащего слова
"Фамилия"
и
взгляниФамилия!
3 .
Построить частотный словарь полного
собрания стихотворений
Мирры Лохвицкой
(выбираете параметр
"Для
исходного"):
4.
Заполнить паспорт частотного словаря (поля
Автор (Ваша Фамилия Имя Отчество) и Название (Фамилия-статистика).
Пример заполнения на рисунке:
5. Сохранить
словарь как
HTML-документ в каталоге
Фамилия-Стат под именем вида
Фамилия-ст
6.
Открыть
страницу, заполнить
там таблицы (везде
должна быть Ваша Фамилия!)
и сохранить страницу как
PDF-документ под именем Фамилия-table:
Фамилия-статистика с помощью фильтров
по значению для столбца Словоформа
(использование фильтров см
рисунок1 и
рисунок2, полученный
результат см рисунок3).
важно учесть, что концепты лексически отражаются
многообразно (например ЖИЗНЬ - как живой, жить, жизнь ... и
бессмертие...)
во второй таблице записать все контексты
употребления лексемы взгляниФамилия (для
поиска контекстов лучше всего открыть документ в браузере
Google Chrome и использовать
Ctrl+F).
в третьей таблице записать все контексты
употребления слова, которое начинается с той же буквы, что и
Ваша Фамилия и имеет частотность 5, 6 или 7.
в четвертой таблице должны быть
Ваши собственные
Фамилия Имя Отчество!
Для ее заполнения
надо создать в каталоге
Фамилия-Стат
4 текстовых документа
под именами вида
1, 2, 3, 4.
Ввести
в каждый из документов
текст
для анализа (в
первый:
Фамилия Имя Отчество,
во второй:
Фамилия Имя Имя Отчество,
в третий:
Имя Имя Имя,
в четвертый:
Имя
Имя) и сохранить документы.
Строя
по сохраненным документам 1, 2, 3, 4 частотные
словари, заполнить таблицу и на
основе анализа полученных показателей "Богатство речи"
назвать в ней,
два параметра,
которые учитываются при определении показателя
богатства речи программой
FDC273.
Примечание:
Не пишите глупости и то, что не сможете объяснить.
7.
Удалить программу FDC273 и архив с данной программой.
8. Заархивировать папку
Фамилия-Стат.
Примечание:
В архиве должны
быть следующие файлы:
-
ЛПСС-Фамилия.txt
-
Фамилия-Ст.htm
-
Фамилия-table.pdf
-
1.txt
-
2.txt
-
3.txt
-
4.txt
9. Отослать
преподавателю письмо с отзывом архивом
10. Поработать с конкордансом
к текстам Ломоносова
|
|