Статистический анализ текста 

Здесь можно познакомиться с материалами о статистической обработке текста.

Здесь можно познакомиться с материалами о применении частотных словарей в языковом образовании.

Здесь можно познакомиться с материалами о статистике документа для переводчика

 

 

 

1. Создать в своем каталоге папку Фамилия-Стат.

2. Скопировать в свой каталог архив с программой FDC273 и распаковать ее там.

Примечание: Работаем с программой после распаковки, а не прямо из архива!

 

3. Создать текстовый файл под именем вида Записки Фамилия (Ваша Фамилия в родительном падеже. Например: Записки Орловой).

4. Открыть Web-страничку скопировать её содержимое в текстовый файл Записки Фамилия.

5. Осуществить в документе Записки Фамилия замену:

  • всех слов "переводчика" на Вашу фамилию в родительном падеже. Команда замены в меню Правка программы Блокнот.

  • всех слов "можно" на лексему "можноФ", где Ф - первая буква Вашей Фамилии

Примечание: После замены сохранить документ! Составлять частотный словарь будете на основе документа содержащего Вашу Фамилию!!!

6. Запустить программу FDC273 и ознакомиться с ее возможностями.

7. Построить частотный словарь текстового документа Записки-Фамилия, (выбираете параметр "Для исходного"):

 

8. Заполнить паспорт частотного словаря (поля Автор (Ваша Фамилия Имя Отчество) и Название (Фамилия-статистика). Пример заполнения на рисунке:

 

 

 

 

 

9. Сохранить словарь как HTML-документ в  каталоге Фамилия-Стат под именем вида Фамилия-статистика.

10. 11. Открыть страницу, заполнить там таблицы (везде должна быть Ваша Фамилия!) и сохранить страницу как PDF-документ под именем Фамилия-table:

Примечание: в третьей Таблице должны быть Ваши собственные Фамилия Имя Отчество! Для ее заполнения надо создать в каталоге Фамилия-Стат 4 текстовых документа под именами вида 1, 2, 3, 4. Ввести в каждый из документов текст для анализа и сохранить документы. Строя по сохраненным документам 1, 2, 3, 4 частотные словари:

  • заполнить Таблицу3

  • на основе анализа (нужно подумать!) полученных показателей "Богатство речи" сделать ВЫВОД, назвав два параметра, которые учитываются при определении  показателя богатства речи программой FDC273.

12. Удалить из своего каталога программу FDC273  и архив с данной программой.

13. Заархивировать папку Фамилия-Стат с помощьюархиватора WinRAR.

 

 Примечание: В архиве должны быть следующие файлы:

  • Записки переводчика.htm

  • Записки Фамилия.txt

  • Фамилия-статистика.htm

  • Фамилия-table.pdf

  • 1.txt

  • 2.txt

  • 3.txt

  • 4.txt

14. Отослать архив преподавателю в качестве вложения в письмо.
 Примечание: Не забываем писать отзыв о работе и пометку о готовности личного рукописного доклада (для предъявления преподавателю и беседы по теме).

kmp