Частотный словарь в Word и Excel

Здесь материал о статистической обработке текста.

Здесь материалам о применении частотных словарей в языковом образовании.

 

 

 

  1. Создать документ Word, заполнить его метаданные (согласно образца) и сохранить его под именем ФамилияW.

  2. Выбрать произведение (не менее 1000 слов, например здесь). Скопировать текст в ФамилияW и проверив правильность своего выбора в свойствах документа Word и вставить в документ ФамилияЧС скрин (согласно образца)

  3. Избавиться в документе ФамилияW от всех знаков пунктуации в тексте и вынести каждое слово в отдельный абзац. Это можно сделать с помощью меню Замена используя подстановочные значки.
    Для замены знаков препинания необходимо включить опцию «Подстановочные знаки» (включается по кнопке «Больше >>»). Не все знаки пунктуации можно перечислять «как есть», некоторые из них сами являются командой для функции подстановочных знаков, поэтому их нужно перечислять через обратный слеш \! или \?.
    Дефис исключаем из перечня, иначе слова с дефисом будут разделены на два отдельных слова
    Только для тех, кто так и не понял см. подсказку

  4. Избавиться от двойных пробелов и от пустых абзацев, что можно сделать последовательно заменяя два абзаца на один (при отключенных Подстановочных значках!).

  5. Отсортировать текст по возрастанию. Только для тех, кто так и не понял см. подсказку

  6. Создать документ Excel, заполнить его метаданные и сохранить под именем ФамилияE.
    Переименовать Лист1 в Фамилия. Сделать заголовок первого столбца по образцу (ФИО должны быть Ваши собственные).

  7. Вставить в первый столбец на лист Фамилия документа ФамилияE текст из документа Word ФамилияW.

  8. Выделить первый столбец (с текстом) и на вкладке Вставка слева выбрать Сводная таблица. Указать помещение отчета для сводной таблицы на новый лист- см. подсказку

  9. Включить поле Словоформы (слева появятся уникальные слова из столбца) и перетащить включенное поле вниз в поле Значения (с пиктограммой суммы Σ – появится количество для каждого из слов) - см. подсказку

  10. Отсортировать (используя фильтр - вкладка Данные) Итог по убыванию (от Я до А), чтобы большее количество употреблений было вверху - см. подсказку

  11. В полученном результате выделить 20 наиболее частотных словоформ, сделать (с помощью программы Ножницы, например) скрин,  подписать его (рукописно) своей Фамилией и вставить в документ ФамилияЧС - см. образец

  12. Переименовать Лист с отчетом в Фамилия2 и сохранить документ Excel

  1. Отослать письмо с отзывом и файлами ФамилияЧС, ФамилияW и ФамилияE

kmp