Лингвистические анализаторы текста

 

 

 

 

  1. Познакомиться с материалом на странице

  2. В Интернете (для изготовления Фамилия-LA):

  • посетить сайт Онлайн-словаря ABBYY Lingvo-Online и познакомиться с его возможностями (в том числе - управлением терминологией)

  • посетить сайт ABBYY (в разделе Продукты посетить страницы подраздела "Словари, разговорники, автоматизированный перевод")

  • найти и прочесть сторонние информационные материалы о LingvoLive

  • посетить сайт LingvoLive и опробовать его возможности, познакомиться с постами.

  • познакомиться с базой знаний и (по желанию) проголосовать о пользе полученной информации

  • познакомиться с разделом Конфиденциальность в Пользовательском соглашении  LingvoLive

  1. Создать в Microsoft Word информационный материал (структурированный в виде таблицы с вопросами и ответами) о LingvoLive  под именем "Фамилия-LLive" в соответствии с заданной ниже структурой:

  • Титульный лист (содержит выходные данные (название, ФИО, группа, предмет, дата) в номинативной форме.

  • Основные продукты ABBYY в разделе "Словари, разговорники, автоматизированный перевод"

  • Что нового в  LingvoLive по сравнению с сайтом lingvo-online.ru

  • Все ли функции в  LingvoLive доступны бесплатно или за что-то нужно платить?

  • Определение, описание и цель сервиса LingvoLive

  • Основные возможности  сервиса LingvoLive

  • Системные требования для использования сервиса LingvoLive

  • Описание главной страницы сайта LingvoLive

  • Число пользователей онлайн (на данное время) и число переведенных за 24 часа слов

  • Ваш избранный на Ленте пост (из вопросов)

  • Ваш избранный на Ленте пост (из переводов)

  • Ваш избранный на Ленте пост (из заметок)

  • Ваш собственный перевод с помощью  LingvoLive  (с приложением экранной копии (делается с помощью программы Ножницы))

  • необходимые условия для того, чтобы: СПРОСИТЬ ПЕРЕВОД, ДОБАВИТЬ ПЕРЕВОД, НАПИСАТЬ ЗАМЕТКУ

  • Перечень языков Ленты с постами

  • Подготовить отзыв о LingvoLive и вложить в документ Фамилия-LLive экранную копию заполненной Вами формы отзыва (отправка отзыва - по вашему желанию)

  • Ваш умный вопрос по сервису LingvoLive

  • Ваше авторское учебное задание по сервису LingvoLive

  1. Заполнить свойства документа Фамилия-LLive, сохранить его в формате PDF и отослать письмом преподавателю.

 

 

  1. Изучить материал и материал.

  2. На странице заполнить таблицу и сохранить страницу как PDF-документ под именем Фамилия-WOT

  3. Найти на сайте Флибуста собрания сочинений:

  1. Создать документ (Книгу) Excel под именем  Фамилия-WOT

  1. Переименовать второй лист Книги Фамилия-WOT в ФамилияЛНТ, создать на листе ФамилияЛНТ таблицу (для заполнения своими данными, согласно образца)

  2. Создать (упрощенную, учебную) пунктуационную модель одного тома собрания сочинений Л.Н. Толстого (номер тома для Вас указаны в Вашей строке зачетной таблицы) для этого:

  •  открыть на сайте Флибуста избранный том (номер тома для Вас указаны в Вашей строке зачетной таблицы) выбрав ссылку Читать

  • Сохранить открытый том в своем каталоге в формате "Веб-страница, только HTML"

  • Открыть сохраненный том с браузере. Выделить весь текст и скопировать его в Блокнот.

  • Отредактировать текст в Блокноте удалив из него не авторскую информацию (служебную, редакторскую,  ...). Сохранить файл.

  • Открыть текстовый файл в Браузере (перетащив его в поле рабочего окна) и определить в тексте тома (поиском по тексту (Ctrl+F) число семь знаков препинания

  • точка (подумать и решить проблему неоднозначности в определении числа "точек" и "многоточий", проверить Ваше решение и убедиться в его правильности, в письме с работой нужно будет описать Ваш алгоритм разрешения данной неоднозначности! См. Коллекцию ниже на странице)

  • запятая,

  • двоеточие,

  • многоточие,

  • точка с запятой,

  • восклицательный знак,

  • вопросительный знак,

  • определить общее число знаков в тексте тома (например, открыв его в Microsoft Word и просмотрев статистику)

  • нормализовать полученные результаты (подсчитав для каждого знака препинания частотный коэффициент: число знаков препинания на 100 знаков в тексте (без пробелов))

  • Заполнить таблицу на листе ФамилияЛНТ

  • Визуализировать пунктуационную модель, создав на листе ФамилияЛНТ круговые диаграммы на основе заполненной таблицы (точно согласно образца). В диаграммах нет сектора "все знаки!"

  1. Переименовать третий лист Книги Фамилия-WOT в ФамилияФМД, создать на листе ФамилияФМД таблицу (для заполнения своими данными, согласно образца). Форат ячеек - ЧИСЛОВОЙ, с указание пяти знаков после запятой!

  2. Создать на листе ФамилияФМД (на основе описанного выше алгоритма) упрощенную учебную пунктуационную модель одного тома собрания сочинений Ф.М. Достоевского (номер тома для Вас указаны в Вашей строке зачетной таблицы) и визуализировать ее круговыми диаграммами (согласно образца) В диаграммах нет сектора "все знаки!"

  3. Переименовать четвертый лист Книги Фамилия-WOT в Фамилия!, создать на листе Фамилия! таблицу (согласно образца) и, с помощью программы и сообразительности заполнить ее своими данными.

  4. Переименовать пятый лист Книги Фамилия-WOT в ФамилиЯ и создать на нем таблицу согласно образца

  5. найти на Флибусте книгу Валерии Гавриловой "Модель человека", на основании предисловия книги (ОТ МОЛОДОГО АВТОРА – ХИ!..) и рефлексии  и заполнить таблицу на листе ФамилиЯ. Сохранить документ.

  6. Отослать преподавателю письмо:

  • с PDF-файлом Фамилия-WOT

  • с файлом Excel Фамилия-WOT

  • с понятным описанием правильного алгоритма разрешения неоднозначности в определении числа "точек" и "многоточий"

  • (для умных) ответом на вопрос: "Как на основе частотного словаря можно проверить текстуальную адекватность "Я-перечня" Валерии Гавриловой?

  • с отзывом о работе.

 

 




https://ru.wikipedia.org/wiki/Лаборатория_Фантастики


http://fantlab.ru/
Лаборатория Фантастики


http://fantlab.ru/article374
Лингвистический анализ текста и распознавание автора

http://fantlab.ru/lprating/sz10/sz10/page1
Лингвистический рейтинг и корреляция параметров








http://www.philol.msu.ru/~lex/main.htm
лаборатория общей и компьютерной лексикологии и лексикографии.


http://rusf.ru/books/analysis/
Вашему вниманию предлагается программа ЛингвоАнализатор.

На этой Web-странице демонстрируются возможности математического анализа структуры текста. Целью
анализа является определение близости любого из предлагаемых пользователем Интернета текста к одному из
авторских эталонов, определенных заранее.
( Авторский эталон --- набор текстов данного автора, взятый из ресурсов Русской Фантастики. См. список
произведений.)

В результате, не читая анализируемый текст, Вы можете оценить его сходство с произведениями Ваших
любимых писателей.

Программа анализирует входной текст и выдает имена трех писателей, которые могли бы быть его наиболее
вероятными авторами.

Кроме имен писателей, программа находит три произведения каждого из авторов, которые наиболее близки
данному тексту.

Общаясь с программой, разработанной Д.В.Хмелевым, Вы присоединяетесь к первому литературному
эксперименту по распознаванию авторства текста, написанного на русском языке.

Итак, выбирайте:
Анализ текста.
Анализ текста (с загрузкой из файла).
Просмотр примеров и пояснений.
Подробности о работе программы (авторский комментарий).
Статья с математическим описанием принципов работы программы.
Список произведений, находящихся в базе анализатора (71Kb).
Часто задаваемые вопросы и ответы на них.
Краткая история разработки методик определения авторского стиля.
Краткий каталог ресурсов, имеющих отношение к Лингвоанализатору.
Статистика распознавания.
Хронология развития Лингвоанализатора.
Русская фантастика -- ЛингвоАнализатор -- Приём рукописей и файлов | Помощь | Комментарии | Статья | ЧаВО
| Состав базы | История | Каталог | Помогите!
Rambler's Top100 Service
©1999 Программа лингвоанализа, Дмитрий Хмелёв.
©1999--2002 Автор программы, редактор, Дмитрий Хмелёв.
©1999 Идеи, редактура, Дмитрий Ватолин.
©1999 Рисунки, Егор Славинский.
©1999-2000 Web-интерфейс, Павел Петриенко.








http://www.textology.ru/web.htm
Перед Вами - он-лайновый лингвистический процессор или анализатор (лингвоанализатор), который
автоматически сравнивает тексты по параметрам индивидуального авторского стиля. См. описание.

Версия 1.01 пока обучена сравнивать только тексты романов. В базе данных хранятся романы 103 известных
русских и советских писателей 19 и 20 веков. См. список и комментарии.

Атрибутор работает быстро. Дольше тянется копирование текста в окно. Можно копировать проверяемый текст
целиком, но можно ограничиться и его фрагментом. Для атрибуции достаточно 20 Кб текста (примерно - 6
страниц).


 

 

kmp