Лингвистические анализаторы
текста
|
-
Познакомиться с материалом на
странице
В Интернете
(для изготовления
Фамилия-LA):
-
посетить сайт Онлайн-словаря ABBYY
Lingvo-Online и познакомиться с его возможностями (в том
числе - управлением терминологией)
-
посетить сайт
ABBYY (в
разделе Продукты посетить страницы подраздела "Словари,
разговорники, автоматизированный перевод")
-
найти и прочесть
сторонние информационные материалы о
LingvoLive
-
посетить сайт
LingvoLive
и опробовать его возможности, познакомиться с постами.
-
познакомиться с базой знаний и (по желанию)
проголосовать о пользе полученной информации
-
познакомиться с разделом Конфиденциальность в
Пользовательском соглашении
LingvoLive
-
Создать в
Microsoft Word
информационный материал (структурированный в виде таблицы с
вопросами и ответами) о
LingvoLive
под именем
"Фамилия-LLive"
в соответствии с заданной ниже структурой:
-
Титульный лист (содержит выходные данные (название, ФИО, группа,
предмет, дата) в номинативной форме.
-
О сновные
продукты
ABBYY в разделе "Словари,
разговорники, автоматизированный перевод"
-
Что
нового в
LingvoLive
по сравнению с сайтом
lingvo-online.ru
-
Все ли функции в
LingvoLive
доступны бесплатно или за что-то нужно платить?
-
О пределение,
описание и цель сервиса
LingvoLive
-
Основные возможности
сервиса
LingvoLive
-
Системные требования для использования
сервиса
LingvoLive
-
Описание главной страницы сайта
LingvoLive
-
Число пользователей онлайн (на данное время) и
число переведенных за 24 часа слов
-
Ваш избранный на Ленте пост (из вопросов)
-
Ваш избранный
на Ленте пост (из переводов)
-
Ваш избранный
на Ленте пост (из заметок)
-
Ваш собственный перевод с помощью
LingvoLive
(с приложением экранной копии (делается с
помощью программы Ножницы))
-
необходимые условия для того, чтобы: СПРОСИТЬ
ПЕРЕВОД, ДОБАВИТЬ ПЕРЕВОД, НАПИСАТЬ ЗАМЕТКУ
-
Перечень языков Ленты с постами
-
Подготовить отзыв о
LingvoLive
и вложить в документ
Фамилия-LLive
экранную
копию заполненной Вами формы отзыва (отправка отзыва - по
вашему желанию)
-
Ваш умный вопрос по сервису
LingvoLive
-
Ваше авторское учебное задание по сервису
LingvoLive
-
Заполнить свойства документа
Фамилия-LLive,
сохранить его в
формате
PDF
и отослать письмом преподавателю.
-
Изучить материал и
материал.
-
На странице заполнить
таблицу и сохранить страницу как PDF-документ
под именем
Фамилия-WOT
Найти на сайте Флибуста собрания сочинений:
-
Создать документ (Книгу) Excel под именем
Фамилия-WOT
-
Переименовать второй лист Книги
Фамилия-WOT
в
ФамилияЛНТ,
создать на листе
ФамилияЛНТ
таблицу (для заполнения своими данными, согласно
образца)
-
Создать (упрощенную, учебную) пунктуационную модель одного тома
собрания
сочинений Л.Н. Толстого
(номер тома для Вас указаны в
Вашей строке зачетной таблицы) для этого:
Читать
Сохранить открытый том в своем каталоге в формате "Веб-страница, только
HTML"
Открыть сохраненный том с браузере. Выделить весь текст и скопировать его в
Блокнот.
Отредактировать текст в Блокноте удалив из него не авторскую информацию
(служебную, редакторскую, ...). Сохранить файл.
Открыть текстовый файл в Браузере (перетащив его в поле рабочего окна) и определить в
тексте тома (поиском по тексту (Ctrl+F)
число
семь
знаков препинания
-
точка
(подумать и решить проблему неоднозначности в
определении числа "точек" и "многоточий",
проверить Ваше решение и убедиться в его
правильности, в письме с
работой нужно будет описать Ваш алгоритм разрешения
данной неоднозначности! См. Коллекцию
ниже на странице)
-
запятая,
-
двоеточие,
-
многоточие,
-
точка с запятой,
-
восклицательный знак,
-
вопросительный знак,
-
определить общее
число знаков в тексте тома (например, открыв его в
Microsoft Word и просмотрев
статистику)
-
нормализовать
полученные результаты (подсчитав для каждого знака препинания
частотный коэффициент:
число знаков препинания на 100 знаков в тексте (без
пробелов))
Заполнить таблицу
на листе
ФамилияЛНТ
Визуализировать
пунктуационную модель,
создав
на листе
ФамилияЛНТ
круговые диаграммы на основе заполненной таблицы (точно
согласно
образца).
В диаграммах нет сектора "все знаки!"
-
Переименовать третий лист Книги
Фамилия-WOT
в
ФамилияФМД,
создать на листе
ФамилияФМД
таблицу (для заполнения своими данными, согласно
образца).
Форат ячеек - ЧИСЛОВОЙ, с указание пяти знаков после запятой!
-
Создать на листе
ФамилияФМД (на основе описанного выше алгоритма) упрощенную
учебную пунктуационную модель одного тома
собрания
сочинений Ф.М. Достоевского
(номер тома для Вас указаны в
Вашей строке зачетной таблицы) и
визуализировать ее круговыми диаграммами
(согласно
образца)
В диаграммах нет сектора "все знаки!"
-
Переименовать четвертый лист Книги
Фамилия-WOT
в
Фамилия!,
создать на листе
Фамилия!
таблицу (согласно
образца)
и, с помощью
программы и сообразительности заполнить ее своими данными.
-
Переименовать пятый лист Книги
Фамилия-WOT
в
ФамилиЯ
и
создать на нем таблицу согласно
образца
-
найти на Флибусте книгу Валерии Гавриловой "Модель человека", на
основании предисловия книги ( ОТ
МОЛОДОГО АВТОРА – ХИ!..)
и рефлексии и заполнить таблицу на листе
ФамилиЯ.
Сохранить документ.
-
Отослать преподавателю письмо:
-
с
PDF-файлом
Фамилия-WOT
-
с файлом Excel
Фамилия-WOT
-
с
понятным описанием
правильного алгоритма разрешения неоднозначности в определении числа "точек"
и "многоточий"
-
(для
умных)
ответом на вопрос: "Как на основе частотного словаря можно
проверить текстуальную адекватность "Я-перечня" Валерии
Гавриловой?
-
с отзывом о работе.
https://ru.wikipedia.org/wiki/Лаборатория_Фантастики
http://fantlab.ru/
Лаборатория Фантастики
http://fantlab.ru/article374
Лингвистический анализ текста и распознавание автора
http://fantlab.ru/lprating/sz10/sz10/page1
Лингвистический рейтинг и корреляция параметров
http://www.philol.msu.ru/~lex/main.htm
лаборатория общей и компьютерной лексикологии и лексикографии.
http://rusf.ru/books/analysis/
Вашему вниманию предлагается программа ЛингвоАнализатор.
На этой Web-странице демонстрируются возможности математического
анализа структуры текста. Целью
анализа является определение близости любого из предлагаемых
пользователем Интернета текста к одному из
авторских эталонов, определенных заранее.
( Авторский эталон --- набор текстов данного автора, взятый из
ресурсов Русской Фантастики. См. список
произведений.)
В результате, не читая анализируемый текст, Вы можете оценить его
сходство с произведениями Ваших
любимых писателей.
Программа анализирует входной текст и выдает имена трех писателей,
которые могли бы быть его наиболее
вероятными авторами.
Кроме имен писателей, программа находит три произведения каждого из
авторов, которые наиболее близки
данному тексту.
Общаясь с программой, разработанной Д.В.Хмелевым, Вы присоединяетесь
к первому литературному
эксперименту по распознаванию авторства текста, написанного на
русском языке.
Итак, выбирайте:
Анализ текста.
Анализ текста (с загрузкой из файла).
Просмотр примеров и пояснений.
Подробности о работе программы (авторский комментарий).
Статья с математическим описанием принципов работы программы.
Список произведений, находящихся в базе анализатора (71Kb).
Часто задаваемые вопросы и ответы на них.
Краткая история разработки методик определения авторского стиля.
Краткий каталог ресурсов, имеющих отношение к Лингвоанализатору.
Статистика распознавания.
Хронология развития Лингвоанализатора.
Русская фантастика -- ЛингвоАнализатор -- Приём рукописей и файлов |
Помощь | Комментарии | Статья | ЧаВО
| Состав базы | История | Каталог | Помогите!
Rambler's Top100 Service
©1999 Программа лингвоанализа, Дмитрий Хмелёв.
©1999--2002 Автор программы, редактор, Дмитрий Хмелёв.
©1999 Идеи, редактура, Дмитрий Ватолин.
©1999 Рисунки, Егор Славинский.
©1999-2000 Web-интерфейс, Павел Петриенко.
http://www.textology.ru/web.htm
Перед Вами - он-лайновый лингвистический процессор или анализатор (лингвоанализатор),
который
автоматически сравнивает тексты по параметрам индивидуального
авторского стиля. См. описание.
Версия 1.01 пока обучена сравнивать только тексты романов. В базе
данных хранятся романы 103 известных
русских и советских писателей 19 и 20 веков. См. список и
комментарии.
Атрибутор работает быстро. Дольше тянется копирование текста в окно.
Можно копировать проверяемый текст
целиком, но можно ограничиться и его фрагментом. Для атрибуции
достаточно 20 Кб текста (примерно - 6
страниц).
|
kmp
|