-
Понятие автоматической обработки текста
(дефиниция текста,
обработка текста, автоматизация обработки текста, предназначение АОТ, приложения АОТ,
уровни АОТ, области применения АОТ,
иерархия АОТ,
парадигма АОТ)
-
Автоматизация обработки текста
(автомат, автоматизация, автоматизмы,
автоматизация обработки текста, гиперавтоматизация,
базовые задачи АОТ, основания АОТ,
парадигма АОТ)
-
Методы
автоматической обработки текста
(понятие метода, методы и цели АОТ, методы и объекты АОТ,
базовые задачи АОТэтапы
развитич методов АОТ, алгоритмы).
-
Лингвистические
методы в АОТ (филология и лингвистика, лингвистический
подход, лингвистические абстракции, текст в лингвтстике,
когнитивные искажения, ограничения и ценность лингвистического
подхода)
-
Парадигма
автоматической обработки текста
(проблема понимания АОТ, предпосылка
адекватного понимания АОТ, парадигмальное основание АОТ, понятие
онтологии, основы, особенности и важнейшие положения объектно
ориентированной онтологии, понятие онтикологии, понятие машины в
онтикологии, идеальная машина)
-
Понятие текста в АОТ (дефиниция
текста, символ, машинная метафора текста, символьный тип данных,
текст и язык, базовые задачи АОТ)
-
Текст как
предмет
АОТ (дефиниция
текста, машинная метафора текста, текст как предмет АОТ, базовые
задачи АОТ, текст как символическая машина)
-
Графематическая
обработка текста (дефиниция графемы, графема, как предмет
АОТ; графема, глиф, аллограф; данные, кодировки, цифры;
инструментальность графемы в контексте АОТ)
-
Токены, граммы, строки в АОТ
(дефиниции слова, токена, граммы, терма,
строки; грамматология,
n-грамма,
теория
n-грамм,
применение
n-грамм;
токены, термы, строки)
-
Big Data
(Большие данные, термин
Big Data, предмет и задача Big Data,
формулы Big Data: 3V,
5V, 7V; основные характеристики Big
Data)
-
Квантитативные методы в АОТ (понятие квантитативности и
кваликативности, объект приложения квантитативных методов,
дистрибуция, дистрибутивная семантика, дистрибутивная гипотеза,
цель
дистрибутивно-статистического анализа)
-
Статистические методы в АОТ (понятие,
частотные словари, закон Ципфа,
частотный словарь как векторная модель
текста,
использование частотных словарей)
-
Частотный словарь (понятие частотного словаря, приложения и
возможности частотных словарей, ранговый и алфавитный частотные
словари, параметры частотных словарей, частотные словари и
лингвистические корпусы)
-
Основные статистические категории (статистическая
и генеральная совокупности, выборка, статистический
показатель, вариация признака, дисперсия, стандартное
отклонение, средняя величина, доверительный интервал, мода,
медиана) -
Компьютерные языки
(искусственные и компьютерные
языки,
типы компьютерных языков, информационные языки,
Universal Networking
Language, языки поисковых запросов, языки разметки,
лингвистические
XML-приложения,
языки программирования).
-
Регулярные выражения
(Иерархия Хомского. Регулярные
грамматики. Регулярные выражения. Структура регулярных
выражений. Regex (regular expressions). Общая схема Regex.
Сетевой инструментарий по Regex.
-
Регулярные выражения в
текстовом процессоре
(регулярные выражения. Структура регулярных
выражений. Специальные символы и подстановочные знаки в
текстовом процессоре Microsoft Word).
-
Методы
оптического распознавания
текста (оптическое
распознавание текста, алгоритмы оптического распознавания,
нейросетевые модели оптического распознавания).
-
Разметка как метод АОТ
(понятие разметки, онтологическая
разметка, языковая разметка, научная разметка, текстовая
разметка, бинарные оппозиции)
-
Языки разметки
(понятие разметки, языки разметки,
назначение, области применения в АОТ и основные характеристики
HTML (HyperText Markup Language), CSS (Cascading Style Sheet),
XML (eXtensible Markup Language)
-
Cascading Style Sheets
(понятие стиля, таблицы стилей, внутренние
и внешние таблицы, CSS, назначение, версии, структура модели,
важнейшие особенности, Syntactically Awesome Stylesheets, LESS,
BEM, CSS-инструментарий)
-
eXtensible
Markup Language
(понятие, приложения
XML в области автоматической обработки текста)
-
Text
Encoding Initiative
(понятие, лингвистическая разметка, схемы
TEI, языковые корпуса на TEI,
автоматическая разметка текстов)
-
Микроформатная
лингвистическая разметка (понятие,
Schema.org, микроформаты, микроформатная разметка, назначение и
области применения XLD, уровни метаданных в XLD)
-
Методы визуализации текста (понятие инфографики, назначение
и цель инфографики, инфографическая визуализация текста, облако
слов, инфографическая типографика, инфографический
инструментарий)
-
Математическое моделирование текста
(принципы математического метода (по Колмогорову А.Н.), модели
bag-of-words и bag-of-terms, их особенности, ограничения и
области применения, частотные модели текста, веса слов, понятие
вектора, векторные модели текста, частотный словарь как
векторная модель текста)
-
Латентно-семантический анализ
(понятие латентно-семантического анализа, области использования
LSA, трехуровневая структура нейросететвой модели LSA,
подготовка к LSA, стоп-символы, нормализация, стемминг)
-
Символьное
моделирование текста
(символьные вычисления, гипотеза Ньюэлла — Саймона, Wolfram
Language, Wolfram|Alpha; Computable Document Format, его
возможности и области применения)
-
Онтологии (понятие онтологии,
онтологии в информатике, формальные онтологии, структура
онтологий, языки описания онтологий)
-
Лексические онтологии
(понятие
онтологии, лексические и формальные онтологии,
тезаурус, тезаурусная модель реальности,
WordNet, синсеты)
|