ВОПРОСЫ ПО КУРСУ
МЕТОДЫ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТА (ИИ)

 критерии оценки

 

 Консультации к экзамену

 

 

  1. Понятие автоматической обработки текста  (дефиниция текста, обработка текста, автоматизация обработки текста, предназначение АОТ, приложения АОТ, уровни АОТ, области применения АОТ, иерархия АОТ, парадигма АОТ)

  2. Автоматизация обработки текста  (автомат, автоматизация, автоматизмы, автоматизация обработки текста, гиперавтоматизация,  базовые задачи АОТ, основания АОТ, парадигма АОТ)

  3. Методы автоматической обработки текста (понятие метода, методы и цели АОТ, методы и объекты АОТ,  базовые задачи АОТэтапы развитич методов АОТ, алгоритмы).

  4. Лингвистические методы в АОТ (филология и лингвистика, лингвистический подход, лингвистические абстракции, текст в лингвтстике, когнитивные искажения, ограничения и ценность лингвистического подхода)

  5. Парадигма автоматической обработки текста  (проблема понимания АОТ, предпосылка адекватного понимания АОТ, парадигмальное основание АОТ, понятие онтологии, основы, особенности и важнейшие положения объектно ориентированной онтологии, понятие онтикологии, понятие машины в онтикологии, идеальная машина)

  6. Понятие текста в АОТ  (дефиниция текста, символ, машинная метафора текста, символьный тип данных, текст и язык, базовые задачи АОТ)

  7. Текст как предмет АОТ  (дефиниция текста, машинная метафора текста, текст как предмет АОТ, базовые задачи АОТ, текст как символическая машина)

  8. Графематическая обработка текста (дефиниция графемы, графема, как предмет АОТ; графема, глиф, аллограф; данные, кодировки, цифры; инструментальность графемы в контексте АОТ)

  9. Токены, граммы, строки в АОТ (дефиниции слова, токена, граммы, терма, строки; грамматология, n-грамма, теория n-грамм, применение n-грамм; токены, термы, строки)

  10. Big Data (Большие данные, термин Big Data, предмет и задача Big Data, формулы Big Data: 3V, 5V, 7V; основные характеристики Big Data)

  11. Квантитативные методы в АОТ (понятие квантитативности и кваликативности, объект приложения квантитативных методов, дистрибуция, дистрибутивная семантика, дистрибутивная гипотеза, цель дистрибутивно-статистического анализа)

  12. Статистические методы в АОТ (понятие, частотные словари, закон Ципфа, частотный словарь как векторная модель текста, использование частотных словарей)

  13. Частотный словарь (понятие частотного словаря, приложения и возможности частотных словарей, ранговый и алфавитный частотные словари, параметры частотных словарей, частотные словари и лингвистические корпусы)

  14. Основные статистические категории (статистическая и генеральная совокупности, выборка, статистический показатель, вариация признака, дисперсия, стандартное отклонение, средняя величина, доверительный интервал, мода, медиана)

  15. Компьютерные языки (искусственные и компьютерные языки, типы компьютерных языков, информационные языки, Universal Networking Language, языки поисковых запросов, языки разметки, лингвистические XML-приложения, языки программирования).

  16. Регулярные выражения (Иерархия Хомского. Регулярные грамматики. Регулярные выражения. Структура регулярных выражений. Regex (regular expressions). Общая схема Regex. Сетевой инструментарий по Regex.

  17. Регулярные выражения в текстовом процессоре (регулярные выражения. Структура регулярных выражений. Специальные символы и подстановочные знаки в текстовом процессоре Microsoft Word).

  18. Методы оптического распознавания текста (оптическое распознавание текста, алгоритмы оптического распознавания, нейросетевые модели оптического распознавания).

  19. Разметка как метод АОТ  (понятие разметки, онтологическая разметка, языковая разметка, научная разметка, текстовая разметка, бинарные оппозиции)

  20. Языки разметки  (понятие разметки, языки разметки, назначение, области применения в АОТ и основные характеристики HTML (HyperText Markup Language), CSS (Cascading Style Sheet), XML (eXtensible Markup Language)

  21. Cascading Style Sheets (понятие стиля, таблицы стилей, внутренние и внешние таблицы, CSS, назначение, версии, структура модели, важнейшие особенности, Syntactically Awesome Stylesheets, LESS, BEM, CSS-инструментарий)

  22. eXtensible Markup Language (понятие, приложения XML в области автоматической обработки текста)

  23. Text Encoding Initiative (понятие, лингвистическая разметка, схемы TEI, языковые корпуса на TEI, автоматическая разметка текстов)

  24. Микроформатная лингвистическая разметка (понятие, Schema.org, микроформаты, микроформатная разметка, назначение и области применения XLD, уровни метаданных в XLD)

  1. Методы визуализации текста (понятие инфографики, назначение и цель инфографики, инфографическая визуализация текста, облако слов, инфографическая типографика, инфографический инструментарий)

  2. Математическое моделирование текста (принципы математического метода (по Колмогорову А.Н.), модели bag-of-words и bag-of-terms, их особенности, ограничения и области применения, частотные модели текста, веса слов, понятие вектора, векторные модели текста, частотный словарь как векторная модель текста)

  3. Латентно-семантический анализ (понятие латентно-семантического анализа, области использования LSA, трехуровневая структура нейросететвой модели LSA, подготовка к LSA, стоп-символы, нормализация, стемминг)

  4. Символьное моделирование текста (символьные вычисления, гипотеза Ньюэлла — Саймона, Wolfram Language, Wolfram|Alpha; Computable Document Format, его возможности и области применения)

  5. Онтологии (понятие онтологии, онтологии в информатике, формальные онтологии, структура онтологий, языки описания онтологий)

  6. Лексические онтологии (понятие онтологии, лексические и формальные онтологии, тезаурус, тезаурусная модель реальности, WordNet, синсеты)

 

 

Учреждение образования

"Брестский государственный университет имени А.С. Пушкина"

2023

 

kmp