ВОПРОСЫ ПО КУРСУ
МЕТОДЫ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТА (ИИ)

 

ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

 

  1. Компьютерные языки (искусственные и компьютерные языки, типы компьютерных языков, информационные языки, Universal Networking Language, языки поисковых запросов, языки разметки, лингвистические XML-приложения, языки программирования).

  2. Технологии ввода текстовой информации (назначение, принципы работы, пользовательские характеристики и правила использования клавиатуры и манипуляторов, сканирование и распознавание текста, распознавание речи, графические планшеты).

  3. Статистические методы в языкознании (статистические методы в языкознании. Частотные словари. Закон Ципфа. Использование частотных словарей. Статистика текстового документа. Статистический лингвистический анализ текста).

  4. Технологии информационного поиска (понятие, типы и виды информационного поиска, поиск в электронном документе и в Интернете, языки поисковых запросов, поисковые службы, поисковая оптимизация, тенденции и перспективы развития поисковых сервисов).

  5. Языки поисковых запросов (Языки запросов. Регулярные выражения в языках поисковых запросов. XPath, XQuery, SQL. Языки запросов поисковых систем, их возможности. Структура языка запросов. Языковые инструменты поисковых систем)

  6. Регулярные выражения (Иерархия Хомского. Регулярные грамматики. Регулярные выражения. Структура регулярных выражений. Regex (regular expressions). Общая схема Regex. Сетевой инструментарий по Regex. Регулярные выражения в Microsoft Word)

  7. Технологии эффективного чтения (характеристики чтения с экрана, типы и характеристики электронных книг, e-book, e-reader, e-text, технологии Evernote Clearly и Rapid serial visual presentation)

  8. Технологии оптического распознавания (понятие и области применения OCR, алгоритмы оптического распознавания, характеристики и программы OCR, понятие Intelligent Character Recognition, системы распознавания рукописного текста).

  9. Метаязыки и метаразметка (Метаязыки. Языки разметки. XML и его приложения в области работы с электронным текстом)

  10. Технологии распознавания и синтеза устной речи (понятие речи, задачи построения речевого интерфейса, синтез речи по тексту, распознавание речи, технологии безголосового общения, технологии голосового поиска).

  11. Технологии компьютерной лексикографии (предмет лексикографии, задачи и особенности компьютерной лексикографии, лексикографическое противоречие)

  12. Компьютерное терминоведение (понятия терминологии, терминоведения, проблемы и приложения компьютерного терминоведения)

  13. Компьютерная корректура текста (понятие компьютерной корректуры, орфографическая и грамматическая корректура в MS Word, лингвистическая система ОРФО, онлайновые спеллеры, Орфограммка, корректура в Скайп)

  14. Понятие словаря (основные дефиниции словаря, лексикографическое определения понятия "словарь", объекты описания лингвистических словарей, основные структурные элементы проектирования словаря)

  15. Структура словаря и словарной статьи (композиция словаря, основные компонеты мега-, макро и   микроструктуры словаря, дефиниция словарной статьи и способы организации ее основных структурных элементов)

  16. Нейронные сети (модели компьютерной обработки информации, искусственные нейроны и нейронные сети, перцептрон, нейрокомпьютеры, области применения и правила использования нейронных сетей, ограничения нейронных сетей)

  17. Машинное обучение (Machine Learning, обучение по прецедентам, алгоритмы обучения нейронных сетей, глубокое обучение, рекуррентные сети, Transformer, Transfer Learning, GPT-3, BERT, задачи и приложения машинного обучения, машинное обучение в обработке текста, машинное обучение на векторных моделях)

 

Учреждение образования

"Брестский государственный университет имени А.С. Пушкина"

2021

 

 

kmp

n