ВОПРОСЫ ДЛЯ САМОСТОЯТЕЛЬНОГО
ИЗУЧЕНИЯ
01
Математические модели текста (метод математического
моделирования, модель текста bag-of-words, частотная модель
текста, веторная модель текста, частотный словарь как
векторная модель текста, латентно-семантический анализ,
нормализация и стемминг).
02
Метатекстовая разметка
(Метаразметка. Языки разметки.
Метаязык.
XML и его приложения
в области работы с электронным текстом.
Лингвистическая разметка (аннотирование).
Лингвистическая аннотация и метаданные.
TEI)
03
Языки поисковых запросов
(Языки запросов. Регулярные выражения в языках поисковых
запросов. XPath, XQuery, SQL. Языки запросов поисковых
систем, их возможности. Структура языка запросов. Языковые
инструменты поисковых систем)
04
Регулярные выражения (Иерархия Хомского. Регулярные
грамматики. Регулярные выражения. Структура регулярных
выражений. Regex (regular expressions). Общая схема Regex.
Сетевой инструментарий по Regex.
Регулярные выражения в Microsoft Word)
05
Языковая инфраструктура синтеза и распознавания речи
(CLI, голосовые платформы,
Microsoft Speech Platform, Speech Recognition Grammar
Specification, Speech Synthesis Markup Language, Speech
Recognition Grammar Specification, теги параметров речи).
06
Технологии
оптического распознавания
(понятие
и области применения OCR, алгоритмы оптического распознавания,
характеристики и программы OCR, понятие
Intelligent Character
Recognition,
системы распознавания рукописного текста).
VoiceXML
и
Speech Application Language
(достоинства и
ограниченря VoiceXML и Speech
Application Language Tags, назначение тегов
VoiceXML, структура
VXML-документа VXML,
VXML.RU).
Нейронные сети (модели компьютерной обработки
информации, искусственные нейроны и нейронные сети, перцептрон,
нейрокомпьютеры, области применения и правила использования нейронных сетей,
ограничения нейронных сетей)
Машинное обучение (Machine Learning, обучение по
прецедентам, алгоритмы обучения нейронных сетей, метод обратного
распространения ошибки, глубокое обучение, задачи и приложения машинного
обучения, машинное обучение в обработке текста, машинное обучение на
векторных моделях)
Управление терминологией (понятие Terminology Management,
структура управления терминологией, области применения управления
терминологией, Terminology Management System, системы и
сетевые сервисы управления терминологией, автоматический поиск в сетевых
терминологических базах)
Автоматическое извлечение
терминологии
(понятие и этапы извлечения терминологии, системы
автоматического извлечения терминологии, примеры систем,
функции и возможности
PROMT Term).
Тезаурусы
(дефиниция, тезаурусы в
лингвистике, области применения тезаурусов, примеры тезаурусов, тезаурус
WordNet, синсеты, информационно-поисковые тезаурусы, цели разработки ИПТ,
информационно-поисковые языки, дескрипторы, ключевые слова, правила
включения терминов в тезаурус. Онтологии).
Технологии компьютерного перевода (технологии Rule-based (Interlingua,
Transfer consecutive, Transfer hierarchica) и Statistical-based,
Hybrid-based, их
характеристика и примеры реализации, проекты UNL, DLT, NLC, оценка
эффективности технологии перевода) |
kmp
W5rYu8sx64