-
Понятие компьютерной лингвистики
(термин «компьютерная
лингвистика». Подходы к определению компьютерной лингвистики
через объект, предмет, задачи, средства и методы.
Математическая лингвистика. Вычислительная лингвистика.
Приложения компьютерной лингвистики.
Компьютерная лингвистика в современном языковом
образовании).
-
Языковедческие основы компьютерной лингвистики
(эволюция
научного понимания языка и задач его изучения (В. Фон
Гумбольдт, Август Шлейхер, Бодуэн де Куртенэ, Ф. де Соссюр).
Научные метафоры языка. Лингвистический поворот.
Генеративные грамматики Н. Хомского, теория «Смысл-Текст»).
-
Логико-математические основы компьютерной лингвистики
(современная математика в периодизации А. Колмогорова.
Логические и лингвистические проблемы современной
математики. Проблема
вычислимости и сложности. Математическая лингвистика.
Компьютер как языковая машина. Лингвистические проблемы
компьютерных наук. Идеи А. Тьюринга, А. Чёрча, А.Н.
Колмогорова, А.А. Маркова).
-
Компьютерные языки
(искусственные
и компьютерные языки,
типы компьютерных языков,
информационные языки, Universal Networking
Language, языки поисковых запросов, языки разметки,
дингвистические
XML-приложения,
языки программирования).
-
Статистические
методы в языкознании
(статистические методы в языкознании.
Частотные словари. Закон Ципфа.
Использование частотных словарей.
Статистика текстового документа. Статистический
лингвистический анализ текста).
-
Математические модели текста (метод математического
моделирования, модель текста bag-of-words, частотная модель
текста, веторная модель текста, частотный словарь как
векторная модель текста, латентно-семантический анализ,
нормализация и стемминг).
-
Корпусная лингвистика
(понятие
"корпуса текстов", цель и задачи
корпусной лингвистики, Брауновский корпус, НКРЯ,
OpenCorpora, ГИКРЯ, белорусские
текстовые корпусы, двуязычные корпусы, создатели текстовых корпусов).
-
Метаязыки
и метаразметка
(Метаязыки.
Языки разметки.
XML и его приложения
в области работы с электронным текстом.
Лингвистическая
метаразметка (аннотирование).
Text Encoding
Initiative)
-
Технологии
информационного поиска
(понятие,
типы и виды информационного поиска, поиск в
электронном документе и
в Интернете, языки поисковых
запросов, поисковые службы,
поисковая
оптимизация, тенденции и перспективы развития поисковых
сервисов).
-
Языки поисковых запросов
(Языки запросов. Регулярные выражения в языках поисковых
запросов. XPath, XQuery, SQL. Языки запросов поисковых
систем, их возможности. Структура языка запросов. Языковые
инструменты поисковых систем)
-
Регулярные выражения (Иерархия Хомского. Регулярные
грамматики. Регулярные выражения. Структура регулярных
выражений. Regex (regular expressions). Общая схема Regex.
Сетевой инструментарий по Regex.
Регулярные выражения в Microsoft Word)
-
Лингвистическое программное обеспечение
(понятие
программного обеспечения,
программы для работы с вербальной информацией,
анализ и обработки текста в текстовом процессоре, сетевые сервисы лингвистического
анализа и обработки текста).
-
Технологии эффективного чтения
(характеристики чтения с экрана,
типы и характеристики электронных книг,
e-book, e-reader,
e-text,
технологии Evernote Clearly и Rapid serial
visual presentation)
-
Технологии
оптического распознавания
(понятие
и области применения OCR, алгоритмы оптического распознавания,
характеристики и программы OCR, понятие
Intelligent Character Recognition,
системы
распознавания рукописного текста).
-
Технологии распознавания
и синтеза устной речи
(понятие
речи, задачи построения речевого интерфейса,
синтез речи по тексту,
распознавание речи, технологии безголосового общения,
технологии голосового поиска).
-
Языковая
инфраструктура синтеза и распознавания речи
(CLI,
голосовые платформы, Microsoft Speech Platform, Speech
Recognition Grammar Specification, Speech Synthesis Markup
Language, Speech Recognition Grammar Specification, теги параметров речи).
-
VoiceXML
и
Speech Application Language
(достоинства
и ограниченря VoiceXML и Speech Application Language Tags,
назначение тегов VoiceXML, структура
VXML-документа VXML,
VXML.RU).
-
Технологии компьютерной лексикографии (предмет
лексикографии, задачи и особенности компьютерной лексикографии,
лексикографическое противоречие)-
Компьютерное
терминоведение
(понятия терминологии, терминоведения,
проблемы и приложения компьютерного терминоведения)
-
Понятие словаря
(основные дефиниции словаря, лексикографическое
определения понятия "словарь",
объекты описания
лингвистических словарей, основные структурные элементы проектирования словаря)
-
Структура словаря
и словарной статьи
(композиция словаря, основные компонеты мега-, макро
и микроструктуры словаря,
дефиниция словарной статьи и способы организации ее основных
структурных элементов)
-
Лексикографическая концепция
(дефиниция
лексикографической концепции, основы создания лексикографической
концепции,
пример лексикографической концепции,
инструменты воплощения лексикографической концепции,
лексикографическая концепция Викисловаря, словарность, Викисловарь)
-
Электронные
переводные словари (понятие
электронного словаря, популярные типы электронных словарей, их
пользовательские характеристики, сетевые словарные
сервисы,
Lingvo Live).
-
Терминологические
базы данных
(понятие базы данных, структура базы данных,
termbases,
метаданные в termbases, типы терминологических баз данных по
целевому и инструментальному назначению, примеры сетевых
терминологических баз данных, создание терминологических баз
данных).
-
Лингвистические
корпусы в терминоведении
(понятие лингвистического корпуса, примеры корпусов, параллельный
текст, параллельный корпус, проблемный корпус, единицы хранения в
корпусах, корпусы в терминоведческих исследованиях, способы
терминографического анализа корпуса параллельных текстов)
-
Управление
терминологией (понятие Terminology Management, структура
управления терминологией, области применения управления
терминологией, Terminology Management
System, системы и сетевые сервисы
управления терминологией, автоматический поиск в сетевых терминологических
базах)
-
Автоматическое извлечение
терминологии
(понятие и этапы извлечения терминологии, системы
автоматического извлечения
терминологии, примеры систем, функции и возможности
PROMT Term).
-
Тезаурусы
(дефиниция, тезаурусы в лингвистике, области
применения тезаурусов, примеры тезаурусов, тезаурус
WordNet, синсеты, информационно-поисковые тезаурусы, цели
разработки ИПТ, информационно-поисковые языки, дескрипторы, ключевые
слова, правила включения терминов в тезаурус. Онтологии).
-
Компьютерный перевод
(понятие перевода, виды переводов, тотальный перевод.
Компьютерная обработка текста как перевод. Компьютерный
межсемиотический перевод. Компьютерный межязыковой перевод.
Компьютерная локализация. Перевод с современной глобальной
информационной среде.
-
Cредства автоматизированного перевода
(machine translation, machine-assisted translation, CAT,
информационные технологии для перевода, перевод для ИТ,
лингвистические информационные технологии)
-
Интернационализация и локализация (понятие
интернационализации и локализации, основные элементы и этапы локализации, инструментарий локализации,
шаблонные переводчики, примеры и
характеристики специализированных систем локализации)
-
Технологии компьютерного перевода (технологии Rule-based (Interlingua,
Transfer consecutive, Transfer hierarchica) и Statistical-based,
Hybrid-based, их характеристика
и примеры реализации, проекты UNL, DLT, NLC, оценка
эффективности технологии перевода)
-
Системы и сервисы компьютерного
перевода (понятие системы компьютерного перевода, основные параметры
систем MT, сравнительные характеристики систем от ведущих
разработчиков, система PROMT, система
Belazar, особенности и примеры
сетевых переводческих сервисов)
-
Тranslation Мemory (понятие, основы технологии, эффективность,
востребованность, стандарты, разработчики
Translation Memory и их
системы)
-
Нейронные сети (модели компьютерной обработки
информации, искусственные нейроны и нейронные сети,
перцептрон, нейрокомпьютеры, области применения и правила
использования нейронных сетей, ограничения нейронных сетей)
-
Машинное обучение (Machine Learning, обучение по
прецедентам, алгоритмы обучения нейронных сетей, метод
обратного распространения ошибки, глубокое обучение, задачи
и приложения машинного обучения, машинное обучение в
обработке текста, машинное обучение на векторных моделях)
|