-
Понятие компьютерной лингвистики
Термин «компьютерная лингвистика». Подходы к определению
компьютерной лингвистики через объект, предмет, задачи, средства и
методы. Математическая лингвистика. Вычислительная лингвистика.
Приложения компьютерной лингвистики.
-
Логико-математические и языковедческие основы компьютерной
лингвистики
Логические и лингвистические проблемы современной математики.
Формализмы. Языки формальной логики. Лингвистические проблемы
компьютерных наук. Эволюция научного понимания языка и задач его
изучения. Научные метафоры языка. Формальные грамматики и семантики.
-
Квантитативная лингвистика
Понятие
квантитативных методов. Модель текста bag-of-words.
Частотные словари, словари-индексы, машинные фонды лексики.
Частотный
словарь как векторная модель текста, латентно-семантический анализ,
нормализация и стемминг. Конкордансы. Регулярные выражения.
Характеристики частотных словарей и индексы покрытия текста.
Квантитативные закономерности. Ограниченность квантитативных методов
исследования языка и их следствия)
-
Корпусная лингвистика
Понятие "корпуса текстов". Цель и задачи корпусной лингвистики.
Виды
и типы корпусов. Приложения и ограничения лингвистических
корпусов. Корпусный подход в сравнении с хомскианской лингвистикой.
Средства и методы разметки корпусной информации. Лингвистические
исследования на базе корпусов. Поисковые технологии в текстовых корпусах.
Использования корпусов в преподавании
языков.
-
Компьютерная лексикография и терминография
Предмет, задачи и особенности компьютерной лексикографии,
лексикографическое противоречие. Лексикографическая концепция
электронного словаря. Инструменты воплощения
лексикографической концепции. Сетевые словарные сервисы. Предмет и
приложения компьютерного терминоведения. Терминологические базы
данных. Управление терминологией. Автоматическое извлечение
терминологии. Компьютерные тезаурусы. Синсеты.
Информационно-поисковые тезаурусы.
-
Компьютерный перевод
Понятие компьютерного перевода. Автоматический и автоматизированный
перевод. CAT. Технологии компьютерного перевода их характеристика и
примеры реализации. Оценка эффективности технологии
перевода. Оценка качества машинного перевода. Технологии и системы Тranslation Мemory.
Интернационализация и локализация: понятие, инструментарий,
характеристики специализированных систем.
-
Компьютерное распознавание и синтез устной речи
Технологии распознавания устной речи
по образцу и на основе выделения лексических элементов. Методы
выделения из речи лексических элементов. Лингвистические проблемы
распознавания устной речи.
Технологии и модели синтеза устной речи. Языковая инфраструктура
синтеза и распознавания речи. Голосовые платформы.
VoiceXML и Speech Application Language.
-
Формальные языки и грамматики
Математическая модель языка. Коммуникативная абстракция языка
Формальный язык как множество и как
алгебраическая система. Характеристики формальных языков. Лексика, грамматика и
семантика формальных языков. Иерархия
Хомского. Замкнутость и распознавание формальных языков. Формальные
грамматики как математические модели. Свойства и модели
формальных грамматик, синтаксические теории. Формальная модель порождающей
грамматики (терминалы, нетерминалы, выводы).
-
Лингвистическое обеспечение искусственного интеллекта
Понятие искусственного интеллекта. Искусственный интеллект как
лингвистическая проблема. Автоматическая обработка текста в
системах искусственного интеллекта. Автогенерация связного текста.
Методы и технологии поддержания диалога на естественных языках.
Нейронные сети и машинное обучение в обработке текстовой
информации.
-
Метатекстовая разметка и лингвистическое аннотирование
Метаразметка. Языки разметки. Метаязык. XML и
его приложения в области работы с электронным текстом.
Лингвистическая разметка. Лингвистическая аннотация и метаданные.
Text Encoding Initiative. Семантическая разметка.
Микроформатная лингвистическая разметка.