УЧЕБНО-МЕТОДИЧЕСКАЯ КАРТА УЧЕБНОЙ ДИСЦИПЛИНЫ

 

Номер раздела, темы

Название раздела, темы

Количество аудиторных часов

Форма контроля

знаний

Лекции

Практические

занятия

Количество часов

УСР

1

2

3

4

7

9

 

Основы компьютерной лингвистики
(66 ч.)

16

38

12

зачёт

1

Понятие компьютерной лингвистики
(2 ч.)

2

 

 

Тест

2

Научные основы компьютерной лингвистики (4 ч.)

4

4

 

Тест, защита реферата

3

Квантитативная лингвистика
(14 ч.)

2

10

2

 

3.1

Понятие квантитативных методов

2

 

 

Тест

3.2

Статистические методы в грамматике

 

2

 

Отчет по пр.раб.

3.3

Частотные словари

 

4

2

Отчет по пр.раб., защита реферата

3.4

Регулярные выражения

 

4

 

Отчет по пр.раб.

4

Приложения компьютерной лингвистики (26 ч.)

4

12

10

 

4.1

Компьютерный анализ текста

 

2

2

Отчет по пр.раб.

4.2

Семантический анализ и онтологии

 

2

 

Отчет по пр.раб.

4.3

Распознавание и синтез устной речи

 

2

2

Отчет по пр.раб.

4.4

Компьютерная лексикография и перевод

2

2

2

Отчет по пр.раб.

4.5

Методы поддержания диалога на естественных языках

 

2

2

Отчет по пр.раб.

4.6

Автоматическая обработка текста в системах искусственного интеллекта

2

2

2

Отчет по пр.раб., защита реферата,

5

Корпусная лингвистика (16 ч.)

4

12

 

 

5.1

Понятие лингвистического корпуса

2

 

 

Тест, защита реферата

5.2

Метаязыковая разметка, лингвистическое аннотирование

2

4

 

Отчет по пр.раб.

5.3

Лингвистические исследования на основе языковых корпусов

 

4

 

Отчет по пр.раб.

5.4

Программы для работы с корпусами

 

4

 

Отчет по пр.раб.

 

ВСЕГО ЧАСОВ:

16

38

12

зачёт

 

 

 

8 лекций

Понятие компьютерной лингвистики

Научные основы компьютерной лингвистики

Квантитативная лингвистика -2 часа лекций (Понятие квантитативных методов)

Приложения компьютерной лингвистики - 4 часа лекций

Корпусная лингвистика - 4 часа лекций

 

 

СОДЕРЖАНИЕ УЧЕБНОГО МАТЕРИАЛА

Тема 1 Понятие компьютерной лингвистики - 2 часа лекций

Термин «компьютерная лингвистика» в различных терминологических системах. Подходы к определению компьютерной лингвистики через объект исследования, предмет, методы, инструментарий. Компьютерная лингвистика как наука и область исследовательских и конструкторских разработок. Компьютерная лингвистика в ряду других лингвистических дисциплин, ее цели и задачи. Предмет и объект компьютерной лингвистики.

Компьютерная лингвистика как учебный предмет для филологических и математических специальностей. Основные центры изучения компьютерной лингвистики. Образовательные ресурсы по компьютерной лингвистике.

Тема 2 Научные основы компьютерной лингвистики - 4 часа лекций

Эволюция научного понимания языка и задач его изучения (В. Фон Гумбольдт, Август Шлейхер, Бодуэн де Куртенэ, Ф. де Соссюр). Научные метафоры языка. Лингвистический поворот. Л. Витгенштейн и структурная лингвистика. Генеративные грамматики Н. Хомского, теория «Смысл-Текст» И. А. Мельчука. Формальная семантика Ричарда Монтегю.

Современная математика в периодизации А. Колмогорова. Логические и лингвистические проблемы современной математики. Языки формальной логики. Математическая логика. Формальные грамматики Исчисления. Предикаты. Нечетка логика. Лингвистические вычисления. Проблема вычислимости и сложности. Математическая лингвистика. Компьютер как языковая машина. Лингвистические проблемы компьютерных наук. Идеи А. Тьюринга, А. Чёрча, А.Н. Колмогорова, А.А. Маркова. Математические выражения грамматик Хомского. Формальные языки. Языки программирования и разметки.

Тема 3 Квантитативная лингвистика -2 часа лекций (Понятие квантитативных методов)

Понятие квантитативных методов. Основные статистические категории.

Статистико-комбинаторные, дистрибутивно-статистические и дешифровочные методы в грамматике. Меры автономности грамматических структур и их семантики. Функциональная нагрузка грамматических категорий.

Частотные словари, словари-индексы, машинные фонды лексики. Конкордансы. Регулярные выражения. Характеристики частотных словарей и индексы покрытия текста. Квантитативные закономерности. Ограниченность квантитативных методов исследования языка.

Тема 4 Приложения компьютерной лингвистики - 4 часа лекций

Компьютерная лексикография и перевод - 2
Автоматическая обработка текста в системах искусственного интеллекта 2

Графематический и фонетический анализ. Морфологический анализ. Синтаксический анализ. Семантический анализ и онтологии. Автогенерация текста. Атрибуция текста. Фоносемантический анализ, Semantic Web, системы и сервисы. Распознавание и синтез устной речи. Компьютерная лексикография и перевод. Методы поддержания диалога на естественных языках. Автоматическая обработка текста в системах искусственного интеллекта.

Тема 5 Корпусная лингвистика - 4 часа лекций

Понятие лингвистического корпуса 2
Метаязыковая разметка, лингвистическое аннотирование 2

Понятие лингвистического корпуса. История корпусной лингвистики. Корпусный (эмпирический) подход в сравнении с хомскианской лингвистикой.

Понятие разметки. Метаразметка. Языки разметки. Метаязык. Лингвистическая разметка (аннотирование). Задачи и основные направления корпусной лингвистики. Развитие лингвистических корпусов в мире.

Типы корпусов. Лингвистическая аннотация и метаданные. Лингвистические исследования на базе корпуса.

Методы извлечения информации из корпуса. Типы извлекаемой информации. Конкорданс.

Программы для работы с корпусом.