ПОНЯТИЕ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ

 

 

В каждой шутке....

 

Из разговора

  • Что такое компьютерная лингвистика (КЛ, CL, Computational Linguistics)?

  • То, чем занимаются компьютерные лингвисты

  • А чем они занимаются?

  • Они занимаются всем!


Компьютерные лингвисты - самоназвание очень разных социальных групп
и отдельных (нередко очень подозрительных) личностей,
которые, действительно... чем только не занимаются ))

 

 

Грамматическая ловушка

 

Словосочетание "компьютерная лингвистика"  провоцирует восприятие "Компьютерной лингвистики" в качестве составной части лингвистики, что, в общем случае, неверно.

Грамматика здесь противоречит семантике ... и проигрывает ей )

Примеры:


Компьютерная лингвистика (как дочка вычислительной лингвистики и внучка математической лингвистики - часть математики (не лингвистики!)

Подробнее: Логико-математические основы КЛ

 

 

Под зонтичным термином

 

 

Зонтичный термин - термин для обозначения группы (разделов) различных дисциплин, объединённых объектом изучения

Примеры:

  • Лингвистика (зонтичный термин, для обозначения изучающих различных дисциплин (прескриптивной лингвистики, дескриптивной лингвистики, теоретической лингвистики, прикладных... лингвистик, ++)

  • Когнитивистика (зонтичный термин, для обозначения изучающих само познание разделов различных наук: психологии и нейрофизиологии, цитологии, химии, физики ++)


Татевосов Сергей Георгиевич:

"Одна из самых болезненных проблем современной лингвистики состоит в том, что статус лингвистики как единой науки в настоящее время весьма проблематичен.

В действительности существует три разных (модели) лингвистики:

  • Теоретическая,

  • Описательная (дескриптивная)

  • Прикладная

Большинство тех, кто называет себя лингвистами, трудится в рамках одного из этих направлений и недоуменно взирает на происходящее внутри других.

Три лингвистики устроены как три различные науки, с собственной терминологией и даже с собственной теорией.

Разрыв между теорией и практикой не преодолен; напротив, возникновение компьютерной лингвистики разделило лингвистов на тех, кто остался в русле теоретической лингвистики и тех, кто ушел в новую науку".


Лингвисты (и шире, любые филологи), использующие компьютерные технологии для решения своих профессиональных проблем часто называют это КОМПЬЮТЕРНОЙ ЛИНГВИСТИКОЙ, а себя - компьютерными лингвистами.

В данной среде КЛ может быть понята как часть лингвистической науки ))

О роли филологии и лингвистики в КЛ смотри здесь

 

 

Дефиниция КЛ

 

Дефиниция (от лат. definitio - ограничение) - вербальная формулировка основного содержания понятия
(результат определения, выступающий в виде краткого текста)

В контексте нашего курса (КЛиТ):

  • Компьютерная лингвистика - компьютерное моделирование языковых феноменов


Компьютерное моделирование  - создание, исследование, использование и поддержка компьютерных моделей

Компьютерная модель .... разберемся на 5 курсе ))

В качестве языковых феноменов могут выступать любые языковые (и речевые) структуры, свойства, операции и отношения... грамматические и лексические... синтаксические, семантические и прагматические...

Например:

  • постфиксы,

  • диалоги,

  • переводы,

  • авторефераты,

  • языки,

  • текстовые метаданные,

  • частотные словари,

  • списки извлеченных из текстов онимов и т.д. и т.п.

 

 

От чистого истока (математического)

 

Современная компьютерная лингвистика уже не часть математики и даже не часть науки...


Путешествие КЛ по областям интеллектуальных практик:

  • Математическая лингвистика (наука) - раздел чистой математики
    (исследование проблем языка формальной логики)

  • Вычислительная лингвистика (наука) - раздел прикладной математики
    (вычислительное моделирование )

  • Компьютерная лингвистика (технонаука) - раздел CS
    (Computer Science, компьютерные науки)

  • Компьютерная лингвистика (технонаука +...) - раздел CSD
    (Computer Science and development
    , компьютерные науки и разработка)

  • Компьютерная лингвистика (исследования +...) - раздел CRD
    (Сomputer research and engineering, компьютерные исследования и инжинириг)

 

 

 

КЛ как ... архаизм

 

01.06.2023  Ступени номинативной репрезентации предмета нашего курса

  • Математическая лингвистика (время прародителей)

  • Вычислительная лингвистика (время родителей)

  • Компьютерная лингвистика (её время... песком сквозь пальцы)

  • NLP-engineering  (детишки подрастают)

  • Data-engineering (ого, уже внучата! ))


NLP - Natural Language Processing

Engineering (от лат. ingenium — изобретательность, выдумка) — информационные и программно-технические исследования и разработки в области обработки данных (символьных цепочек, текстов ))

 

 

К определению КЛ

 

Лосев Алексей Федорович:

  • Определить – значит положить предел, границу.

  • Положить предел чего-нибудь – значит предположить, что есть какое-то инобытие вне этого «чего-нибудь», в которое это «что-нибудь» не переходит» 


Компьютерная лингвистика включает несколько уровней:

  • математический (формальный, логический)

  • языковой (лингвистический)

  • программно-технический (инженерный)

  • сервисный (инструментальный)

  • социокультурный (гуманитарный)

На каждом уровне для неё можно провести особые границы (указать пределы)

Требование точного определения КЛ  ... свидетельство детской наивности (невежественности)...

Корректно и конкретно, определить КЛ значит полностью описать КЛ, ибо подлинное определение может быть дано отнюдь не в «дефиниции», а в «развёртывании существа дела».

 

 

Теория и практика КЛ

 

С точки зрения теории, между теорией и практикой огромная разница и практика без теории мертва.

А с точки зрения практики ... никакой разницы нет ))
 


Теоретически, компьютерная лингвистика (теоретически) является теоретической основой NLP (автоматизации обработки естественного языка, Natural Language Processing)

Практически, различить современную компьютерную лингвистику и NLP ... можно только... теоретически ))

 

 

Базовые задачи КЛ

 

Базовые задачи АОТ:

  • распознавания (выделению) символов (в цепочках), цепочек и их структур (порядка следования)

  • идентификации (соотнесения) символов  (в цепочках), цепочек и их структур (порядка следования)

  • распределения (классификации) символов (в цепочках), цепочек и их структур (порядка следования)

  • замещения (преобразования) одних символов  (в цепочках), цепочек и их структур (порядка следования) другими (в другие)

  • генерации новых  символов (в цепочках), цепочек и их структур (порядка следования)

 

 

 

Приложения КЛ

 

Основные приложения АОТ:

  • Распознавание языков

  • Распознавание текста

  • Распознавание речи

  • Машинный перевод

  • Синтез речи по тексту

  • Автогенерация связной речи

  • Автореферирование текста

  • Поддержание диалога

  • Сентимент анализ (определение тональности текста)

 

 

 

Области применения КЛ

 

 

  • Управление

  • Наука

  • Бизнес

  • Финансы

  • Маркетинг

  • Безопасность

  • Образование

  • Здравоохранение

  • Безопасность

  • Искусство

 

 

Самая суть

 

Цели нашего курса:

  • определить компьютерную лингвистику в координатах своей картины мира

  • самоопределиться в отношении компьютерной лингвистики (и её потомков))

 

 kmp