Лингвистические методы в АОТ

 

 

 

Лингвист? Давай до свидания!

Фредерик Джелинек (Frederick Jelinek; 1932-2010) — выдающийся учёный в области теории вычислительных систем, один из пионеров автоматической обработки естественного языка и речи, автор крылатого выражения:

  • Anytime a linguist leaves the group the recognition rate goes up

  • Каждый раз, когда лингвист покидает коллектив, качество распознавания речи возрастает.

https://en.wikipedia.org/wiki/Frederick_Jelinek

 

 

Филология и лингвистика

 

ЛИНГВИСТИЧЕСКИЙ ЭНЦИКЛОПЕДИЧЕСКИЙ СЛОВАРЬ

Филология
http://tapemark.narod.ru/les/544b.html

  • Филология (от греч. φιλολογία, буквально — любовь к слову) — содружество гуманитарных дисциплин — языкознания, литературоведения, текстологии и других, изучающих духовную культуру человека через языковой анализ текстов.

  • Текст во всей совокупности своих внутренних аспектов и внешних связей — исходная реальность филологии.

  • Филология вбирает в свой кругозор всю широту и глубину человеческого бытия, прежде всего бытия духовного.

  • Филология определяется не столько границами предмета, сколько подходом к нему.

http://tapemark.narod.ru/les/544b.html

Языкознание (Лингвистика)
http://tapemark.narod.ru/les/267d.html

  • Языкознание (лингвистика) — наука о естественном человеческом языке вообще и о всех языках мира как индивидуальных его представителях.

  • Языкознание входит (в качестве одной из центральных наук) в круг гуманитарных (социальных) научных дисциплин, исследующих человека и человеческое общество.

  • Особенно тесны связи языкознания с психологией.

ВИКИПЕДИЯ

Филология

https://ru.wikipedia.org/wiki/Филология

  • Филология (от др.-греч. «любовь к слову») — совокупность наук (языкознания, текстологии, литературоведения и др.), изучающих культуру народа, выраженную в языке и литературном творчестве.

  • Для лингвистики характерна бо́льшая близость к точным наукам, чем для других дисциплин филологии.

 

 

Лингвистический подход

 

Лингвистический подход характеризуется принципиальным антропоцентризмом, интуитивизмом и субъективизмом и многозначностью.

Это "нормально" для гуманитарной культуры (наук, искусств, творческих интеллектуальных практик), но не эффективно (от слова "совсем") для решения инженерных задач.

 


 

Неопределяемое понятие — начальное (базовое) понятие, определение которого не даётся.

Любая наука и теория строится на неопределяемых понятиях.

Чем более развитой является наука, тем меньше в ней неопределяемых понятий.

  • Математика построена с помощью 2 (двух!) неопределяемых понятий: множество и элемент множества.

    Все математические понятия сводятся в конечном счете к понятиям множество и элемент множества.
    Многие понятия (например, число)сложно (по процедуре) и трудно (для понимания) определить из понятия множества, поэтому они, в учебных целях, не определяются.

  • Неопределяемых понятий в лингвистике множество (в том числе: слово, слог, предложение, текст, язык ++)...

  • Данные понятия понимаются интуитивно, различно описываются, но не имея строгого однозначного определения и употребления не могут служить основой для научной теории (надежной, валидной, фальсифицируемой и верифицируемой).

 

 

Лингвистические абстракции

 

Абстрагирование — универсальный приём научного познания, без которого немыслимы как научное, так и обыденное познание.
Абстракция лежит в основе процессов обобщения, образования понятий и категоризации.

Абстракция (от лат. abstractio — отвлечение) — необходимый момент научного познания, который заключается в мысленном отвлечении от ряда несущественных свойств, связей изучаемого предмета и выделении основных, общих его свойств, связей и отношений. Результатом абстракции являются понятия, категории...

Абстракция — это идеальный (не существующий в действительности) предмет, созданный в результате абстрагирования — мыслительного процесса образования абстрактных сущностей.

Эвальд Васильевич Ильенков Абстракция

Абстракция: https://gtmarket.ru/concepts/7008

 


 

Лингвистическая абстракция  — мысленное отвлечение от различных свойств и связей изучаемого предмета (человека и его культуры с языковой точки зрения), с сохранением и выделением ЧЕЛОВЕЧЕСКОГО в качестве основного, общего его свойства, связей и отношений.

Математическая абстракция   мысленное отвлечение от всех возможных свойств и связей изучаемого предмета, в том числе от человека и человеческого.


 

Теория категорий — высшая степень абстракции в математике.

  • для абстрактного изучения мира используется наука

  • для абстрактного изучения науки используется математика

  • для абстрактного изучения математики используется теория категорий.

Теория категорий  — раздел математики, изучающий свойства отношений между математическими объектами, не зависящие от внутренней структуры объектов.

Теория категорий занимает центральное место в современной математике и является основой информатики.

 

 

 

Метаязыки (для языка и текста)

 

В логической семантике А. Тарским доказана неопределимость понятия истинности средствами предметного языка
(см. например, здесь)

Истинность (определений) возможна только как метаязыковая категория.

Естественные языки семантически замкнуты (включают как выражения с внеязыковой референцией, имена языковых выражений и семантические предикаты). Поэтому на них не распространяется семантического определения истины и логических определений метаязыка и языка-объекта, что приводит к проблемам...

https://en.wikipedia.org/wiki/Semantic_theory_of_truth
https://ru.wikipedia.org/wiki/Семантическая_теория_истины


 

Метаязык — язык, предназначенный для описания другого языка, объектного.

Метаязык — это любой естественный или искусственный язык (язык «второго уровня»), на котором описывается другой язык (язык «первого уровня»).

Метаязык лингвистики — язык построения теории языка и текста, находится в процессе формирования (давнем и нескончаемым).

Естественный язык может быть использован в качестве своего метаязыка (русский разговорный язык для описания русского разговорного языка), что ведет к парадоксам и неустранимым многозначностям.

В качестве метаязыка лингвистики в значительной степени используется естественный язык (синтаксически, лексически, семантически, прагматически).

Математика - универсальный метаязык!

Метаязык математики — формальный язык логического выражения (любой) метатеории.

Метаязык математики — формальный язык логического выражения метатеории языка и текста.

Метаязыки информатики (АОТ, NLP +) — языки разметки (метаданные), служащие для описания данных.

https://ru.wikipedia.org/wiki/Метаязык
https://en.wikipedia.org/wiki/Metalanguage
https://gtmarket.ru/concepts/7029

 

 

Неопределяемое в лингвистике

 

Неопределяемое понятие — начальное (базовое) понятие, определение которого не даётся.

Любая наука и теория строится на неопределяемых понятиях.

Чем более развитой является наука, тем меньше в ней неопределяемых понятий.

 


 

  • Математика построена с помощью 2 (двух!) неопределяемых понятий: множество и элемент множества.

  • Все математические понятия сводятся в конечном счете к понятиям множество и элемент множества.
    Многие понятия (например, число)сложно (по процедуре) и трудно (для понимания) определить из понятия множества, поэтому они, в учебных целях, не определяются.

    Множество


 

  • Неопределяемых понятий в лингвистике множество (в том числе: слово, слог, предложение, текст, язык ++)...

  • Данные понятия понимаются интуитивно, различно описываются (с опорой на другие интуитивные), не имея строгого однозначного определения и употребления они не могут служить надежной основой для научной теории (валидной, фальсифицирукмой и верифицируемой).

List_of_unsolved_problems_in_linguistics

 

 

Текст в лингвистике

 

О понятии «текст»

 

Текст.. позднее научное понятие, введенное в лингвистику в качестве отдельной категории во второй половине 20 века. В конце 60-х гг. XX в. появилась и стала крылатой фраза, звучащая как заклинание: «Мы говорим не словами и предложениями, а текстами».

Костомаров В.Г.: Когда вдруг умами овладела прописная истина, что язык существует все же не ради самого себя,
а как средство выражения мыслей и чувств, возник интерес к тексту как таковому
.

 

Текст, ставший объектом разнопланового лингвистического изучения лишь в последней трети ХХ в., не имеет к настоящему времени однозначного определения из-за отсутствия устоявшегося мнения в отношении состава и понимания текстовых категорий и признаков.

На развитие лингвистики текста также повлияли новые тенденции конца XX в., когда на передний план были выдвинуты:

  • принцип антропоцентризма, что привело к переходу от лингвистики языка к лингвистике общения (Городецкий Б.Ю.),

  • от теории текста – к теории дискурса (Кубрякова Е.С.)

Популярные в языкознании дефиниции текста говорят о феномене сугубо человеческой мысли, речи, коммуникации, восприятия, понимания.

Текст рассматривается исключительно в контексте человеческой (личностной, культурной) активности, что делает невозможным (абсурдным, парадоксальным) саму постановку вопроса о возможности его автоматической генерации и обработке.

Гальперин И.Р. (наиболее цитируемое):

  • Текст - это произведение речетворческого процесса, обладающее завершённостью, объективированное в виде письменного документа, литературно обработанное в соответствии с типом этого документа, произведение, состоящее из названия (заголовок) и ряда особых единиц (сверхфразовых единств), объединённых разными типами лексической, грамматической, логической, стилистической связи, имеющее определённую целенаправленность и прагматическую установку

ГоршковА.И.:

  • Текст – это (1) выраженное в письменной или устной форме (2) упорядоченное и (3) завершенное словесное целое, (4) заключающее в себе определенное содержание, (5) соотносимое с одним из жанров художественной или нехудожественной словесности, (6) отграниченное от других подобных целых и (7) в случае необходимости воспроизводимое в том же виде

Дридзе Т.М.:

  • Текст... целостная единица общения, представляющая собой некоторую систему смысловых элементов, функционально объединённых в единую замкнутую иерархическую коммуникативно-познавательную структуру общей концепцией или замыслом (коммуникативным намерением) субъектов общения

Зарубина Н.Д.:

  • Текст - способ реализации авторского намерения, письменное по форме речевое произведение, принадлежащее одному участнику коммуникации, законченное и правильно оформленное.

Мурзин Л.Н.:

  • Текст ... не существует вне нашего сознания, вне процессов порождения и восприятия. Следовательно, текст по своей природе процессуален и динамичен. Это и результат нашей речевой деятельности, и в то же время сама деятельность

Щедровицкий Г. П:

  • Текст, рассматриваемый вне мышления, культуры, деятельности, есть просто ничто

Исходя из подобных пониманий и определений текста АОТ представляется делом невозможным и безнадежным.

Для эффективной АОТ требуется преодоление антропоцентричности в понимании и определении текста.

 

 

Текст как лингвистическая машина

 

Текст - цепочка символов некоторого языка.

Текст - машина в техносфере...

Программа - машина... работающая в вычислительной среде...


В АОТ текст рассматривается как машина

  • структура,

  • детали,

  • характеристики

  • параметры

  • возможности

В лингвистике рассматривается как "Машина Ивана Лукича":

  • любимая и родная ..

  • которая...

  • которую всегда...

  • о которой ...

  • в которой никогда....

Автомобиль, как метафора текста.

Описать автомобиль можно различным образом...

Число признаков для возможных описаний и классификаций бесконечно.

Суть метода (способа, подхода, парадигмы) в абстрагировании от одних признаков и внимание к другим.

Важно понять: что есть автомобиль? Откуда и куда от нас везёт?

 

В разговоре о Машине Ивана Лукича... речь идёт не столько о машине, сколько о Иване Лукиче (его культуре, окружении, семье, образе жизни, мечтах, характере, привычках, желаниях... в их развитии, изменении) и его представлении об "Идеальной Машине"

Машине Ивана Лукича существенно отличается от Машины Людмилы Николаевны ... от машины ПП,  от машины СВ, от машины...:

  • по возможностям

  • по функциональности

  • .....

  • даже терминологией...


Лингвистика не столько о языке и тексте... сколько о человеке, мире людей и их отношениях людей (по поводу языка и текста)...

АОТ не  столько о языке и тексте... сколько о машинах и мире взаимодействующих машин (по поводу языка и текста)...

 

 

 

Когнитивные искажения

 

Когнитивное искажение (Cognitive bias) — систематическое отклонение в восприятии и мышлении, обусловленные субъективными убеждениями (предубеждениями) и стереотипами, социальными, моральными и эмоциональными причинами, физическими ограничениями и особенностями строения человеческого мозга.

Когнитивные искажения:

  • возникают на основе убеждений, внедрённых в когнитивные схемы

  • обнаруживаются при анализе автоматических мыслей.

 

Люди склонны создавать свою собственную «субъективную социальную реальность», зависимую от их восприятия, и эта субъективная реальность может определять их поведение в социуме, в том числе интеллектуальное. Таким образом, когнитивные искажения могут приводить к неточности суждений, нелогичным интерпретациям или к иррациональности.

Некоторые когнитивные искажения:

  • могут способствовать более эффективным действиям личности в конкретных условиях.

  • позволяют быстрее принимать решения в ситуациях, когда скорость принятия решения важнее его точности

Другие когнитивные искажения являются прямым следствием ограниченных возможностей обработки человеком информации, либо отсутствия соответствующих психических механизмов (ограниченная рациональность).

Когнитивные искажения могут возникать из-за разных причин, в частности:

  • «сбоев» в обработке информации (эвристика);

  • «ментального шума»;

  • ограниченных возможностей мозга по обработке информации;

  • эмоциональных и моральных причин;

  • социального влияния.

Когнитивное_искажение   (Cognitive_bias)

Список_когнитивных_искажений

Эффект Даннинга — Крюгера — метакогнитивное искажение, которое заключается в том, что люди, имеющие низкий уровень квалификации, делают ошибочные выводы, принимают неудачные решения и при этом не способны осознавать свои ошибки в силу низкого уровня своей квалификации. Это приводит к возникновению у них завышенных представлений о собственных способностях.

Эффект_Даннинга_—_Крюгера

 

 

Ценность лингвистического подхода

 

Лингвистический подход антропоцентричен - центрирован на человеке, который является подлинным предметом лингвистики, изучаемым с точки зрения своих языковых (речевых, текстовых, вербальных) активностей и проявлений (в культуре и повседневности).

Лингвистический подход к языку и тексту, центрированный на человеке, не эффективен в АОТ (на современном уровне развития)

Лингвистический подход  к языку и тексту самоценен для человека

Достоевский Федор Михайлович:

Человек есть тайна.
Ее надо разгадать, и ежели будешь ее разгадывать всю жизнь, то не говори, что потерял время;
я занимаюсь этой тайной, ибо хочу быть человеком.

Из письма M. M. Достоевскому, С.-Петербург. 1839 года августа 16 дня
https://rvb.ru/dostoevski/01text/vol15/01text/354.htm

Бунин Иван Алексеевич:

Я человек: как бог, я обречен
Познать тоску всех стран и всех времен.

https://www.culture.ru/poems/27050/sobaka

 


 

Лингвистический и математический (вычислительный) подходы - необходимые и дополняющие друг друга способы (методы) восприятия, понимания, исследования языка и текста

Питер Уоттс, Ложная слепота:

  • Они могут одновременно удерживать в сознании оба аспекта куба Неккера.
    Мы с тобой видим куб или так, или иначе.
    Они видят его обоими способами одновременно.
    Представляешь, какое это им дает преимущество?

https://ru.wikipedia.org/wiki/Куб_Неккера

В (пост-)информационном обществе полезно (для учителя - необходимо):

  • владеть обоими подходами

  • уметь своевременно переключаться между ними

  • использовать их совместно (в идеале)

 

 

Технопоэйя

 

 

Поэтически пребывает человек на этой земле
Ф. Гёльдерлин (гений)

…dichterisch wohnet / Der Mensch auf dieser Erde
In lieblicher Bläue…)


 

  • Фюсис (Physis, естество) — мир естества, природа

  • Техне (Techne, искусство) мир искусственного, инобытие природы, техника, техносфера

  • Поэзис (Poiein, творчество) мир символов и смыслов, наполняющих и оправдывающих мир природы и мир техники

ТЕХНОПОЭЙЯ (technopoeia; греч. techne, искусство, ремесло + греч. poiein, создавать; ср. мифопоэйя, логопоэйя) - поэтическая сторона техники как деятельности, воплощающей творческие устремления человека  и символическое видение мира.

  • Мосты, раскинувшиеся над реками как рукотворные радуги; города, сияющие белыми небоскребами в голубой дымке; виртуальные миры, приносящие нам свободу фантазий и первоплощений, – все это технопоэйя. Техника не менее метафорична и символична, чем поэзия, только она воплощает эту энергию созидания не в словах, а в поэтически преображенной материи, где каждый элемент "играет" с природой, преодолевает силу тяжести, дальность расстояний, ограниченность тела.

  • Технопоэйя – техника как поэзия - позволяет прозревать незримое, слышать неслышимое, глаголить многими языками, доносить свое слово до краев мира. Подобно пушкинскому "шестикрылому серафиму", она распахивает пространства земли и неба, утверждает многомерность и вездесущность духа.

  • Технопоэйя – это техника как инобытие поэзии.

Эпштейн М.Н. От знания – к творчеству. Как гуманитарные науки могут изменять мир. – М.; СПб.: ЦГИ, 2016. – 480 с. (Серия «Humanitas»).
 


Тьмы низких истин мне дороже
Нас возвышающий обман.

А.С. Пушкин

Б.П. Вышеславцев:

  • В этом парадоксе дана гениальная оценка сублимирующей фантазии, присутствующей во всяком истинном творчестве.

  • Множество плоских гимназических сочинений было написано на тему этого двустишия. Главное недоразумение заключалось всегда в непонимании парадоксального выражения «обман».

  • Оно, конечно, не может означать лжи, мистификации, надувательства. Акт обмана, как безнравственного действия, никого не может «возвышать» и не может быть нам «дорог». Дело идет, очевидно, об «обмане» в другом смысле: образы фантазии «обманчивы» по сравнению с истинами опытной науки или трезвого житейского разума. «Обманчивы», но ценны, потому что возвышают (сублимируют).

  • Вся поэзия представляет собой такой «возвышающий обман». Однако он имеет свой собственный критерий истинности, критерий истинной ценности, «художественной правды».

  • Этим критерием будет подлинность сублимации: то, что действительно возвышает, перестает быть «обманом» в каком-либо смысле, ибо в своем сублимировании и формировании рождает новую эмпирическую реальность.

  • Фантастически-обманчивый образ ваятеля, сублимирующий и формирующий кусок камня в статую прекрасной женщины, перестает быть «обманом» и становится полноценной и полновесной реальностью. Правда, «здравый» рассудок может высказать довольно инфантильную «низкую истину», что это каменная женщина, а не настоящая и потому «обман»; истину, на которой основана мечта о прекрасной Галатее.

  • Однако мечта эта в принципе исполнилась: существует искусство, создающее полную реальность; такова архитектура: когда выстроен храм или дом, то уже нельзя сказать, что это «не настоящий» храм или «не настоящий» дом. То же относится и к музыке – она вполне реальна. Но то же относится и к творчеству в самом широком смысле, например творчеству техническому (изобретению) и социальному (социальное «строительство»): оно создает новую подлинную реальность, а никак не обман»

Вышеславцев Б.П. Этика преображенного Эроса. – М.: Республика, 1994., С.55

 

 

Лингвистические методы в АОТ

 

 

Метод (от греч. путь)  —  способ достижения цели, решения задачи; построения и обоснования системы знания.

Семь кратких выводов:

  1. Лингвистические методы (пути) неотъемлемая составляющая сокровищницы интеллектуального опыта.

  2. Лингвистические методы имели больщое значение на ранних этапах АОТ и оказали на АОТ существенное влияние.

  3. С развитием АОТ значение лингвистических методов неуклонно уменьшалось.

  4. Основные успехи АОТ достигнуты на иных путях, иными методами.

  5. Непосредственное применение лингвистических методов в АОТ крайне ограничено и, как правило, непродуктивно.

  6. Опосредованное применение  лингвистических методов в АОТ требует учёта когнитивных искажений.

  7. Возможно, на новом уровне развития, пути АОТ сблизятся, пересекутся и сольются с лингвистическими методами )