Лингвистические методы в АОТ |
Лингвист? Давай до свидания!
|
Фредерик Джелинек
(Frederick Jelinek; 1932-2010) — выдающийся учёный в области теории
вычислительных систем, один из пионеров автоматической обработки
естественного языка и речи,
автор крылатого выражения:
-
Anytime a linguist leaves the group the recognition rate goes up
-
Каждый раз, когда
лингвист покидает коллектив, качество распознавания речи
возрастает.
https://en.wikipedia.org/wiki/Frederick_Jelinek
|
|
Филология и лингвистика
ЛИНГВИСТИЧЕСКИЙ ЭНЦИКЛОПЕДИЧЕСКИЙ СЛОВАРЬ
Филология
http://tapemark.narod.ru/les/544b.html
-
Филология (от греч. φιλολογία, буквально — любовь к слову)
— содружество гуманитарных дисциплин —
языкознания, литературоведения, текстологии и других,
изучающих духовную культуру человека через
языковой анализ текстов.
-
Текст во всей совокупности своих
внутренних аспектов и внешних связей — исходная
реальность филологии.
-
Филология вбирает в свой кругозор всю широту и
глубину человеческого бытия, прежде всего бытия
духовного.
-
Филология определяется не столько границами
предмета, сколько подходом к нему.
http://tapemark.narod.ru/les/544b.html
Языкознание (Лингвистика)
http://tapemark.narod.ru/les/267d.html
-
Языкознание (лингвистика) — наука
о естественном человеческом языке вообще и о
всех языках мира как индивидуальных его
представителях.
-
Языкознание входит (в качестве одной из
центральных наук) в круг гуманитарных
(социальных) научных дисциплин, исследующих
человека и человеческое общество.
-
Особенно тесны связи языкознания с психологией.
ВИКИПЕДИЯ
Филология
https://ru.wikipedia.org/wiki/Филология
-
Филология (от др.-греч. «любовь к слову») —
совокупность наук (языкознания, текстологии,
литературоведения
и др.), изучающих культуру народа, выраженную в
языке и литературном творчестве.
-
Для лингвистики характерна бо́льшая близость к
точным наукам, чем для других дисциплин филологии.
|
Лингвистический подход
Лингвистический подход
характеризуется принципиальным антропоцентризмом, интуитивизмом
и субъективизмом и многозначностью.
Это "нормально" для гуманитарной
культуры (наук, искусств, творческих интеллектуальных практик), но не
эффективно (от слова "совсем") для решения инженерных задач.
Неопределяемое понятие
— начальное (базовое) понятие, определение которого не даётся.
Любая наука и теория строится на неопределяемых понятиях.
Чем более развитой является наука, тем меньше в ней неопределяемых
понятий.
-
Математика построена с помощью 2 (двух!)
неопределяемых понятий:
множество
и
элемент множества.
Все математические понятия сводятся в конечном
счете к понятиям множество и элемент множества. Многие понятия (например, число)сложно (по процедуре) и трудно (для
понимания) определить из понятия множества, поэтому они, в учебных
целях, не определяются.
-
Неопределяемых понятий в лингвистике множество (в
том числе: слово, слог, предложение, текст, язык ++)...
-
Данные понятия понимаются интуитивно, различно
описываются, но не имея строгого однозначного определения и употребления
не могут служить основой для научной теории (надежной, валидной,
фальсифицируемой и верифицируемой).
|
Лингвистические абстракции
Абстрагирование
— универсальный приём научного познания, без которого немыслимы
как научное, так и обыденное познание.
Абстракция лежит в основе процессов обобщения, образования
понятий и категоризации.
Абстракция
(от лат. abstractio — отвлечение) — необходимый момент научного познания, который заключается в мысленном отвлечении от
ряда несущественных свойств, связей изучаемого предмета и выделении
основных, общих его свойств, связей и отношений. Результатом
абстракции являются понятия, категории...
Абстракция
— это идеальный (не существующий в действительности) предмет,
созданный в результате абстрагирования — мыслительного процесса
образования абстрактных сущностей.
Эвальд Васильевич Ильенков
Абстракция
Абстракция:
https://gtmarket.ru/concepts/7008
Лингвистическая абстракция
—
мысленное отвлечение от
различных свойств и связей изучаемого предмета (человека и его
культуры с языковой точки зрения), с сохранением и выделением
ЧЕЛОВЕЧЕСКОГО в качестве
основного, общего его свойства, связей и отношений.
Математическая абстракция
—
мысленное отвлечение от
всех возможных свойств и связей изучаемого предмета, в том числе
от человека и человеческого.
Теория
категорий — высшая степень абстракции
в математике.
-
для абстрактного изучения мира
используется наука
-
для
абстрактного изучения науки используется математика
-
для
абстрактного изучения математики используется теория
категорий.
Теория категорий
— раздел математики,
изучающий свойства отношений между математическими объектами, не
зависящие от внутренней структуры объектов.
Теория категорий занимает
центральное место в современной математике и является основой
информатики.
|
Метаязыки (для языка и текста)
В логической
семантике
А. Тарским доказана неопределимость понятия истинности
средствами предметного языка
(см. например,
здесь)
Истинность
(определений) возможна только как метаязыковая категория.
Естественные
языки семантически замкнуты (включают как выражения с внеязыковой
референцией, имена языковых выражений и семантические предикаты).
Поэтому на них не распространяется семантического определения истины
и логических определений метаязыка и языка-объекта, что приводит к
проблемам...
https://en.wikipedia.org/wiki/Semantic_theory_of_truth
https://ru.wikipedia.org/wiki/Семантическая_теория_истины
Метаязык
— язык, предназначенный для описания другого языка, объектного.
Метаязык
— это любой естественный или искусственный язык (язык «второго уровня»),
на котором описывается другой язык (язык «первого уровня»).
Метаязык лингвистики
— язык построения теории языка и текста, находится в процессе
формирования (давнем и нескончаемым).
Естественный язык может быть использован в качестве своего метаязыка
(русский разговорный язык для описания русского разговорного языка),
что ведет к парадоксам и неустранимым многозначностям.
В качестве метаязыка лингвистики в значительной степени используется
естественный язык (синтаксически, лексически, семантически,
прагматически).
Математика - универсальный метаязык!
Метаязык математики
— формальный язык логического выражения (любой) метатеории.
Метаязык математики
— формальный язык логического выражения метатеории языка и текста.
Метаязыки
информатики
(АОТ, NLP +) — языки разметки
(метаданные), служащие для описания данных.
https://ru.wikipedia.org/wiki/Метаязык
https://en.wikipedia.org/wiki/Metalanguage
https://gtmarket.ru/concepts/7029
|
Неопределяемое в лингвистике
Неопределяемое понятие
— начальное (базовое) понятие, определение которого не даётся.
Любая наука и теория строится на неопределяемых понятиях.
Чем более развитой является наука, тем меньше в ней неопределяемых
понятий.
-
Математика построена с помощью 2 (двух!)
неопределяемых понятий:
множество
и
элемент множества.
-
Все математические понятия сводятся в конечном
счете к понятиям множество и элемент множества. Многие понятия (например, число)сложно (по процедуре) и трудно (для
понимания) определить из понятия множества, поэтому они, в учебных
целях, не определяются.
Множество
-
Неопределяемых понятий в лингвистике
множество
(в
том числе: слово, слог, предложение, текст, язык ++)...
-
Данные понятия понимаются интуитивно, различно
описываются (с опорой на другие интуитивные), не имея строгого однозначного определения и употребления
они не могут служить надежной основой для научной теории (валидной,
фальсифицирукмой и верифицируемой).
List_of_unsolved_problems_in_linguistics
|
Текст в лингвистике
О понятии «текст»
Текст.. позднее научное понятие,
введенное в лингвистику в качестве отдельной категории во второй
половине 20 века. В конце 60-х гг. XX в. появилась и стала
крылатой фраза, звучащая как заклинание: «Мы говорим не словами и
предложениями, а текстами».
Костомаров В.Г.:
Когда вдруг умами
овладела прописная истина, что язык существует все же не ради самого
себя, а как средство выражения мыслей и чувств, возник
интерес к тексту как таковому.
Текст, ставший объектом разнопланового лингвистического изучения лишь
в последней трети ХХ в., не имеет к настоящему времени однозначного
определения из-за отсутствия устоявшегося мнения
в отношении состава и понимания текстовых
категорий и признаков.
|
На развитие лингвистики текста также повлияли новые тенденции конца
XX в., когда на передний план были выдвинуты:
-
принцип антропоцентризма, что привело к переходу от лингвистики
языка к лингвистике общения (Городецкий Б.Ю.),
-
от теории текста – к
теории дискурса (Кубрякова Е.С.)
Популярные в языкознании дефиниции
текста говорят о феномене сугубо человеческой мысли, речи,
коммуникации, восприятия, понимания.
Текст рассматривается исключительно в
контексте человеческой (личностной, культурной) активности, что
делает невозможным (абсурдным, парадоксальным) саму постановку
вопроса о возможности его автоматической генерации и обработке.
Гальперин
И.Р.
(наиболее
цитируемое):
-
Текст - это произведение речетворческого процесса, обладающее
завершённостью, объективированное в виде письменного документа,
литературно обработанное в соответствии с типом этого документа,
произведение, состоящее из названия (заголовок) и ряда особых единиц
(сверхфразовых единств), объединённых разными типами лексической,
грамматической, логической, стилистической связи, имеющее
определённую целенаправленность и прагматическую установку
ГоршковА.И.:
-
Текст – это (1) выраженное в письменной или устной форме (2) упорядоченное и (3) завершенное словесное целое, (4)
заключающее в себе определенное содержание, (5) соотносимое с одним из жанров
художественной или нехудожественной словесности, (6) отграниченное от других подобных целых
и (7) в случае необходимости воспроизводимое в том же виде
Дридзе Т.М.:
-
Текст... целостная единица
общения, представляющая собой некоторую систему смысловых элементов,
функционально объединённых в единую замкнутую иерархическую
коммуникативно-познавательную структуру общей концепцией или
замыслом (коммуникативным намерением) субъектов общения
Зарубина
Н.Д.:
-
Текст -
способ реализации авторского намерения,
письменное по форме речевое произведение, принадлежащее одному
участнику коммуникации, законченное и правильно оформленное.
Мурзин
Л.Н.:
-
Текст ... не существует
вне нашего сознания, вне процессов порождения и восприятия.
Следовательно, текст по своей природе процессуален и динамичен. Это
и результат нашей речевой деятельности, и в то же время сама
деятельность
Щедровицкий
Г. П:
-
Текст,
рассматриваемый вне мышления, культуры, деятельности,
есть просто ничто
Исходя из подобных пониманий и определений
текста АОТ представляется делом невозможным и безнадежным.
Для эффективной АОТ требуется преодоление
антропоцентричности в понимании и определении текста.
|
Текст как лингвистическая машина
Текст
-
цепочка символов некоторого языка.
Текст - машина в техносфере...
Программа -
машина... работающая в вычислительной среде...
В АОТ текст рассматривается
как
машина
-
структура,
-
детали,
-
характеристики
-
параметры
-
возможности
В лингвистике
рассматривается как "Машина Ивана Лукича":
-
любимая и родная ..
-
которая...
-
которую всегда...
-
о которой ...
-
в которой никогда....
Автомобиль,
как метафора текста.
Описать автомобиль можно различным
образом...
Число признаков для возможных
описаний и классификаций бесконечно.
Суть метода (способа,
подхода, парадигмы) в абстрагировании от одних признаков и внимание к
другим.
Важно понять: что есть
автомобиль?
Откуда и куда от нас
везёт?
|
В разговоре о
Машине Ивана
Лукича...
речь идёт не столько о машине, сколько о
Иване Лукиче (его культуре, окружении, семье,
образе жизни, мечтах, характере,
привычках, желаниях... в их развитии,
изменении)
и его представлении об "Идеальной
Машине"
Машине Ивана
Лукича существенно
отличается от
Машины Людмилы
Николаевны
... от машины
ПП, от машины СВ, от машины...:
-
по
возможностям
-
по
функциональности
-
.....
-
даже терминологией...
Лингвистика не столько о
языке и тексте... сколько о человеке,
мире людей и их отношениях людей (по поводу языка и текста)...
АОТ не
столько о языке и
тексте... сколько о машинах и мире взаимодействующих машин (по
поводу языка и текста)...
|
Когнитивные искажения
Когнитивное искажение
(Cognitive bias) — систематическое отклонение в
восприятии и мышлении, обусловленные
субъективными убеждениями (предубеждениями) и
стереотипами, социальными, моральными и
эмоциональными причинами, физическими
ограничениями и особенностями строения
человеческого мозга.
Когнитивные искажения:
-
возникают на основе убеждений, внедрённых в когнитивные схемы
-
обнаруживаются при анализе автоматических мыслей.
Люди склонны создавать свою собственную
«субъективную социальную реальность», зависимую
от их восприятия, и эта субъективная реальность
может определять их поведение в социуме, в том
числе интеллектуальное. Таким образом,
когнитивные искажения могут приводить к
неточности суждений, нелогичным интерпретациям
или к иррациональности.
Некоторые когнитивные искажения:
-
могут способствовать более эффективным действиям личности в
конкретных условиях.
-
позволяют быстрее принимать решения в ситуациях, когда скорость
принятия решения важнее его точности
Другие когнитивные искажения являются прямым
следствием ограниченных возможностей обработки
человеком информации, либо отсутствия
соответствующих психических механизмов
(ограниченная рациональность).
Когнитивные искажения могут возникать из-за
разных причин, в частности:
-
«сбоев» в обработке информации (эвристика);
-
«ментального шума»;
-
ограниченных возможностей мозга по обработке информации;
-
эмоциональных и моральных причин;
-
социального влияния.
Когнитивное_искажение
(Cognitive_bias)
Список_когнитивных_искажений
Эффект Даннинга —
Крюгера — метакогнитивное искажение, которое
заключается в том, что люди, имеющие низкий уровень квалификации, делают
ошибочные выводы, принимают неудачные решения и при этом не способны
осознавать свои ошибки в силу низкого уровня своей квалификации. Это
приводит к возникновению у них завышенных представлений о собственных
способностях.
Эффект_Даннинга_—_Крюгера
|
Ценность лингвистического
подхода
Лингвистический подход
антропоцентричен - центрирован на человеке, который является
подлинным предметом лингвистики, изучаемым с точки зрения своих
языковых (речевых, текстовых, вербальных) активностей и проявлений
(в культуре и повседневности).
Лингвистический
подход к языку и тексту,
центрированный на человеке, не эффективен в АОТ (на современном
уровне развития)
Лингвистический подход к языку и тексту самоценен для человека
Достоевский Федор Михайлович:
Человек
есть тайна. Ее надо разгадать, и ежели будешь ее разгадывать всю жизнь,
то не говори, что потерял время; я занимаюсь этой тайной, ибо хочу быть человеком.
Из
письма M. M. Достоевскому, С.-Петербург. 1839 года
августа 16 дня
https://rvb.ru/dostoevski/01text/vol15/01text/354.htm
Бунин Иван Алексеевич:
Я
человек: как бог, я обречен Познать тоску всех стран и всех времен.
https://www.culture.ru/poems/27050/sobaka
Лингвистический
и математический (вычислительный) подходы - необходимые и
дополняющие друг друга способы (методы) восприятия, понимания,
исследования языка и текста
Питер Уоттс, Ложная слепота:
-
Они могут одновременно удерживать
в сознании оба аспекта куба Неккера.
Мы с тобой видим куб или так, или иначе.
Они видят его обоими способами одновременно.
Представляешь, какое это им дает преимущество?
|
https://ru.wikipedia.org/wiki/Куб_Неккера
|
В
(пост-)информационном обществе полезно (для учителя - необходимо):
|
Технопоэйя
-
Фюсис
(Physis, естество) — мир естества, природа
-
Техне
(Techne, искусство) мир искусственного, инобытие природы,
техника, техносфера
-
Поэзис
(Poiein, творчество) мир символов и смыслов, наполняющих и
оправдывающих мир природы и мир техники
ТЕХНОПОЭЙЯ
(technopoeia; греч. techne, искусство, ремесло + греч. poiein,
создавать; ср. мифопоэйя, логопоэйя) - поэтическая сторона техники
как деятельности, воплощающей творческие устремления человека
и символическое видение мира.
-
Мосты, раскинувшиеся над реками как рукотворные радуги; города,
сияющие белыми небоскребами в голубой дымке; виртуальные миры,
приносящие нам свободу фантазий и первоплощений, – все это
технопоэйя. Техника не менее метафорична и символична, чем
поэзия, только она воплощает эту энергию созидания не в словах,
а в поэтически преображенной материи, где каждый элемент
"играет" с природой, преодолевает силу тяжести, дальность
расстояний, ограниченность тела.
-
Технопоэйя – техника как поэзия - позволяет прозревать незримое,
слышать неслышимое, глаголить многими языками, доносить свое
слово до краев мира. Подобно пушкинскому "шестикрылому
серафиму", она распахивает пространства земли и неба, утверждает
многомерность и вездесущность духа.
-
Технопоэйя – это техника как инобытие поэзии.
Эпштейн М.Н.
От знания – к творчеству. Как гуманитарные науки могут изменять мир.
– М.; СПб.: ЦГИ, 2016. – 480 с. (Серия «Humanitas»).
Тьмы низких
истин мне дороже
Нас возвышающий обман.
А.С. Пушкин
Б.П. Вышеславцев:
-
В этом
парадоксе дана гениальная оценка сублимирующей фантазии,
присутствующей во всяком истинном творчестве.
-
Множество
плоских гимназических сочинений было написано на тему этого
двустишия. Главное недоразумение заключалось всегда в
непонимании парадоксального выражения «обман».
-
Оно,
конечно, не может означать лжи, мистификации, надувательства.
Акт обмана, как безнравственного действия, никого не может
«возвышать» и не может быть нам «дорог». Дело идет, очевидно, об
«обмане» в другом смысле: образы фантазии «обманчивы» по
сравнению с истинами опытной науки или трезвого житейского
разума. «Обманчивы», но ценны, потому что возвышают
(сублимируют).
-
Вся поэзия
представляет собой такой «возвышающий обман». Однако он имеет
свой собственный критерий истинности, критерий истинной
ценности, «художественной правды».
-
Этим
критерием будет подлинность сублимации: то, что действительно
возвышает, перестает быть «обманом» в каком-либо смысле, ибо в
своем сублимировании и формировании рождает новую эмпирическую
реальность.
-
Фантастически-обманчивый образ ваятеля, сублимирующий и
формирующий кусок камня в статую прекрасной женщины, перестает
быть «обманом» и становится полноценной и полновесной
реальностью. Правда, «здравый» рассудок может высказать довольно
инфантильную «низкую истину», что это каменная женщина, а не
настоящая и потому «обман»; истину, на которой основана мечта о
прекрасной Галатее.
-
Однако мечта
эта в принципе исполнилась: существует искусство, создающее
полную реальность; такова архитектура: когда выстроен храм или
дом, то уже нельзя сказать, что это «не настоящий» храм или «не
настоящий» дом. То же относится и к музыке – она вполне реальна.
Но то же относится и к творчеству в самом широком смысле,
например творчеству техническому (изобретению) и социальному
(социальное «строительство»): оно создает новую подлинную
реальность, а никак не обман»
Вышеславцев Б.П.
Этика преображенного Эроса. – М.: Республика, 1994., С.55
|
Лингвистические методы в АОТ
Метод
(от греч.
путь)
—
способ
достижения цели, решения задачи; построения и обоснования
системы знания.
Семь кратких выводов:
-
Лингвистические методы (пути) неотъемлемая составляющая
сокровищницы интеллектуального опыта.
-
Лингвистические методы имели больщое значение на ранних
этапах АОТ и оказали на АОТ существенное влияние.
-
С развитием АОТ значение
лингвистических методов неуклонно уменьшалось.
-
Основные успехи АОТ достигнуты на
иных путях, иными методами.
-
Непосредственное применение лингвистических методов в АОТ
крайне ограничено и, как правило, непродуктивно.
-
Опосредованное применение
лингвистических методов в АОТ требует учёта
когнитивных искажений.
-
Возможно, на новом уровне
развития, пути АОТ сблизятся,
пересекутся и сольются
с
лингвистическими методами )
|
|