Лексикографический порядок +

 

 

 

Лексикографический порядок (dictionary order, lexicographical order) — отношение линейного порядка на множестве слов над некоторым упорядоченным алфавитом.

Примеры:

  • естественный порядок на неотрицательных целых числах в любой позиционной системе счисления, записанных в разрядной сетке фиксированной длины (000, 001, 002, 003, 004, 005, …, 998, 999)

  • порядок слов в словаре. Предполагается, что буквы можно сравнивать, сравнивая их номера в алфавите. Тогда лексикографический порядок — это, например, А < АА < ААА < ААБ < ААВ < АБ < Б < … < ЯЯЯ.

Лексикографический (словарный) порядок — способ упорядочивания и сортировки слов, который обычно используется в словарях, энциклопедиях и алфавитных указателях. Он основан на правилах, которые позволяют сделать поиск нужной информации проще и быстрее.

Инструкция:

  • В основе лексикографического порядка лежит алфавит. Слова, начинающиеся на букву «а», предшествуют словам, начинающимся на букву «б». Слова, начинающиеся на «ан», идут раньше слов, начинающихся на «ар», и так далее.
    При сортировке учитываются все буквы.

  • Если все буквы более короткого слова совпадают с началом более длинного слова, то короткое слово предшествует длинному. Например, слово «бар» идет раньше, чем «бармен».

  • Нет четкого правила, различающего буквы «е» и «ё». Например, слово «ёлка» может предшествовать слову «ель».
    Если два слова различаются только тем, что в одном из них есть буква «е», а в другом — «ё», то слово с буквой «е» идет первым. Например, «всё» должно стоять после слова «все».

  • Слова, включающие в себя дефис или пробел, упорядочиваются так, как если бы они писались слитно. Например, «иван-да-марья» стоит перед «иванник», а слово «по возвращении» идет после «повзводно».

  • В полном имени человека первой всегда идет фамилия, а имя, отчество и звание пишутся после нее через запятую. Например, «Павлов, Иван Петрович, академик», «Ньютон, Исаак».

  • Имена древних римлян упорядочиваются по третьему имени (cognomen), а первые два пишутся после него через запятую, как если бы это были имя и отчество. Например, «Цезарь, Гай Юлий», «Цицерон, Марк Туллий».

  • В японских именах фамилия всегда предшествует имени. Иногда имя отделяют от фамилии запятой, например, «Камидзё, Тома».

  • Китайские имена упорядочиваются так, как если бы они писались слитно. Например, «Мао Цзе-дун» следует после «маори», а «Сунь Ятсен» — после «Сунна».

  • Иностранные имена и названия упорядочиваются без артикля. Если артикль необходим, он пишется после слова через запятую, например, "Sorcerer’s Apprentice, The, 2010".

 

 

 

Обратный словарь

 

 

Обратный словарь — словарь, в котором слова отсортированы в алфавитном порядке по конечным буквам.

Для удобства поиска выравнивание списка слов в таком словаре идет не по левому, а по правому краю.

Обратный словарь помогает изучать языки, имеющие суффиксальную агглютинацию, в которых конец слова несёт бо́льшую грамматическую нагрузку, чем начало. Такие словари полезны при изучении словообразования (суффиксального, постфиксального), особенностей строения конца слов. В компьютерной лингвистике они используются как основа для составления и проверки словарей словоформ. Обратный словарь также может быть использован в качестве словаря рифм.

Порядок расположения слов в этих словарях обычный – «прямой» алфавитный, только алфавитное расположение устанавливается исходя из букв конца слова начиная с последней.

Фрагмент для буквы А:

а
ба
аба
кааба
баба

 

Фрагмент для буквы Ч:

хрыч
сыч
ульч
ключ
бирюч
мяч

 

 

Родоначальниками обратных словарей считаются средневековые арабские классические словари XIII-XIV вв.

В Европе в XVIII в. обратный алфавитный порядок слов использовался при составлении словарей рифм (рифмовников). В конце XIX – начале XX вв. появились собственно лингвистические обратные словари. Это были обратные словари древних индоевропейских языков: латинского, древнегреческого, санскрита, тохарского, древнеперсидского и старославянского.

Первые обратные словари русского языка появились за рубежом: в 1958 г. – в Берлине (под редакцией Г. Бильфельдта), в 1958-1959 гг. – в Висбадене (словарь Р. Греве, Г. Крёше под редакцией М. Фасмера).

Первым в СССР является «Обратный словарь русского языка» (научные консультанты А. А. Зализняк, Р. В. Бахтурина, Е. М. Сморгунова) (М., 1974), содержащий около 125 000 слов. Машинная обработка материала и вычислительные работы проводились в Вычислительном центре АН СССР.
 

Обратным является «Грамматический словарь русского языка» А.А.  Зализняка. В нем при каждом слове стоят совсем другие индексы: с их помощью сообщаются грамматические сведения. Благодаря обратному расположению слова с одинаковыми грамматическими свойствами оказываются рядом.

***

Больше всего слов в любом «прямом» – толковом или орфографическом – словаре русского языка начинается на букву п. На  П начинается много приставок (пере-, перед-, по-, под-, подо-, после-, пра-, пре-, пред-, предо-, при-, про-, противо-). В 17-томном словаре на долю п приходится три тома!

А на какую букву оказывается больше всего слов в обратном словаре? На ту, которой не начинается ни одно слово, а именно: на ь – «мягкий знак»! На й – начинаются слова только в виде исключения, но ею кончаются все прилагательные и большинство причастий.

 

 

 

Эрратив

 

 

Эрратив (от лат. errare в значении «ошибаться») — слово или выражение, подвергнутое нарочному искажению носителем языка, владеющим литературной нормой, для придания особого эффекта.

Термин был введён в науку филологом Гасаном Гусейновым.

Эрративы можно разделить на первичные и вторичные.

Первичный эрратив искажает письменную форму, воспроизводя (обычно искажая и её) устную форму слова («как слышыцца, так и пишыцца»; этот эффект сложнее повторить, например, в белорусском языке, где фонетический принцип письма используется гораздо шире).

Вторичные эрративы представляют собой обычно труднопроизносимую гиперкоррекцию предполагаемого первичного эрратива.

Эрративы нередко используются в создании товарных брендов и названий, зачастую из-за невозможности зарегистрировать нормативную форму (Blu-Ray, Linkin Park и т. д.)