17 ноября, 2024

hleb

Находите все последние статьи и смотрите телешоу, репортажи и подкасты, связанные с Россией.

Знаки препинания в литературе основных языков — любопытная математическая вещь.

Знаки препинания в литературе основных языков — любопытная математическая вещь.

Эта статья была проверена в соответствии с журналом Science X. процесс редактирования
И Политики.
редакторы Выделите следующие атрибуты, гарантируя достоверность контента:

Функции риска представляют вероятность использования знака препинания как функцию длины последовательности без этих знаков. В плане пунктуации самым сквозным языком является немецкий (зеленый график). Источник: ИФЖ ПАН.

Мгновение колебания… Да, остановитесь здесь — но разве не должна быть запятая? Или лучше дефис? Пунктуация может быть неприятностью; Часто этим просто пренебрегают. ошибка! Последние статистические анализы рисуют иную картину: знаки препинания как бы «вырастают» из показателей степени, общих для всех (исследованных) языков, и их особенности далеко не тривиальны.

Многим пунктуация кажется неизбежным злом, и ее следует с радостью игнорировать, когда это возможно. Недавний анализ литературы, написанной на основных современных языках мира, требует изменения мнения. Фактически, те же самые статистические особенности паттернов употребления пунктуации наблюдаются в нескольких сотнях произведений, написанных на семи языках, в основном на западных.

Пунктуация, все из которых можно найти в предисловии к этому тексту, оказывается универсальным и незаменимым дополнением к математическому совершенству каждого изучаемого языка. Этот увлекательный вывод о роли простых запятых, восклицательных знаков или точек следует из статьи ученых из Института ядерной физики Польской академии наук (IFJ PAN) в Кракове, опубликованной в журнале Nuclear Physics. Хаос, солитоны и фракталы.

«Нынешний анализ является продолжением наших предыдущих выводов о многозапятых особенностях вариации длины предложения в произведениях мировой литературы. Ведь что такое длина предложения? Это не что иное, как расстояние до следующего конкретного знака препинания — целое точку», — говорит профессор Станислав Дроздз (IFJ PAN, Краковский технический университет).

Были изучены два набора текстов. Основной анализ пунктуации на каждом языке был проведен на 240 популярных литературных произведениях, написанных на семи основных западных языках: английском (44), немецком (34), французском (32), итальянском (32), испанском (32), польском (34). ) и русский (32). Этот конкретный выбор языков был основан на критерии: исследователи предполагали, что не менее 50 миллионов человек должны говорить на рассматриваемом языке, а произведения, написанные на нем, должны быть удостоены не менее пяти Нобелевских премий по литературе.

READ  Астрономы разгадывают тайну квазаров и возможное будущее Млечного Пути | Новости науки и техники

Кроме того, для статистической проверки результатов поиска каждая книга должна содержать не менее 1500 последовательных слов, разделенных знаками препинания. Отдельная группа была создана для наблюдения за устойчивостью пунктуации при переводе. Он содержал 14 работ, каждая из которых была доступна на каждом из изучаемых языков (однако два варианта из 98 языков были опущены из-за недоступности).

В общей сложности авторами обеих групп были такие писатели, как Конрад, Диккенс, Дойль, Хемингуэй, Киплинг, Оруэлл, Сэлинджер, Вольф, Грасс, Кафка, Манн, Ницше, Гете, Лафайет, Дюма, Гюго, Пруст, Верн, Эко, Сервантес, или Синквивич, или Ремонт.

Внимание краковских исследователей в первую очередь привлекло статистическое распределение промежутков между последовательными знаками препинания. Вскоре стало очевидно, что во всех изученных языках лучше всего его описывает один из строго определенных вариантов распределения Вейбулла.

Кривая такого рода имеет характерную форму: она сначала быстро растет, а затем, достигнув максимального значения, несколько медленнее спадает до некоторого критического значения, ниже которого достигает нуля с небольшой и постоянно уменьшающейся динамикой. Распределение Вейбулла обычно используется для описания явлений выживания (таких как зависимость численности населения от возраста), а также различных физических процессов, таких как увеличение материального стресса.

«Соответствие между распределением длин последовательностей слов между знаками препинания и функциональной формой распределения Вейбулла было тем лучше, чем больше типов знаков препинания мы включали в анализ; для всех знаков соответствие оказалось почти идеальным. время появляются некоторые различия в распределениях между языкамиОднако это не что иное, как выбор несколько различных значений параметров распределения, специфичных для рассматриваемого языка.Таким образом, пунктуация оказывается неотъемлемой частью всех изучаемых языков», — отмечает профессор Дроздз.

READ  Ракета SpaceX Falcon 9 перевернулась и загорелась при приземлении на дрон-корабль после запуска Starlinks

Через некоторое время он с некоторым изумлением добавляет: «…и поскольку распределение Вейбулла связано с такими явлениями, как выживание, можно без лишних слов сказать, что пунктуация по самой своей природе предполагает реальную борьбу за выживание. »

Следующий этап анализа состоял в определении функции риска. В случае пунктуации он описывает, как условная вероятность успеха, то есть вероятность следующего знака препинания, изменяется, если такой знак не появляется в проанализированной последовательности.

Результаты здесь очевидны: язык с наименьшей склонностью к использованию знаков препинания — английский, испанский не сильно отстает; Славянские языки оказались наиболее зависимыми от знаков препинания. Кривые функции опасности для знаков препинания в шести исследованных языках, по-видимому, следуют аналогичной схеме, они различались в основном вертикальным сдвигом.

Немецкий язык оказался исключением. Его опасная функция — единственная, которая пересекает большинство кривых, предназначенных для других языков. Таким образом, немецкая пунктуация, по-видимому, сочетает в себе черты знаков препинания многих языков, что делает ее разновидностью пунктуации эсперанто.

Вышеприведенное наблюдение согласуется со следующим анализом, целью которого было выяснить, можно ли увидеть особенности пунктуации оригинальных литературных произведений в их переводах. Как и ожидалось, наиболее верным языком при переносе знаков препинания с языка оригинала на язык перевода оказался немецкий.

В разговорном общении паузы могут быть оправданы физиологией человека, например, необходимостью отдышаться или потратить время на то, чтобы структурировать то, что нужно сказать в уме. А в письменном общении?

«Создать предложение, добавляя одно слово за другим, следя за тем, чтобы сообщение было ясным и недвусмысленным, немного похоже на натяжение тетивы лука: сначала это легко, но с каждым мгновением становится все сложнее. Если нет элементов упорядочения в текста (т. стрелку», т. е. закрыть отрывок текста каким-либо знаком препинания. Это примечание относится ко всем анализируемым языкам, поэтому мы имеем дело с тем, что можно было бы назвать лингвистическим законом», — говорит доктор. Томаш Станиш (IFJ PAN), первый автор рассматриваемой статьи.

READ  Как объекты, блуждающие в межзвездном пространстве, оказались сами по себе

Наконец, следует отметить, что изобретение знаков препинания произошло относительно недавно — в древних текстах знаков препинания вообще не было. Таким образом, появление оптимальных знаков препинания в современных письменных языках можно объяснить их эволюционным развитием. Однако чрезмерная потребность в пунктуации не обязательно является признаком этой сложности.

В свете вышеупомянутых исследований английский и испанский, два наиболее универсальных языка, кажутся менее строгими в отношении частоты пунктуации. Эти языки, вероятно, будут формализованы с точки зрения синтаксиса, чтобы было меньше места для разрешения неоднозначности с помощью пунктуации.

Дополнительная информация:
Томаш Станиш и др., Универсальные и системно-специфические особенности использования знаков препинания в основных западных языках, Хаос, солитоны и фракталы (2023). DOI: 10.1016/j.chaos.2023.113183

Предоставлено Институтом ядерной физики Хенрика Неводничанского и Польской академией наук.