Исследовательский проект: "Математическая лингвистика"

математическая дисциплина, предметом которой является разработка формального аппарата для описания строения естественных и некоторых искусственных языков . Возникла в 50‑х гг. 20 в.; одним из главных стимулов появления М. л. послужила назревшая в языкознании потребность уточнения его основных понятий. Методы М. л. имеют много общего с методами математической логики - математической дисциплины, занимающейся изучением строения математических рассуж­де­ний, - и в особенности таких её разделов, как теория алгоритмов и теория автоматов. Широко исполь­зу­ют­ся в М. л. также алгебраические методы. М. л. разви­ва­ет­ся в тесном взаимо­дей­ствии с языкознанием . Иногда термин «М. л.» исполь­зу­ет­ся также для обозначения любых лингви­сти­че­ских исследований, в которых применяется какой-либо математи­че­ский аппарат.

Математическое описание языка основано на восходящем к Ф. де Соссюру представлении о языке как механизме, функционирование которого проявляется в речевой деятельности его носителей; её результатом являются «правильные тексты» - последовательности речевых единиц , подчиняющиеся определённым закономерностям, многие из которых допускают матема­ти­че­ское описание. Разработка и изучение способов математи­че­ско­го описания правиль­ных текстов (в первую очередь предложений) составляет содержание одного из разде­лов М. л. - теории способов описания синтаксической структуры . Для описания строения предло­же­ния - точнее, его синтаксической структуры - можно либо выделить в нём составляющие - группы слов , функционирующие как цельные синтакси­че­ские единицы, либо указать для каждого слова те слова, которые ему непосредственно подчинены (если такие есть). Так, в предложении «Ямщик сидит на облучке» (А. С. Пушкин) при описании по 1‑му способу составляющими будут все предложение П, каждое его отдельное слово и группы слов A = сидит на облучке и B = на облучке (см. рис. 1; стрелки означают «непосредственное вложение»); описание по 2‑му способу даёт схему, показанную на рис. 2. Возникающие при этом математические объекты называются системой составляющих (1‑й способ) и деревом синтаксического подчинения (2‑й способ).

Точнее, система составляющих - это множество отрезков предложения, содержащее в качестве элементов всё предложение и все вхождения слов в это предложение («однословные отрезки») и обладающее тем свойством, что каждые два входящих в него отрезка либо не пересекаются, либо один из них содержится в другом; дерево синтаксического подчинения, или просто дерево подчинения, есть дерево, множеством узлов которого служит множество вхождений слов в предложение. Деревом в математике называется множество, между элементами которого - их называют узлами - установлено бинарное отношение - его называют отношением подчинения и графически изображают стрелками, идущими от подчиняющих узлов к подчиненным, - такое, что: 1) среди узлов имеется точно один - его называют корнем , - не подчинённый никакому узлу; 2) каждый из остальных узлов подчинен точно одному узлу; 3) невозможно, отправившись из какого-либо узла вдоль стрелок, вернуться в тот же узел. Узлы дерева подчинения - это вхождения слов в предложения. При графическом изображении система составляющих (как на рис. 1) также приобретает вид дерева (дерева составляющих ). Построенное для предложения дерево подчинения или систему составляющих часто называют его синтаксической структурой в виде дерева подчинения (системы составляющих). Системы составляющих исполь­зу­ют­ся пре­иму­ще­ствен­но в описаниях языков с жёстким порядком слов , деревья подчинения - в описаниях языков со свободным порядком слов (в частности, русского), формально для каждого (не слишком короткого) предложения можно построить много разных синтаксических структур любого из двух видов, но среди них только одна или несколько являются правильными. Корнем правильного дерева подчинения служит обычно сказуемое. Предложение, имеющее более одной правильной синтаксической структуры (одного вида), назы­ва­ет­ся синтаксически омонимичным ; как правило, разные синтаксические структуры отвечают разным смыслам предложения. Например, предложение «Школьники из Ржева поехали в Торжок» допускает два правильных дерева подчинения (рис. 3, а, б); первое из них отвечает смыслу «Ржевские школьники поехали (не обязательно из Ржева) в Торжок», второе - «Школьники (не обязательно ржевские) поехали из Ржева в Торжок».

В русском и ряде других языков деревья подчинения предложений «делового стиля» подчи­ня­ют­ся, как правило, закону проективности , состоящему в том, что все стрелки можно провести над прямой, на которой записано предложение, таким образом, что никакие две из них не пересекутся и корень не будет лежать ни под какой стрелкой. В языке художественной литера­ту­ры , особенно в поэзии, отклонения от закона проективности допустимы и чаще всего служат задаче создания определённого художественного эффекта. Так, в предложении «Друзья кровавой старины народной чаяли войны» (Пушкин) непроективность приводит к эмфати­че­ско­му выде­ле­нию слова «народной» и одновременно как бы замедляет речь, создавая этим впечатление известной приподнятости, торжественности. Имеются и другие формаль­ные признаки деревьев подчинения, которые могут исполь­зо­вать­ся для характеризации стиля . Например, максимальное число вложенных друг в друга стрелок служит мерой «синтак­си­че­ской громоздкости» предло­же­ния (см. рис. 4).

Для более адекватного описания строения предложения составляющие обычно помечаются симво­ла­ми грамматических категорий («именная группа», «группа переходного глагола » и т. п.), а стрелки дерева подчинения - символами синтаксических отношений («предика­тив­ное », «определи­тель­ное» и т. п.).

Аппарат деревьев подчинения и систем составляющих исполь­зу­ет­ся также для представ­ле­ния глубинно-синтаксической структуры предложения , которая образует промежу­точ­ный уровень между семантической и обычной синтаксической структурой (послед­нюю часто называют поверхностно-синтаксической).

Более совершенное представление синтаксической структуры предложения (требующее, однако, более сложного математического аппарата) дают системы синтаксических групп , в которые входят как словосочетания, так и синтаксические связи, причём не только между словами, но и между словосочетаниями. Системы синтаксических групп позволяют совмещать строгость формального описания строения предложения с гибкостью, присущей традиционным, неформальным описаниям. Деревья подчинения и системы составляющих являются предельными частными случаями систем синтаксических групп.

Другой раздел М. л., занимающий в ней центральное место, - теория формальных грамматик , начало которой было положено работами Н. Хомского. Она изучает способы описания закономерностей, характеризующих уже не отдельный текст, а всю совокупность правильных текстов того или иного языка. Эти закономерности описываются с помощью формальной грамматики - абстрактного «механизма», позволяющего с помощью едино­образ­ной процедуры получать правильные тексты данного языка вместе с описаниями их структуры. Наиболее широко исполь­зу­е­мый тип формальной грамматики - порождающая грамматика , или грамматика Хомского, представляющая собой упорядоченную систему Г = ⟨ V, W, П, R ⟩, где V и W - непересекающиеся конечные множества, называемые соответственно основным , или терминальным , и вспомогательным , или нетерминальным , алфавитами (их элементы называются соответственно основными, или терминальными, и вспомогательными, или нетерминальными, символами ), П - элемент W, называемый начальным символом , и R - конечное множество правил вида φ → ψ, где φ и ψ - цепочки (конечные последовательности) из основных и вспомогательных символов. Если φ → ψ - правило грамматики Г и ω 1 , ω 2 - цепочки из основных и вспомогательных символов, говорят, что цепочка ω 1 ψω 2 непосредственно выводима в Г из ω 1 φω 2 . Если ξ 0 , ξ 1 , ..., ξ n - цепочки и для каждого i = 1, ..., n цепочка ξ i непосредственно выводима из ξ i−1 , говорят, что ξ n выводима в Г из ξ 0 . Множество тех цепочек из основных символов, которые выводимы в Г из её начального символа, называется языком, порождаемым грамматикой Г, и обозначается L(Г). Если все правила Г имеют вид η 1 Aη 2 → η 1 ωη 2 , то Г называется грамматикой составляющих (или непосредственно составляющих), сокра­щён­но НС-грамматикой ; если при этом в каждом правиле цепочки η 1 и η 2 (правый и левый контексты ) пусты, то грамматика называется бесконтекстной (или контекстно-свободной ), сокра­щён­но Б-грамматикой (или КС-грамматикой ). В наибо­лее обычной лингвистической интер­пре­та­ции основные символы представляют собой слова, вспомогательные - символы грамматических категорий, начальный символ - символ категории «предложение»; при этом язык, порождаемый грамматикой, интер­пре­ти­ру­ет­ся как множество всех грамматически правильных предложений данного естественного языка. В НС-грамматике вывод предложения даёт для неё дерево составляющих, в котором каждая составляющая состоит из слов, «происходящих» от одного вспомогательного символа, так что для каждой составляющей указывается её грамматическая категория. Так, если грамматика имеет, в числе прочих, правила П → S x, y, им, V y → V i y O, O → S x, y, предл, V i y → сидит, S муж, ед., им → на, ямщик, S муж, ед., предл. → облучке, то предложение «Ямщик сидит на облучке» имеет вывод, показанный на рис. 5, где стрелки идут от левых частей применяемых правил к элементам правых частей. Система составляющих, отвеча­ю­щая этому выводу, совпадает с изображенной на рис. 1. Возможны и другие интер­пре­та­ции: например, основные символы могут интер­пре­ти­ро­вать­ся как морфы , вспомогательные - как символы типов морф и допустимых цепочек морф, начальный символ - как символ типа «слово­фор­ма », а язык, порождаемый грамматикой, - как множество правильных словоформ (морфологическая интер­пре­та­ция); употребительны также морфонологическая и фонологическая интер­пре­та­ции. В реальных описаниях языков исполь­зу­ют­ся обычно «многоуровневые» грамма­ти­ки, которые содержат последо­ва­тель­но работающие синтаксические, морфологические и морфонологически-фонологические правила.

Другой важный тип формальной грамматики - доминационная грамматика , которая порождает множество цепочек, интер­пре­ти­ру­е­мых обычно как предложения вместе с их синтаксическими структурами в виде деревьев подчинения. Грамматика синтакси­че­ских групп порождает множество предложений вместе с их синтаксическими структу­ра­ми, имею­щи­ми вид систем синтаксических групп. Имеются также различные концепции трансформационной грамматики (грамматики деревьев ), служа­щей не для порожде­ния предложений, а для преобразования деревьев, интер­пре­ти­ру­е­мых как деревья подчинения или деревья составляющих. Примером может служить Δ-грамматика - система правил преобразования деревьев, интер­пре­ти­ру­е­мых как «чистые» деревья подчине­ния предложений, т. е. деревья подчине­ния без линейного порядка слов.

Особняком стоят грамматики Монтегю , служащие для одновременного описания синтак­си­че­ских и семантических структур предложения; в них исполь­зу­ет­ся сложный математико-логический аппарат (так называемая интенсиональная логика ).

Формальные грамматики находят применение для описания не только естественных, но и искусственных языков, в особенности языков программирования .

В М. л. разрабатываются также аналитические модели языка, в которых на основе тех или иных данных о речи, считающихся известными, производятся формальные построения, результатом которых является описание некоторых аспектов строения языка. В этих моделях обычно исполь­зу­ет­ся несложный математический аппарат - простые понятия теории множеств и алгебры; поэтому аналитические модели языка иногда называют теоретико-множественными . В анали­ти­че­ских моделях наиболее простого типа исходными данными служат множество правильных предло­же­ний и система окрестностей - совокупностей «слов», принадлежащих одной лексеме (напри­мер, {дом, до́ма, дому, домом, доме, дома́, домов, домам, домами, домах}). Простейшим произ­вод­ным понятием в таких моделях является замещаемость : слово a замещаемо на слово b , если всякое правильное предложение, содержащее вхождение слова a , остаётся правильным при замене этого вхождения вхождением слова b . Если а замещаемо на b и b на a , говорят, что a и b взаимозамещаемы . (Например, в русском языке слово «синий» замещаемо на слово «голубой»; слова «синего» и «голубого» взаимозамещаемы.) Класс слов, взаимозамещаемых между собой, называется семейством . Исходя из окрестностей и семейств, можно получить ряд других лингвистически значимых классификаций слов, одна из которых приблизительно соответствует традиционной системе частей речи . В другом типе аналитических моделей вместо множества правильных предло­же­ний исполь­зу­ет­ся отношение потенциального подчинения между словами, означа­ю­щее способ­ность одного из них подчинять себе другое в правильных предложениях. В таких моделях можно получить, в частности, формальные определения ряда традиционных граммати­че­ских катего­рий - например, формальное определение падежа существительного , представ­ля­ю­щее собой процедуру, которая позволяет восстановить падежную систему языка, зная только отношение потенциального подчинения, систему окрестностей и множество слов, явля­ю­щих­ся формами существительных.

В аналитических моделях языка исполь­зу­ют­ся простые понятия теории множеств и алгебры. К аналитическим моделям языка близки дешифровочные модели - процеду­ры, позво­ля­ю­щие по достаточно большому корпусу текстов на неизвестном языке без каких-либо предва­ри­тель­ных сведений о нём получить ряд данных о его структуре.

По своему назначению М. л. является прежде всего инструментом теоретического языко­ве­де­ния. В то же время ее методы находят широкое применение в прикладных лингвистических иссле­до­ва­ни­ях - автоматической обработке текста , автоматическом переводе и разработ­ках, связан­ных с так называемым общением между человеком и ЭВМ.

  • Кулагина О. С., Об одном способе определения грамматических понятий на базе теории множеств, в сб.: Проблемы кибернетики, в. 1, М., 1958;
  • Хомский Н., Синтаксические структуры, в сб.: «Новое в лингвистике», в. 2, М., 1962;
  • Гладкий А. В., Мельчук И. А., Элементы математической лингвистики, М., 1969 (лит.);
  • их же , Грамматики деревьев, I, II, в сб.: Информационные вопросы семиотики, лингвистики и автоматического перевода, в. 1, 4, М., 1971-74 (лит.);
  • Маркус С., Теоретико-множественные модели языков, пер. с англ., М., 1970 (лит.);
  • Гладкий А. В., Формальные грамматики и языки, М., 1973 (лит.);
  • его же , Попытка формального определения понятий падежа и рода существительного, в сб.: Проблемы грамматического моделирования, М., 1973 (лит.);
  • его же , Синтаксические структуры естественного языка в автоматизированных системах общения, М., 1985 (лит.);
  • Сухотин Б. В., Оптимизационные методы исследования языка. М., 1976 (лит.);
  • Севбо И. П., Графическое представление синтаксических структур и стилистическая диагностика, К., 1981;
  • Парти Б. Х., Грамматика Монтегю, мысленные представления и реальность, в кн.: Семиотика, М., 1983;
  • Montague R., Formal philosophy, New Haven - L., 1974 (лит.).

Оглавление
Введение
Глава 1. История применения математических методов в лингвистике
1.1. Становление структурной лингвистики на рубеже XIX – ХХ веков
1.2. Применение математических методов в лингвистике во второй половине ХХ века
Заключение
Литература
Введение
В ХХ веке наметилась продолжающаяся и поныне тенденция к взаимодействию и взаимопроникновению различных областей знаний.Постепенно стираются грани между отдельными науками; появляется всё больше отраслей умственной деятельности, находящихся «на стыке» гуманитарного, технического и естественнонаучного знания.
Другая очевидная особенность современности – стремление к изучению структур и составляющих их элементов. Поэтому всё большее место как в научной теории, так и на практике уделяется математике. Соприкасаясь,с одной стороны, с логикой и философией, с другой стороны, со статистикой (а, следовательно, и с общественными науками), математика всё глубже проникает в те сферы, которые на протяжении долгого времени было принято считать чисто «гуманитарными», расширяя их эвристический потенциал (ответ на вопрос «сколько» часто помоагет ответить и на вопросы «что» и «как). Исключением не стало и языкознание.Цель моей курсовой работы – кратко осветить связь математики с такой отраслью языкознания, как лингвистика. Начиная с 50-х годов прошлого века, математика применяется в лингвистике при создании теоретического аппарата для описания строения языков (как естественных, так и искусственных). Однако следует сказать, что она не сразу нашла себе подобное практическое применение. Первоначально математическиеметоды в лингвистике стали использоваться для того, чтобы уточнить основные понятия языкознания, однако с развитием компьютерной техники подобная теоретическая посылка стала находить применение на практике. Разрешение таких задач, как машинный перевод, машинный поиск информации, автоматическая обработка текста требовало принципиально нового подхода к языку. Перед лингвистами назрел вопрос: какнаучиться представлять языковые закономерности в том виде, в котором их можно подавать непосредственно на технику. Популярным в наше время термином «математическая лингвистика» называют любые лингвистические исследования, в которых применяются точные методы (а понятие точных методов в науке всегда тесно связано с математикой). Некоторые учёные прошлых лет, считают, что само выражение нельзя возводить вранг термина, так как оно обозначает не какую-то особую «лингвистику», а лишь новое направление, ориентированное на усовершенствование, повышение точности и надёжности методов исследования языка. В лингвистике используются как количественные (алгебраические), так и неколичественные методы, что сближает её с математической логикой, а, следовательно, и с философией, и даже с психологией. Ещё Шлегельотмечал взаимодействие языка и сознания, а видный лингвист начала ХХ века Фердинанд де Соссюр (о его влиянии на становление математических методов в лингвистике расскажу позже) связывал структуру языка с его принадлежностью к народу. Современный исследователь Л. Перловский идёт дальше, отождествляя количественные характеристики языка (например, число родов, падежей) с особенностями национальногоменталитета (об этом в разделе 2.2, «Статистические методы в лингвистике»).
Взаимодействие математики и языкознания – тема многогранная, и в своей работе я остановлюсь не на всех, а, в первую очередь, на её прикладных аспектах.
Глава I. История применения математических методов в лингвистике
1.1 Становление структурной лингвистики на рубеже XIX – ХХ веков
Математическое описание языка основано напредставлении о языке как о механизме, восходящем к известному швейцарскому лингвисту начала ХХ века Фердинанду де Соссюру.
Начальное звено его концепции – теория языка как системы, cостоящей из трёх частей (собственно язык – langue, речь – parole, и речевую деятельность – langage), в которой каждое слово (член системы) рассматривается не само по себе, а в связи с другими...

Проникновение в лингвистику математических методов и «математического духа» способствовало развитию лингвистики в сторону точности и объективности. Однако на пути ее дальнейшего развития в этом направлении стоят серьезные препятствия. Автор размышляет о причинах сближения лингвистики и математики, о границах применимости в лингвистике математических методов и о природе факторов, препятствующих взаимопониманию математиков и лингвистов.

Когда во второй половине 50-х годов некоторые молодые лингвисты задумались о применении математических методов для исследования структуры языка и начали сотрудничать с математиками, это вызвало у очень многих их коллег удивление и даже шок - ведь они с детства были убеждены, что гуманитарные науки, одной из которых является лингвистика, с математикой и другими «точными» науками не имеют и не могут иметь ничего общего.

Между тем наличие тесной связи между естественным языком и математикой вовсе не было в то время новым открытием. Л. С. Выготский писал в опубликованной в 1934 году книге «Мышление и речь»: «Первым, кто увидел в математике мышление, происходящее из языка, но преодолевающее его, был, по-видимому, Декарт» и продолжал: «Наш обычный разговорный язык из-за присущих ему колебаний и несоответствий грамматического и психологического находится в состоянии подвижного равновесия между идеалами математической и фантастической гармонии и в непрестанном движении, которое мы называем эволюцией».

Возникшее в Древней Греции учение о грамматических категориях уже представляло собой описание ряда важнейших аспектов строения языка с помощью абстрактных моделей, близких по стилю к тем моделям, которые были созданы древнегреческими математиками для описания пространственных форм; только привычность таких понятий, как падеж, род и т. п., ставших, как писал Х. Штейнталь, «нашей второй натурой», мешает нам понять, какого высокого уровня абстрактного мышления потребовало их создание. Так что удивляться следовало бы скорее тому, что первые попытки использовать для описания языкового «идеала математической гармонии» настоящие математические средства были предприняты лишь в середине ХХ столетия.

Можно указать две причины такого «запоздания». Во-первых, наука о языке после значительных шагов, сделанных в античную эпоху, снова начала по-настоящему развиваться только в XIX столетии, но в течение всего этого столетия главное внимание лингвистов было обращено на историю языка, и лишь в следующем веке, который вообще был для гуманитарных наук веком структурализма, лингвистика впервые после античного периода обратилась к изучению языковых структур, но уже на новом уровне. Когда лингвисты осознали, что язык представляет собой, говоря словами Ф. де Соссюра, «систему чистых отношений», т. е. систему знаков, физическая природа которых несущественна, а существенны только отношения между ними, стала совершенно очевидна параллель между языком и математическими конструкциями, которые тоже являются «системами чистых отношений», и уже в начале ХХ столетия тот же де Соссюр мечтал об исследовании языка математическими средствами.

Во-вторых, в математике в начале Нового времени вышли на первый план количественные методы, и только в XIX веке математики снова начали строить неколичественные абстрактные модели, отличавшиеся от античных более высоким уровнем абстракции, а также - что для нашей темы особенно важно - тем, что они могли использоваться для описания значительно более широкого круга явлений, чем пространственные формы; нередко такие модели оказывались удобным и даже необходимым средством для изучения явлений, о которых строившие их математики вовсе не думали и даже не знали об их существовании. Среди этих моделей были и те, которые впоследствии получили применение в лингвистике; особенно интенсивное развитие математических дисциплин, содержанием которых было их построение, пришлось на первую половину ХХ столетия. Поэтому встреча математики и лингвистики в середине этого столетия была вполне закономерна.

Одним из результатов этой встречи было возникновение новой математической дисциплин - математической лингвистики, предметом которой является разработка математического аппарата для лингвистических исследований. Центральное место в математической лингвистике занимает теория формальных грамматик, по характеру используемого в ней аппарата родственная математической логике и в особенности теории алгоритмов. Она доставляет формальные методы описания правильных языковых единиц различных уровней, а также, что особенно важно, формальные методы описания преобразований языковых единиц - как на одном уровне, так и межуровневых. К теории формальных грамматик примыкает теория синтаксических структур, значительно более простая в отношении аппарата, но не менее важная для лингвистических приложений. В математической лингвистике разрабатываются также аналитические модели языка, в которых на основе тех или иных - считающихся известными - данных о «правильных текстах» производятся формальные построения, результатом которых является описание каких-то «составных частей» механизма языка. На этом пути можно получить формальное описание некоторых традиционных грамматических понятий. Сюда же следует отнести описание смысла предложения с помощью аппарата интенсиональной логики («семантику Монтегю»).

Разумеется, с помощью математического аппарата можно описать только один из двух идеалов языка, о которых говорил Выготский; поэтому часто раздающиеся возражения против использования той или иной математической модели (или математических моделей вообще) на том основании, что такие-то и такие-то частные случаи она не охватывает, не имеют смысла: для описания присущих языку «колебаний и несоответствий» нужны совсем другие, не математические средства, и как раз четкое описание «математического идеала» могло бы помочь их находить, поскольку оно позволило бы ясно отграничивать в языке «фантастическое» от «математического». Но это пока что дело будущего.

Не меньшее, а может быть и большее значение, чем возникновение математической лингвистики, имело непосредственное проникновение в лингвистику фундаментальных математических идей и понятий - таких, как множество, функция, изоморфизм. В современной лингвистической семантике важную роль играют пришедшие из математической логики понятия предиката и квантора. (Первое из них возникло в логике еще тогда, когда она не отграничивалась от лингвистики, и теперь вернулось в лингвистику в обобщенном и математически обработанном виде.)

И, наконец, очень большое значение имеет уточнение языка лингвистических исследований, происходящее благодаря проникновению в лингвистику «математического духа» не только в тех ее областях, где возможно использование математических идей и методов. Все это можно коротко резюмировать так: лингвистика становится все более точной и более объективной наукой - не переставая, само собой, быть наукой гуманитарной.

Однако на этом естественном пути развития лингвистики стоят серьезные препятствия, которые могут его надолго затормозить. Главное из них - возникшее в начале Нового времени «разделение факультетов»: естествоиспытатели и математики с одной стороны и гуманитарные ученые с другой не интересуются работой коллег «на другом факультете» и, более того, - в глубине души, а нередко и открыто презирают их. Математики и естествоиспытатели (и еще больше «технари») склонны видеть в гуманитарных исследованиях всего лишь некое «украшение» или даже «пустую болтовню», а «гуманитарии» готовы терпеть математику и естественные науки лишь ради практической пользы и убеждены, что они ничем не могут помочь постижению природы человеческого духа.

Только в середине XIX столетия в этой, говоря словами великого биолога и великого мыслителя Конрада Лоренца, «зловредной стене между естественными и гуманитарными наукам (die böse Mauer zwischen Natur- und Geistwissenschaften)» была пробита первая брешь в самом тонком месте, отделявшем логику от математики. В ХХ столетии появились и другие бреши - среди них и та, которую пробили с двух сторон математики и лингвисты, - но их все еще мало, стена крепка до сих пор, и нет недостатка в усилиях с обеих сторон укреплять ее дальше и латать пробоины. Нередко эти усилия бывают довольно успешны; последнее «достижение» в этом направлении - «профильное образование» в средней школе, уже в детстве разделяющее способных и интересующихся людей на «факультеты» и приучающее их гордиться невежеством в «чужих» науках - может очень сильно воспрепятствовать дальнейшему сближению естественных и гуманитарных наук, настоятельно необходимому для нормального развития тех и других. Одно из последствий воздвижения стены состоит в том, что «гуманитарии», включая подавляющее большинство лингвистов, ничего не знают даже об азах как раз тех разделов математики, которые имеют наибольшее значение для гуманитарных наук (и представляют себе математика как человека, занятого исключительно вычислениями).

Другое препятствие - характерная для нынешнего состояния науки бешеная гонка, безостановочная погоня за все новыми и новыми «результатами», сужающая кругозор и не оставляющая времени задуматься над более глубокими проблемами или заняться серьезным изучением смежной и тем более не совсем смежной научной дисциплины. Это относится в равной степени к лингвистам и к математикам - как, впрочем, и ко всем, кто профессионально занимается наукой.

И третье - инертность, или, проще говоря, лень. На первый взгляд лень и бешеная гонка несовместимы, но в действительности они прекрасно уживаются между собой и, более того, поддерживают и стимулируют друг друга. Когда человеку лень взяться за трудное дело, он хватается за более легкое и более «надежное», успехи в котором оправдывают и поощряют его инертность. Высокомерное отношение к «меньшим братьям», копошащимся по другую сторону стены, также поощряет лень и поощряется ею. Когда, например, математик предлагает пересмотреть все представления о древней истории, не дав себе труда хоть немного познакомиться с древними языками, за это в весьма значительной степени ответственна та же лень-матушка.

Опасность для развития науки, создаваемая этими препятствиями, гораздо серьезнее, чем может показаться на первый взгляд. Когда невежество в «чужих» науках становится предметом гордости, это закономерно ведет к поверхностности и невежеству также и в «своих». «Факультетов» давно уже много больше двух, число их растет из года в год, и каждый отгораживается стеной от других; появляются стены и внутри факультетов. Кругозор исследователей постепенно сужается; правда, аппарат исследования становится все более тонким и изысканным, но в поле его зрения попадают почти исключительно мелкие предметы, и укрепляется представление, будто только они и заслуживают изучения. Есть все основания говорить о кризисе в науке, и лингвистика не является исключением. Сейчас, как мне представляется, самое время оглянуться и задуматься.

Здесь собрались лингвисты того направления, которое связано с моделью «Смысл - Текст». Эта модель, созданная в 60-е годы теперь уже прошлого столетия, была одним из первых и лучших результатов встречи лингвистики и математики, после которой выросли уже два поколения лингвистов, со студенческих лет приучившихся к точному мышлению. Но и они, к сожалению, не свободны от инертности, мешающей им осознать наличие кризиса и задуматься о путях его преодоления. Между тем среди всех лингвистов - и, может быть, даже среди всех, кто занимается гуманитарными науками - у них больше всего объективных возможностей для такого осознания, и хотелось бы надеяться, что они этими возможностями воспользуются.

Текст доклада любезно предоставлен А. В. Гладким и издательством

В течение последнего столетия языкознание всегда приводилось как пример науки, развивавшейся стреми­тельно и очень быстро достигшей методической зрело­сти. Уже в середине прошлого столетия молодая наука уверенно заняла место в кругу наук, обладавших тыся­челетней традицией, а один из виднейших ее представи­телей - А. Шлейхер - имел смелость полагать, что своими трудами он подводит уже итоговую линию.<113> История лингвистики, однако, показала, что такое мне­ние было слишком поспешно и неоправданно. В конце века языкознание претерпело первое большое потрясе­ние, связанное с критикой младограмматических прин­ципов, за которым последовали и другие. Следует при этом отметить, что все кризисы, которые мы можем вскрыть в истории науки о языке, как правило, не рас­шатывали ее основ, но, наоборот, способствовали укреплению и в конечном счете приносили с собой уточнение и усовершенствование методов лингвистического иссле­дования, расширяя вместе с тем и научную проблема­тику.

Но рядом с языкознанием жили и развивались также и другие науки, в том числе и большое количество но­вых. Особенно бурное развитие в наше время получили физические, химические и технические (так называемые «точные») науки, а над всеми ними воцарилась их тео­ретическая основа - математика. Точные науки не толь­ко сильно потеснили все гуманитарные науки, но в на­стоящее время стремятся «привести их в свою веру», подчинить своим обычаям, навязать им свои исследова­тельские методы. При создавшемся положении, исполь­зуя японское выражение, можно сказать, что ныне языковеды-филологи оскверняют собой самый краешек циновки, где торжествующе и привольно расположились точные науки во главе с математикой.

Не целесообразнее ли с точки зрения общенаучных интересов капитулировать перед математикой, целиком отдаться во власть ее методов, к чему уже откровенно призывают некоторые голоса 5 9 , и тем самым, быть мо­жет, обрести новую силу? Чтобы ответить на эти вопро­сы, надо сначала посмотреть, на что претендует матема­тика в данном случае, в какой области лингвистики находят свое применение математические методы, в ка­кой мере они согласуются со спецификой языкового ма­териала и способны ли они дать или даже только под­сказать ответы на те вопросы, которые ставит перед собой наука о языке.

С самого начала следует отметить, что и среди энту­зиастов нового, математического направления в лингви<114>стических исследованиях нет единства мнений относительно его целей и задач. Акад. А. А. Марков, первым применивший математические методы к языку, Болдрини, Юл, Мариотти рассматривают языковые элементы как подходящий иллюстративный материал для построе­ния квантитативных методов, или для статистических теорем, совершенно не задаваясь вопросом, представ­ляют ли интерес результаты такого исследования для лингвистов 6 0 . Росс полагает, что теория вероятностей и математическая статистика представляют инструмент или, как ныне предпочитают говорить, математическую модель для проверки и подтверждения тех лингвистиче­ских выводов, которые допускают числовую трактовку. Тем самым математические методы мыслятся лишь как вспомогательные средства лингвистического исследова­ния 6 1 . На гораздо большее претендует Хердан, который в своей книге не только подытожил и систематизировал все попытки математического изучения языковых проб­лем, но и попытался дать им четкую ориентацию в отно­шении дальнейшей работы. Изложение всего материала своей книги он ориентирует на «понимание литературной статистики (так он называет изучение текстов методами математической статистики. -В. 3.) как неотъемлемой части лингвистики» 6 2 , а сущность и задачи этого нового раздела в языкознании формулирует в следующих сло­вах: «Литературная статистика в качестве квантитатив­ной философии языка применима ко всем отраслям лингвистики. По нашему мнению, литературная стати­стика есть структуральная лингвистика, поднятая на уровень квантитативной науки или же квантитативной философии. Таким образом, одинаково неправильно определять ее результаты как не относящиеся к области<115> лингвистики или же трактовать ее как вспомогательное средство для исследования» 6 3 .

Едва ли целесообразно вдаваться в теоретизирова­ния относительно того, правомерно ли в данном слу­чае говорить о возникновении новой отрасли лингвисти­ки и решать вопрос о ее претензиях, не обратившись сначала к рассмотрению уже фактически сделанного в этой области, и к выяснению того, в каком направле­нии идет применение новых методов 6 4 . Это поможет нам разобраться и в разноголосице мнений.

Применение математического (или, точнее говоря, статистического) критерия для решения лингвистиче­ских вопросов является отнюдь не новым для науки о языке и в той или иной мере уже давно используется языковедами. Ведь, по сути говоря, такие традиционные понятия лингвистики, как фонетический закон (и связан<116>ное с ним - исключение из закона), продуктивность грамматических элементов (например, словообразова­тельных суффиксов) или даже критерии родственных отношений между языками в известной степени строятся на относительных статистических признаках. Ведь чем резче и отчетливее статистическое противопоставление наблюдаемых случаев, тем больше у нас оснований го­ворить о продуктивных и непродуктивных суффиксах, о фонетическом законе и исключениях из него, о наличии или отсутствии родственных отношений между языками. Но если в подобных случаях статистический принцип использовался более или менее стихийно, то в дальнейшем он стал применяться сознательно и уже с опреде­ленной целеустановкой. Так, в наше время большое рас­пространение получили так называемые частотные сло­вари лексики и выражений отдельных языков 6 5 или даже значений разноязычных слов с «общей направлен­ностью на действительность» 6 6 . Данные этих словарей используются для составления учебников иностранных языков (тексты которых строятся на наиболее употре­бительной лексике) и словарей-минимумов. Специально лингвистическое использование статистические исчисле­ния нашли в методе лексикостатистики или глоттохронологии М. Сводеша, где на основе статистических фор­мул, учитывающих случаи исчезновения из языков слов основного фонда, оказывается возможным установить абсолютную хронологию расчленения языковых се­мейств 6 7 .

В последние годы случаи применения математиче­ских методов к языковому материалу значительно умно­жились и в массе подобного рода попыток наметились более или менее определенные направления. Обратимся <117> к последовательному их рассмотрению, не вдаваясь в детали.

Начнем с того направления, которому присвоено наименование стилостатистики. Речь в данном случае идет об определении и характеристике стилистических особенностей отдельных произведений или авторов через посредство количественных отношений используемых языковых элементов. В основе статистического подхода к исследованию стилистических явлений лежит понима­ние литературного стиля как индивидуального способа владения средствами языка. При этом исследователь со­вершенно отвлекается от вопроса о качественной значи­мости исчисляемых языковых элементов, сосредоточивая все свое внимание только на количественной стороне; смысловая сторона исследуемых языковых единиц, их эмоционально-экспрессивная нагрузка, так же как и их удельный вес в ткани художественного произведе­ния - все это остается вне учета, относится к так назы­ваемым избыточным явлениям. Таким образом, художественное произведение выступает в виде механической совокупности, специфика построения которого находит свое выражение лишь через числовые отношения ее эле­ментов. На все отмеченные обстоятельства представите­ли стилостатистики не закрывают глаза, противопостав­ляя методам традиционной стилистики, несомненно включающим элементы субъективности, одно единственное качество математического метода, которое, по их мнению, окупает все его недостатки - объективность до­стигнутых результатов. «Мы стремимся, - пишет, напри­мер, В. Фукс,-...охарактеризовать стиль языкового выражения математическими средствами. Для этой цели должны быть созданы методы, результаты которых должны обладать объективностью в такой же мере, как и результаты точных наук... Это предполагает, что мы, во всяком случае первоначально, будем заниматься только формальными структурными качествами, а не смысловым содержанием языковых выражений. Таким образом мы получим систему порядковых отношений, которая в своей совокупности представит собой основу и исходный пункт математической теории стиля» 6 8 . <118>

Простейшим видом статистического подхода к изуче­нию языка писателей или отдельных произведений яв­ляется подсчет употребляемых слов, так как богатство словаря, видимо, должно определенным образом харак­теризовать и самого автора. Однако результаты подоб­ных подсчетов дают несколько неожиданные в этом плане результаты и никак не способствуют эстетическо­му познанию и оценке литературного произведения, что не в последнюю очередь входит в число задач стилисти­ки. Вот некоторые данные относительно общего количе­ства слов, употребляемых в ряде произведений:

Библия (латинская) . . . . . . . . . . 5649 слов

Библия (древнееврейская) . . . . 5642 слова

Демосфен (речи) . . . . . . . . . . . . 4972 слова

Саллюстий. . . . . . . . . . . . . . . . . 3394 слова

Гораций. . . . . . . . . . . . . . . . . . . .6084 слова

Данте (Божественная комедия) 5860 слов

(сюда входит 1615 имен собст­венных и географич. на­званий)

Тассо (Неистовый Орланд) . . . . 8474 слова

Милтон. . . . . . . . . . . . . . . . . . . . .8000 слов (прибл. дан.)

Шекспир. . . . . . . . . . . . . . . . . . .15000 слов

(приблизительно, по другим данным 20 000 слов)

О. Есперсен указывает, что словарь Золя, Киплинга и Джека Лондона значительно превышает словарь Милтона, т. е. число в 8000 6 9 . Подсчет словаря речей президента США В. Вилсона установил, что он богаче, чем у Шекспира. К этому следует добавить данные психоло­гов. Так, Терман на основе наблюдений над большим количеством случаев установил, что словарь среднего ребенка составляет около 3600 слов, а в 14 лет - уже 9000. Средний взрослый употребляет 11700 слов, а че­ловек «повышенной интеллигентности» до 13500 7 0 . Та­ким образом, подобные числовые данные сами по себе не дают никаких оснований для выявления стилистиче­ских качеств произведений и только «объективно» кон<119>статируют употребление разного количества слов разны­ми авторами, что, как показывают приведенные подсче­ты, не связано с относительной художественной ценно­стью их произведений.

Несколько по-иному строятся подсчеты относи­тельной частоты употребления слов у отдельных авторов. В этом случае учитывается не только общая сумма слов, но и частота употребления отдельных слов. Статистическая обработка полученного таким образом материала заключается в том, что слова с равной частотой употребления группируются по классам (или ран­гам), что приводит к установлению частотной дистрибу­ции всех употребляемых данным автором слов. Частным случаем такого рода подсчетов является определение относительной частотности специальных слов (напри­мер, романской лексики в произведениях Чосера, как это было сделано Мерсандом 7 1). Относительная частотность употребляемых авторами слов содержит такие же объективные сведения о стиле отдельных авторов, как и вышеприведенные суммарные подсчеты, с той только разницей, что в результате получаются более точные числовые данные. Но она используется и для датировки отдельных произведений одного и того же автора на основе предварительно произведенного подсчета относи­тельной частоты употребления им слов в разные периоды его жизни (по датированным самим автором произведе­ниям). Другим видом использования данных подобных подсчетов является установление подлинности авторства произведений, относительно которых этот вопрос пред­ставляется сомнительным 7 2 . В этом последнем случае все строится на сравнении статистических формул частоты употребления в подлинных и спорных произведениях. Нет надобности говорить об очень большой относитель­ности и приблизительности результатов, полученных такими методами. Ведь относительная частота употребле­ния меняется не только с возрастом автора, но и в зави­симости от жанра, сюжета, а также и исторической сре­ды действия произведения (ср., например, «Хлеб» и «Петр I» А. Толстого). <120>

Углубляя вышеописанный метод, стилостатистика в качестве стилевой характеристики стала прибегать к критерию стабильности относительной частоты наиболее употребительных слов. Применяемый в данном случае метод можно проиллюстрировать статистической обра­боткой рассказа Пушкина «Капитанская дочка», произ­веденной Есселсоном и Эпштейном в Институте славян­ских языков при Детройтском университете (США) 7 3 . Обследованию был подвергнут весь текст рассказа (око­ло 30000 случаев употребления слов), а затем отрывки, содержащие около 10000 и 5000 случаев употребления. Далее, с целью определения стабильности относительной частоты употребления слов, у 102 наиболее употребительных слов (с частотой от 1160 раз до 35) было произ­ведено сравнение расчетной относительной частоты (сде­ланной на основе выборочных отрывков) с действитель­ной. Например, союз «и» во всем рассказе употреблялся 1 160 раз. В отрывке, содержащем 5 000 случаев употреб­лений всех слов, следует ожидать, что этот союз будет использоваться 5 000 x 1 160: 30 000, или округло 193 раза, а в отрывке, содержащем 10 000 случаев употреблений всех слов, он предположительно используется 10 000 x 1 160: 30 000, или 386 раз. Сравнение полученных с помощью подоб­ного рода расчетов данных с фактическими показывает очень незначительное отклонение (в пределах 5%). На основе подобных расчетов было установлено, что в дан­ном рассказе Пушкина предлог «к» используется в два раза чаще, чем «у», а местоимение «ты» в три раза ча­ще, чем «их» и т. д. Таким образом, несмотря на все перипетии сюжета, как на протяжении всего рассказа, так и в отдельных его частях, наблюдается стабильность относительной частоты употребления слов. То, что на­блюдается в отношении некоторых (наиболее употреби­тельных) слов, предположительно применимо и по отно­шению ко всем использованным в произведении словам. Отсюда следует, что стиль автора можно характеризо­вать определенным соотношением изменчивости средней частоты употребления слова к общей для данного языка<121> частоте его употребления. Это соотношение и рассматри­вается в качестве объективной квантитативной характе­ристики стиля автора.

Аналогичным образом исследуются и иные формаль­ные элементы структуры языка. Так, например, В. Фукс подверг сопоставительно-статистическому рассмотрению метрические особенности произведений Гёте, Рильке, Цезаря, Саллюстия и др. 7 4

Критерий стабильности относительной частоты упот­ребления слов, уточняя технику квантитативной харак­теристики стиля, ничего принципиально нового не вно­сит сравнительно с выше разобранными более прими­тивными способами. Все методы стилостатистики дают в конечном счете одинаково бесстрастные, скользящие по поверхности языка и цепляющиеся только за сугубо внешние признаки «объективные» результаты. Квантита­тивные методы, видимо, не способны ориентироваться на качественные различия исследуемого материала и фактически нивелируют все изучаемые объекты.

Там, где необходима максимальная конкретизация, предлагаются максимально обобщенные критерии; каче­ственные характеристики выражаются языком количества. Здесь не только логическое противоречие, но и несо­гласие с природой вещей. В самом деле, что получится, если мы попытаемся получить сравнительную стилисти­ческую (т. е., следовательно, качественную) характеристику произведений Александра Герасимова и Рембрандта на основании количественного отношения красной и черной краски на их полотнах? Видимо, абсолютная не­суразица. В какой мере вполне «объективные» квантита­тивные сведения о физических данных человека способ­ны дать нам представление о всем том, что характери­зует человека и составляет его истинную сущность? Оче­видно, ни в какой. Они могут служить лишь индивиду­альным признаком, отличающим одного человека от другого, вроде отпечатка извилин на большом пальце руки. Аналогичным образом обстоит дело и с квантита­тивными характеристиками литературного стиля. Если внимательно разобраться, то они дают столь же скудные данные для суждения о действительных стилистических<122> качествах языка автора, как и описание извилин на пальце для изучения психологии человека.

Ко всему сказанному следует добавить, что в прош­лом в так называемой формальной школе литературо­ведения уже делалась попытка квантитативного иссле­дования стиля писателей, когда производились подсчеты эпитетов, метафор, ритмо-мелодических элементов стиха. Однако эта попытка не получила своего дальнейшего развития.

Другое направление применения математических ме­тодов для изучения языковых явлений можно объеди­нить под именем лингвостатистики. Оно стремится вторг­нуться в основные вопросы теории языка и таким обра­зом получить призвание в собственно лингвистической сфере. Для ознакомления с этим направлением лучше всего обратиться к уже упоминавшейся работе Хердана, по выражению одного из ее многочисленных рецензен­тов, «чудовищно претенциозной книге» 7 5 , получившей, однако, широкий отклик среди языковедов 7 6 . Ввиду того, что Хердан (на что уже указывалось выше) стремился собрать в своей книге все наиболее существенное в об­ласти применения математических методов к лингвисти­ческой проблематике, в его книге мы фактически имеем дело не столько с Херданом, сколько с целым направле­нием. Как показывает само название книги - «Язык как выбор и вероятность», - основное ее внимание направ­лено на выяснение того, что в языке предоставлено сво­бодному выбору говорящего и что обусловлено имма­нентной структурой языка, точно так же, как и на опре­деление количественного соотношения элементов перво­го и второго порядка. Книга Хердана дает почти исчер­пывающую информацию о всех работах в этой области, проведенных представителями разных специальностей<123> (философами, лингвистами, математиками, техниками), но не ограничивается этим и включает много оригиналь­ных наблюдений, соображений и выводов самого автора. В качестве суммирующего труда она дает хорошее пред­ставление о применяемых квантитативных методах, и о достигаемых с их помощью результатах. Вопросы, кото­рые мы условно объединяем в раздел лингвостатистики, трактуются во второй и четвертой частях книги.

Из множества случаев применения методов матема­тической статистики к изучению лингвистических вопро­сов мы остановимся на наиболее общих, которые одно­временно можно рассматривать и как наиболее типич­ные. Используя данные других авторов - Болдрини 7 7 , Матезиуса 7 8 , Мариотти 7 9 , Ципфа 8 0 , Диуэй 8 1 и др., а также приводя собственные исследования, определяю­щие относительную частоту распределения фонем, букв, длины слов (измеряемую количеством букв и слогов), грамматических форм и метрических элементов в латин­ском и греческом гекзаметре, Хердан устанавливает факт стабильности относительной частоты языковых элементов как общую характеристику всех лингвистиче­ских структур. Он выводит следующее правило: «Про­порции лингвистических элементов, принадлежащих то­му или иному уровню или сфере лингвистического кодирования - фонологии, грамматике, метрике, - остаются более или менее постоянными для данного языка, в данный период его развития и в пределах достаточно обширных и беспристрастно проведенных наблюдений» 8 2 . Это правило, которое Хердан называет основным зако­ном языка, он стремится определенным образом истолковать и расширить. «Он, - пишет Хердан об этом за­коне, - является выражением факта, что даже здесь, где человеческой воле и свободе выбора предоставлены<124> широчайшие рамки, где сознательный выбор и беззаботная игра живо чередуются друг с другом, в целом существует значительная стабильность... Наши исследования обнаружили еще один фактор общего порядка: далеко идущее сходство между членами одного языкового коллектива наблюдается не только в системе фонем, в словаре и в грамматике, но также и в отношении частоты употребления конкретных фонем, лексических единиц (слов) и грамматических фонем и конструкций; другими словами, сходство не только в том,чтоиспользуется, но также и в том,как частоиспользуется» 8 3 . Такое положение обусловливается понятными причинами, но это дает повод для новых выводов. При исследовании различных текстов или отрезков данного языка, например, обнаруживается, что относительные частоты использования данной конкретной фонемы (или других рече­вых элементов) разными людьми остаются в основном одними и теми же. Это и приводит к истолковыванию индивидуальных форм речи как некоторых колебаний постоянной вероятности употребления рассматриваемой фонемы в данном языке. Таким образом получается, что в своей речевой деятельности человек подчинен определенным законам вероятности в отношении количества используемых лингвистических элементов. А тогда, ког­да мы наблюдаем огромное количество лингвистических элементов в большой совокупности текстов или речевых отрезков, у нас создается впечатление причинной зави­симости в том смысле, что в данном случае имеет место также детерминирование и в отношении использования определенных лингвистических элементов. Другими сло­вами, оказывается допустимым утверждать, что то, что с интуитивной точки зрения представляется причинным отношением, в квантитативном плане является вероят­ностью 8 4 . При этом очевидно, что чем больше совокуп<125>ность обследываемых текстов или речевых отрезков, тем отчетливее будет проявляться стабильность относитель­ной частоты употребления языковых элементов также и в индивидуальном использовании (закон больших чисел). Отсюда делается новый общий вывод о том, что язык есть массовое явление и должен трактоваться как таковое.

Указанные выводы, достигнутые на основании ча­стотных исчислений фонетических элементов, слов и грамматических форм, которые в совокупности состав­ляют язык, применяются затем к «статистической интер­претации» проводимого Соссюром разделения на «язык» (lalangue) и «речь» (laparole). По Соссюру, «язык» есть совокупность лингвистических привычек, которые делают возможным общение между членами данного языкового коллектива. Это социальная реаль­ность, «массовое явление», обязательное для всего гово­рящего на данном языке народа. Хердан, как указыва­лось, доказывает, что члены единого языкового коллек­тива сходствуют друг с другом не только тем, что ис­пользуют одни и те же фонемы, лексические единицы и грамматические формы, но и тем, что все эти элементы употребляются с одинаковой частотой. Таким образом, статистическое определение «языка» принимает у него следующую форму: «язык» (lalangue) есть совокуп­ность общих лингвистических элементов плюс их относительная вероятность употребления.

Такое определение «языка» является исходным и для соответствующего статистического истолкования «речи», которая, согласно Соссюру, представляет собой индиви­дуальное высказывание. Противопоставляя «язык» как явление социальное «речи» как явлению индивидуаль­ному, Соссюр писал: «Речь есть индивидуальный акт воли и понимания, в котором надлежит различать: 1. комбинации, при помощи которых говорящий субъект пользуется языковым кодексом с целью выражения сво­ей личной мысли; 2. психофизический механизм, позво­ляющий ему объективировать эти комбинации» 8 5 . Поскольку «язык» в лингвостатистике рассматривается как совокупность элементов с определенной относитель<126>ной вероятностью их употребления, постольку он включает в себя в качестве существеннейшей характеристики статистическую совокупность или ансамбль (популя­цию) и может рассматриваться в этом аспекте. В соот­ветствии с этим «речь» превращается в отдельную вы­борку, взятую из «языка» как статистической совокуп­ности. Вероятность в данном случае обусловливается отношением «речи» к «языку» (в их «квантитативном» понимании), а распределение относительной частоты употребления разных элементов языка истолковывается как результат коллективного «выбора» (choice) в опре­деленный хронологический период существования языка. Понимая, что такая трактовка различий «языка» и «ре­чи» строится все же на совершенно иных основаниях, чем у Соссюра, Хердан пишет в этой связи: «Эта, види­мо, незначительная модификация концепции Соссюра имеет то важное следствие, что «язык» (lalangue) ныне приобретает существенную характеристику в виде ста­тистической совокупности (популяции). Эта популяция характеризуется определенными относительными часто­тами или вероятностями колебаний, имея в виду, что каждый лингвистический элемент относится к опреде­ленному лингвистическому уровню. В этом случае «речь» (laparole) в соответствии со своим значением оказы­вается термином для определения статистических выбо­рок, взятых из «языка» как статистической совокупно­сти. Становится очевидным, что выбор (choice) выступает здесь в виде отношения «речи» к «языку», являясь отношением взятой наудачу выборки к статистической совокупности (популяции). Сам порядок распределения частоты, в качестве отложения речевой деятельности языкового коллектива в течение столетий, представляет собой элемент выбора (choice), но не индивидуального выбора, как в стиле, а коллективного выбора. Употреб­ляя метафору, мы можем здесь говорить о выборе, сде­ланном духом языка, если мы понимаем под этим прин­ципы лингвистической коммуникации, находящиеся в соответствии с комплексом психических данных членов конкретного языкового коллектива. Стабильность серий есть результат вероятности (chance)» 8 6 .

Частным случаем приложения изложенного принци<127>па является отграничение в языке нормативных явлении от «исключений» (отклонений). В лингвостатистике утверждается, что статистический метод позволяет устранить существующую в данном вопросе нечеткость и установить ясные критерии для разграничения указан­ных явлений. Если под нормой понимается статистиче­ская совокупность (в вышеуказанном смысле), а исключением (или ошибкой) - отклонение от частот, показы­ваемых статистической совокупностью, то квантитатив­ное решение вопроса напрашивается само собой. Здесь все сводится к статистическим отношениям между «по­пуляцией» и «отклонением». Если частоты, наблюдае­мые в отдельной выборке, отклоняются от вероятностей, обусловленных статистической совокупностью, более, чем это определяется серией выборочных подсчетов, то мы имеем основание заключать, что демаркационная ли­ния между «тем же самым» (нормой) и «не тем же са­мым» (исключением) оказывается нарушенной.

Квантитативные различия между «языком» и «ре­чью» используются и для разграничения языковых эле­ментов двух типов: грамматических и лексических. Исходным моментом для решения этой задачи, пред­ставляющей с лингвистической точки зрения часто боль­шие трудности, является предположение, что степень величины частотности грамматических элементов иная, чем у лексических единиц. Это якобы связывается с «обобщенностью» грамматических элементов, чем они отличаются от понятий, фиксированных лексическими единицами. Кроме того, грамматические элементы яко­бы, как правило, значительно меньше по своему объему: в качестве самостоятельных слов (к ним причисляются местоимения, предлоги, союзы и служебные слова) они обычно состоят из малого количества фонем, а в виде «связанных форм» - из одной или двух фонем 8 7 . Чем меньше лингвистический элемент, тем менее способна его «длина» (количественный момент) служить в каче­стве определяющей характеристики и тем большее значение приобретает для этой цели «качество» фонем. Ка­кие же методы предлагаются для решения рассматри­ваемой проблемы? Она решается посредством обраще­ния к чисто квантитативному понятию грамматической<128> нагрузки, «Предположим, - пишет в этой связи Хердан, - что нас интересует сравнение в указанном отно­шении двух языков. Каким образом мы определяем с известной степенью объективности «грамматическую нагрузку», которую несет язык? Ясно, что эта нагрузка будет зависеть от положения демаркационной линии, отграничивающей грамматику от лексики. Первое сооб­ражение, которое может прийти при этом нам в голову, заключается в том, чтобы определить, насколько «слож­на» грамматика данного языка. Ведь «сложность» - качественная характеристика, а понятие «грамматиче­ской нагрузки» является количественной характеристи­кой. Правда, нагрузка до известной степени зависит от сложности, но не целиком. Язык может быть награжден чрезвычайно сложной грамматикой, но в деятельности языка получает применение только сравнительно неболь­шая ее часть. Мы определяем «грамматическую нагруз­ку» как совокупность грамматики, которую несет язык, когда он находится в действии, что тотчас переводит на­шу проблему в область структуральной лингвистики в том смысле, в каком эта дисциплина была определена Соссюром. В последующем изложении применяются квантитативные методы определения различия языков в зависимости от того, где проходит граница, разделяю­щая грамматику от лексики» 8 8 . Иными словами, различия языков в данном случае должны быть сведены к различиям числовых отношений между грамматиче­скими и лексическими элементами.

Имеющиеся в нашем распоряжении материалы ри­суют следующую картину. В английском языке (учиты­вались лишь «грамматические слова»: местоимения, или, как они также именуются, «заместители», предлоги, союзы и вспомогательные глаголы) в отрезке, включаю­щем 78633 случая употребления всех слов (1027 различ­ных слов), было обнаружено 53 102 случая употребления грамматических элементов, или, точнее говоря, «грамма­тических слов» (149 различных слов), что составляет 67,53% при 15,8% различных слов. Таковы данные Диуэй 8 9 . Другие данные показывают иное процентное<129> соотношение: 57,1% при 5,4% различных слов 9 0 . Такое значительное расхождение объясняется различием письменного и устного языка. Письменные формы языка (первые данные) используют якобы больше грамматиче­ских элементов, чем устные (второй случай). В «Божественной комедии» Данте (по итальянскому оригиналу) Мариотти установил 54,4% случаев употребления «грам­матических слов».

Другой и, видимо, более совершенный способ опре­деления грамматической нагрузки языка заключается в подсчете фонем, входящих в грамматические элемен­ты. В данном случае учитываются не только самостоя­тельные грамматические слова, но и связанные формы. Здесь возможны различные варианты. Например, опре­деление относительной частоты употребления отдельных согласных фонем в грамматических элементах и сопо­ставление их с частотой суммарного употребления этих же фонем (итоговые данные такого соотношения в анг­лийском языке дают пропорцию 99,9% к 100000 - сум­марного употребления); или подобное же сопоставление согласных по отдельным классификационным группам (лабиальные, палатальные, велярные и прочие фонемы). Итоговое соотношение здесь принимает форму пропорции 56,47% (в грамматических элементах) к 60,25% (в суммарном употреблении); или такое же сопоставление начальных согласных фонем (в этом случае получи­лось соотношение 100,2% в грамматических словах к 99,95 - в суммарном употреблении). Возможны и иные более сложные статистические операции, которые, одна­ко, в результате дают подобные же квантитативные вы­ражения исследуемой проблемы.

Приведенные квантитативные данные служат основа­нием для общего вывода. Он сводится к тому, что рас­пределение фонем в грамматических элементах обуслов­ливает характер распределения (в числовом, конечно, выражении) фонем в языке в целом. А это в свою оче­редь позволяет заключить, что употребление граммати­ческих элементов в наименьшей степени зависит от индивидуального выбора и составляет ту часть лингви­стического выражения, которая контролируется вероят<130>ностью. Этот умозрительный вывод подтверждается подсчетом грамматических форм в русском языке, сделанным Есселсоном 9 1 . Исследованию было подвергну­то 46896 слов, взятых из II источников (произведения Грибоедова, Достоевского, Гончарова, Салтыкова-Щедрина, Гаршина, Белинского, Амфитеатрова, Гусева-Оренбургского, Эренбурга, Симонова и Н. Островского). Они были разделены на разговорные слова (17 756 слов, или 37,9%) и неразговорные (29140 слов, или 62,1%). Затем вся совокупность слов была подразделена на 4 группы в зависимости от их грамматического характера: в 1-ю группу вошли существительные, прилага­тельные, прилагательные в функции существительных, местоимения и склоняемые числительные; во 2-ю группу - глаголы; в 3-ю группу - отглагольные причастия, причастия в функции прилагательных и существительных и деепричастия; в 4-ю группу - неизменяемые формы наречия, предлоги, союзы и частицы. Суммарные результаты (приводятся также таблицы с данными по отдельным авторам) дают следующее соотношение:

1-я группа

2-я группа

3-я группа

4-я группа

разговорн.

неразговорн.

Хердан следующими словами характеризует рас­смотрение полученных таким образом квантитативных данных: «Они оправдывают вывод, что грамматические элементы следует рассматривать в качестве фактора, обусловливающего вероятность лингвистического выражения. Такой вывод позволяет избежать обременитель­ной квалификации каждого употребляемого слова. Со­вершенно очевидно, что, поскольку грамматика и лекси­ка не хранятся в водонепроницаемых оболочках, ни та и ни другая не являются чистым «выбором» (choice) или чистой «вероятностью» (chance). И грамматика и лексика содержат оба элемента, хотя и в значительно варьирующихся пропорциях» 9 2 . <131>

Большой раздел книги Хердана посвящен исследова­нию в языке двухплановости или двойственности (dua­lity), причем само понятие двойственности основывает­ся им на математических характеристиках.

Так, теоремы в проективной геометрии можно распо­лагать в два ряда, так что каждая теорема одного ряда может быть получена из некоторый теоремы другого ря­да посредством замены друг на друга слов точка ипря­мая. Например, если дано положение: «любые различ­ные точки принадлежат одной и только одной прямой», то мы можем из него вывести соотнесенное ему положе­ние: «любые две различные прямые принадлежат одной и только одной точке». Другим методом определения двойственности является нанесение по оси абсцисс и оси ординат разных планов исследуемого явления. Так, как это, например, делает Юл 9 3 , по оси абсцисс отсчитываются различные частоты употребления, а по оси ординат - количество лексических единиц, у которых определяется частотность и т. д. Так трактуется понятие двойственности, якобы в равной мере применимое и к. лингвистическим исследованиям.

Под определенное таким образом понятие двойствен­ности, которое во всех случаях фактически имеет харак­тер бинарного кода и которое также считается самой су­щественной чертой языковой структуры, подводятся чрезвычайно разнокачественные явления, допускающие противоположение по двум планам: распределение упо­требления слов соответственно характеру лексических единиц и распределение лексических единиц соответст­венно частоте употребления слов; письменную и разго­ворную формы речи; лексические и грамматические эле­менты; синонимы и антонимы; фонема и ее графическое изображение; определяемое и определяющее (соссюровские signifiantиsignifiй) и т. д.

После квантитативного исследования двойственности того или иного частного, языкового явления или ограниченного «текста», как правило, делается вывод, которому приписываются качества лингвистической универсальности. Характер подобных выводов и спо­соб их обоснования можно проследить на примере<132> исследования двойственности слова и понятия (фактиче­ски же речь идет о соотношении длины слова и объема понятия - надо иметь в виду, что чрезвычайно свобод­ное употребление лингвистических и иных терминов в подобных работах часто весьма затрудняет понимание). Важно при этом отметить, что в качестве материала, послужившего источником наблюдений данного вида лингвистической двойственности, были использованы: международная номенклатура болезней (около 1000 на­званий) и общий регистр заболеваний по Англии и Уэллсу за 1949 г. В этом случае делается следующий общий вывод: «Каждое понятие, обозначающее общую идею, имеет то, что можно назвать «сферой» или «объемом». Оно позволяет через свое посредство думать о многих предметах или других понятиях, находящихся внутри его «сферы». С другой стороны, все предметы, необхо­димые для определения понятия, составляют то, что на­зывается его «содержанием». Объем и содержание взаимно соотносимы - чем меньше содержание и соот­ветственно чем более абстрактно понятие, тем больше его сфера или объем, т. е. тем больше объектов подво­дится под него. Это можно рассматривать как аналогию (в понятийной сфере) принципам кодирования, соответ­ственно которым длина символа и частота употребления взаимозависимы» 9 4 .

Принцип двойственности применяется и к частным проблемам. Например, при установлении эквивалентно­сти значений слов двух разных языков. В результате изучения англо-немецкого словаря Мюре - 3андерса с применением математического метода итераций делает­ся вывод, что вероятность употребления английского слова с одним или больше значением в немецком пере­воде остается постоянной для каждой начальной буквы во всем словаре 9 5 . Рассмотрение порядка расположения слов в китайских словарях приводит к заключению, что он носит таксономический характер, так как количество черт в иероглифе указывает его место (как самостоя­тельного радикала или определенного подкласса, подчиняющегося радикалу). Таксономия представляет со­бой соподчиняющий принцип классификации, применяю­щийся в зоологии и ботанике. Хердан утверждает, что<133> основы китайской лексикографии также строятся на принципах таксономии 9 6 и т. д.

Делая общую оценку данного направления приме­нения математических методов к изучению лингвисти­ческих проблем (т. е. лингвостатистики), необходимо, видимо, исходить из того положения, которое было сформулировано Эттингером: «Математика может быть эффективно использована на службе лингвистики только тогда, когда языковедам будут ясны реальные границы ее применения, так же как и возможности ис­пользуемых математических моделей» 9 7 . Иными сло­вами, о математической лингвистике речь может идти тогда, когда математические методы докажут свою при­годность для решения тех собственно лингвистических задач, которые в своей совокупности составляют науку о языке. Если же этого нет, хотя при этом, возможно, и открываются новые аспекты научного исследования, то в таком случае можно говорить о чем угодно, но только не о лингвистике - в данном случае имеются в виду не разные виды прикладной лингвистики (о ней еще будет речь ниже), а научное, или теоретическое, языкознание. Исходя из этой позиции, следует отметить, что с точки зрения лингвиста многое в лингвостатистике вызывает сомнение и даже недоумение.

Обратимся к разбору только двух примеров (чтобы не загромождать изложения), оговорившись, что весьма существенные возражения можно сделать по каждому из них. Вот перед нами квантитативное разграничение грамматических и лексических единиц. Оказывается, для того, чтобы произвести такое разграничение, необходимо уже заранее знать, что относится к области грамматики, а что - к лексике, так как «грамматическая нагрузка» языка (т. е. совокупность употребляемых в речи грам­матических элементов), как указывается в приводившей­ся выше цитате, «зависит от демаркационной линии, отграничивающей лексику от грамматики». Не зная, где пролегает эта линия, нельзя, следовательно, и провести указанного разграничения. В чем же тогда смысл кванти­тативного способа разграничения лексического от грам<134>матического? Впрочем, что касается Хердана, то он осо­бенно не задумывается над этим вопросом и смело клас­сифицирует языковые элементы, относя к грамматическим элементам «связанные формы», под которыми, судя по изложению, следует разуметь внешнюю флексию, и «грамматические слова», куда относятся предлоги, союзы, вспомогательные глаголы и местоимения - последние в силу того, что они являются «заместителями». Но если говорить только об этом качестве местоимений и на этом основании относить их к грамматическим элементам, то тогда к ним, очевидно, следует отнести и такие слова, как «вышеупомянутый», «названный», «данный» и т. д., так как они тоже выступают в качестве заместителей. В связи с применяемым в лингвостатистике способом выделения грамматических элементов естественно возни­кает вопрос, как же поступать в этом случае с такими «не имеющими вида» грамматическими явлениями, как порядок слов, тоны, нулевые морфемы, парадигматиче­ские отношения (часть этих явлений, кстати говоря, на­ходит отражение и в тех языках, которые исследуются математическими методами)? Как проводить разграни­чение в языках с богатой внутренней флексией (как, на­пример, в семитских языках), где она осуществляет не только грамматическую модификацию корня (радика­ла), но и сообщает ему лексическое существование, так как корень без перегласовок не имеет реального су­ществования в языке? Что следует понимать под грамматической сложностью языка, каким критерием она определяется? Если количественным моментом, который в этом случае всячески подчеркивается, то тогда одним из самых сложных в грамматическом отношении языков окажется английский, обладающий такими конструк­циями, как IshallhavebeencallingилиHewouldhavebeencalling. В этих предложениях толькоcallможно отнести к лексическому, а все остальное, следовательно, надлежит считать грамматическим. Какие суще­ствуют основания связывать частотность употреблений грамматических элементов с обобщенностью или аб­страктностью значений грамматических слов? Ведь со­вершенно очевидно, что относительно большая частота употребления грамматических элементов определяется их функцией в построении предложений, а что касается абстрактности значений, то очень просто найти большое<135> количество лексических элементов, которые легко в этом отношении могут соревноваться с грамматическими эле­ментами, во многом уступая им в частотности (напри­мер,бытие, существование, протяженность, простран­ство, субстанция и т. д).

Подобного же рода несуразности встают перед нами и в случае с определением двойственности (duality) сло­ва и понятия. Надо обладать чрезвычайно своеобразным пониманием структурной сущности языка, чтобы подвер­гать ее исследованию, пользуясь номенклатурой болез­ней и больничным регистром заболеваний, что, как ука­зывалось выше, послужило исходным материалом для весьма ответственных лингвистических выводов. Не останавливаясь на совершенно неясном употреблении таких не имеющих лингвистического бытия терминов, как сфе­ра, объем и содержание понятия (кстати говоря, при этом грубо путаются лексическое значение слова и обо­значаемое научным термином понятие), обратимся к заключению, которое в этом случае делается. Как ука­зывалось выше, мы имеем дело с утверждением, что «объем и содержание взаимно соотносимы». Весь ход рассуждения, который дает основание для такого выво­да, так же как и способ математического оперирования языковыми фактами, отчетливо показывает, что в этом случае совершенно не учитывается одно весьма сущест­венное качество языка, которое опрокидывает все про­водимые расчеты: способность выражать одно и то же «содержание» лингвистическими единицами разного «объема», несомненно обладающими к тому же разной относительной частотой употребления. Так, одно и то же лицо мы можем обозначить как Петров, мой знакомый, он, москвич, молодой человек, сотрудник университета, брат моей жены, человек, которого мы встретили на мосту, и т. д. В свете подобных фактов сомнение вызывают не только частные выводы, которым, однако, как указы­валось, придается универсальное значение, но и целесообразность применения самих квантитативных мето­дов к подобного рода лингвистическим проблемам.

Но иногда лингвистам предлагаются выводы, спра­ведливость которых не вызывает никакого сомнения. Та­ковым является «основной закон языка», заключающийся в том, что в языке наблюдается определенная стабиль­ность его элементов и относительной частоты их упо<136>­требления. Беда подобного рода открытий заключается, однако, в том, что они давно известны лингвистам. Ведь совершенно очевидно, что если бы язык не обладал из­вестной стабильностью и каждый член данного языково­го коллектива свободно варьировал элементы языка, то не было бы возможно взаимное общение и само сущест­вование языка стало бы бессмысленным. А что касается распределения относительной частоты употребления от­дельных элементов языка, то она нашла свое выраже­ние в языкознании в виде выделения категорий пассив­ной и активной лексики и грамматики, чему так много уделял внимания Л. В. Щерба. В данном случае статистические методы могут оказать помощь лингвистам только в распределении конкретных языковых элемен­тов по разрядам относительной частоты их употребле­ния, но не имеют никаких оснований претендовать на открытие каких-то новых закономерностей, представ­ляющих ценность для теоретической лингвистики.

С другой стороны, лингвостатистика предлагает ряд действительно «оригинальных» выводов, которые чрез­вычайно показательны для характера научного мышле­ния ее адептов. Так, сложными статистическими метода­ми исследуется «политическая лексика» в трудах Чер­чилля, Бенеша, Халифакса, Штреземана и других, причем в подсчетах для неанглоязычных авторов используются переводы их работ на английский язык. Результаты подсчетов представлены в виде многочислен­ных таблиц, математических формул и уравнений. Лин­гвистическая интерпретация квантитативных данных в этом случае сводится всего лишь к тому, что употребле­ние Черчиллем «политической лексики» является наибо­лее типичным (?) для данной группы авторов и что ис­пользование Черчиллем слов в тех случаях, когда он касается политических вопросов, типично для англий­ского речевого коллектива 9 8 .

В другом случае после соответствующих статисти­ческих манипуляций делается вывод, что Гитлер в сло­воупотреблении нацистской Германии нарушил двойственность между «языком» и «речью» в квантитативном понимании этих терминов. Частным случаем уничтоже­ния этой двойственности является буквальное понима<137>ние метафорических оборотов (например, «сыпать соль в открытые раны»). Нацистская Германия заклеймила себя таким количеством бесчеловечных поступков, что едва ли есть надобность уличать ее и в этом лингвисти­ческом злодействе 9 9 . К нарушению лингвистической двойственности ведет, по утверждению Хердана, и опре­деление Марксом языка как непосредственной действи­тельности мысли, а закон диалектики о переходе явления в свою противоположность есть, по его мнению, непра­вильно понятый лингвистический закон двойственности языка 1 00 . Подобного рода интерпретации говорят сами за себя.

Наконец, общим недостатком, свойственным всем приведенным случаям квантитативного способа изуче­ния лингвистического материала и тем самым приобре­тающим уже методологический характер, является под­ход к языковым элементам как к механической совокуп­ности абсолютно независимых друг от друга фактов, в соответствии с чем, если при этом и вскрываются какие-либо закономерности, то они относятся только к число­вым отношениям распределения автономных фактов, вне их системных зависимостей. Правда, Дж. Уотмоу всяче­ски стремится уверить, что именно математика лучше, чем любой вид лингвистического структурного анализа, способна вскрыть структурные особенности языка. «Современная математика, - пишет он, - занимается не измерением и исчислением, точность которых по самой своей природе ограничена, но в первую очередь структу­рой. Вот почему математика в высшей степени способствует точности изучения языка - в такой степени, на какую не способно раздельное описание, еще более ограниченное по своей природе... Так же как в физике математические элементы используются для описания физического мира, поскольку предполагается, что они соответствуют элементам физического мира, так и в математической лингвистике математические элементы предположительно должны соответствовать элементам мира речи» 1 01 . Но такая постановка вопроса отнюдь не спасает положения, так как в лучшем случае она может<138> дать анализ языка либо какфизическойструктуры, что для языка еще далеко не достаточно, и в конечном счете носит все тот же механистический характер, либо каклогико-математическойструктуры, а это переносит язык в иную и во многом чуждую ему плоскость 1 02 . Не лишне при этом отметить, что успехи математической лингвистики Уотмоу предвидит только в будущем, а что касается их реальных результатов, то он дает им оценку в следующих словах: «...почти вся работа, выполненная по настоящее время Херданом, Ципфом, Юлом, Гиро (Guiraux) и другими, находится отнюдь не за пределами критики как со стороны лингвистики, так и математики; она в значительной мере отдает любительщиной» 1 03 . Таким образом, если не пытаться предсказывать будущее математических методов в лингвистических исследованиях, а постараться по заслугам оценить то, чем мы располагаем на сегодняшний день, то по необходимости придется признать, что математика фактически пока ограничивалась в области языкознания лишь «измерением и подсчетом», а качественного анализа языка, вникающего в его структуру, не смогла дать. <139>

Постараемся все же быть максимально объективны­ми. В известной своей части квантитативные данные, ви­димо, могут быть использованы лингвистикой, но лишь в качестве вспомогательныхи по преимуществу в проблемах, имеющих практическую направленность. В отношении же большей части квантитативных спосо­бов изучения отдельных лингвистических явлений, не­сомненно, оправдан общий вывод Р. Брауна: «Их можно рассматривать так, как их рассматривает Хердан, но каков смысл всего этого?» 1 04 . Представим себе, что мы задаем вопрос: «Что собой представляют деревья в этом саду?». И в ответ получаем: «В этом саду сто деревьев». Разве это ответ на наш вопрос и разве действительно он имеет смысл? А ведь в отношении многих лингвистиче­ских вопросов математические методы дают именно та­кого рода ответы.

Однако существует широкая область исследователь­ской деятельности, использующая по преимуществу ма­тематические методы и в то же время ориентирующая их на языковый материал, где целесообразность такого объединения не вызывает никакого сомнения. «Смысл» этой исследовательской деятельности, ее значимость обусловливается теми целями, к которым она стремится. Она уже апробирована практикой. Речь в данном слу­чае идет о проблемах, связанных с созданием информационных машин, конструкций для машинного перево­да письменных научных текстов, автоматизацией пере­вода устной речи с одного языка на другой и со всем тем комплексом задач, которые объединяются в лингви­стических вопросах кибернетики. Всей совокупности подобных проблем обычно присваивают общее наименова­ние прикладной лингвистики. Тем самым она отграничи­вается от так называемой математической лингвистики, включающей те направления работы, которые выше бы­ли обозначены как стилостатистика и лингвостатистика, хотя отнюдь не избегает статистической обработки лин­гвистического материала. Пожалуй, наиболее важной чертой прикладной лингвистики, отделяющей ее от ма­тематической лингвистики, как она обрисовывалась вы­ше, является то, что первая имеет обратную направлен­ность: не математика для лингвистики, но лингвистика<140> (формализованная математическими методами) для широкого комплекса практических задач.

Нет надобности раскрывать содержание отдельных проблем, включающихся в ныне чрезвычайно широкую область прикладной лингвистики. В противоположность математической лингвистике, эти проблемы активно обсуждаются в советской лингвистической литературе и справедливо начинают занимать все более видное место в научной проблематике исследовательских институ­тов 1 05 . Таким образом, они уже достаточно известны нашей лингвистической общественности. Это обстоя­тельство, однако, не освобождает нас от необходимости подвергнуть их осмыслению, в частности, с точки зрения принципов науки о языке. Это несомненно поможет устранению недоразумений, которые все чаще и чаще возникают между представителями весьма далеких друг от друга наук, принимающих участие в работе над про­блемами прикладной лингвистики, и наметит пути их сближения, с одной стороны, и разграничения областей исследования, с другой стороны. Само собой разумеет­ся, что нижеследующие соображения будут представ­лять точку зрения лингвиста, и необходимо, чтобы мате­матики не только постарались ее усвоить, но в связи с поднимающимися вопросами дали им свою трактовку.

Лингвиста-теоретика никак не может удовлетворить то обстоятельство, что во всех случаях исследования яв<141>лений языка в тех целях, которые ставятся прикладной лингвистикой, основой их служит математическая мо­дель. В соответствии с этим наблюдения над явлениями языка и получаемые при этом результаты выражаются в терминах и понятиях математики, т. е. посредством математических уравнений и формул. Обратимся для на­глядности к примеру. Кондон 1 06 и Ципф 1 07 установили, что логарифмы частоты (f ) употребления слов в тексте большого объема располагаются почти на прямой ли­нии, если на диаграмме соотнести их с логарифмами ран­га или разряда (r ) этих слов. Уравнениеf = c: r, гдес является константой, отражает это отношение в том ограниченном смысле, чтоc: r для заданного значе­нияr с большой приближенностью воспроизводит наблюдаемую частоту. Отношение междуf иr, выражен­ное математической формулой, является моделью для отношений между наблюдаемыми значениями частоты употребления и ранга, или разряда, слов. Таков один из случаев математического моделирования. 

Вся теория информации целиком базируется на ма­тематической модели процесса коммуникации, разрабо­танной К. Шенноном 1 08 . Она определяется как «мате­матическая дисциплина, посвященная способам вычис­ления и оценке количества информации, содержащейся в каких-либо данных, и исследованию процессов хра­нения и передачи информации» (БСЭ, т. 51, стр. 128). Соответственно и основные понятия теории информации получают математическое выражение.Информацияизмеряется бинитами или двоичными единицами (код, которому уподобляется и язык, с двумя условными рав­но вероятными сигналами передает одну двоичную еди­ницу информации при передаче каждого символа).Избыточностьопределяется как «разность между теоретически возможной передающей способностью ка­кого-либо кода и средним количеством передаваемой ин<142>формации. Избыточность выражается в процентах к об­щей передающей способности кода» 1 09 и пр. Точно так же и для машинного перевода необходима алгоритмиче­ская разработка отображения элементов одного языка в другом и т. д. 1 10 . Таковы другие случаи моделирования.

Использование моделей вне всякого значения может оказать весьма существенную помощь, в частности, по всей вероятности, при решении тех задач, которые ста­вит перед собой прикладная лингвистика. Однако для теоретического языкознания весьма существенным яв­ляется то обстоятельство, что абстрактная модель, как правило, не воспроизводит всех особенностей действи­тельного явления, всех его функциональных качеств. Так, архитектор, перед тем как построить дом, может создать его модель, воспроизводящую во всех мельчай­ших деталях проектируемый дом, и это помогает ему решить ряд практических вопросов, связанных с по­стройкой самого дома. Но такая модель дома, какой бы она точной ни была, лишена той «функции» и того назна­чения, ради чего строятся вообще все дома - она не спо­собна обеспечить человека жильем. Аналогичным обра­зом обстоит дело и с языком, где модель не всегда спо­собна воспроизвести все его качества. В данном же слу­чае дело усложняется еще и тем, что для построения мо­дели используются не собственно лингвистические, а ма­тематические мерила. «Математические модели...- пи­шет А. Эттингер, - играют чрезвычайно важную роль во всех областях техники, но поскольку они являются орудием синтеза, их значение для лингвистики, являю­щейся в первую очередь исторической и описательной дисциплиной, естественно имеет ограниченный харак­тер» 1 11 .<143>

Математическое моделирование языка фактически применимо только к его статическому состоянию, ко­торое для языковеда является условным и в действительности находится в прямом противоречии с основным качеством языка, самой формой существования которого является развитие. Само собой разумеется, статическое изучение языка отнюдь не исключается и из языкозна­ния и является основой при составлении нормативных грамматик и словарей, описательных грамматик, прак­тических грамматик и словарей, служащих пособием для практического изучения иностранных языков, и т. д. Однако во всех таких работах, имеющих по преимуще­ству прикладной характер, языковеды идут на созна­тельное ограничение поля исследования и отнюдь не закрывают глаза на другие аспекты языка 1 12 . При ста­тическом рассмотрении языка, в частности, совершенно пропадают из поля зрения исследователя такие каче­ства языка, связанные с его динамическим характером, как продуктивность, зависимость от форм мышления, широкое взаимодействие с культурными, социальными, политическими, историческими и прочими факторами. Только в плане синхроническом можно язык рассматри­вать как систему условных знаков или кодов, что, одна­ко, оказывается совершенно неправомерным, как только мы становимся на более подходящую для языка динамическую точку зрения. Именно в процессах раз­вития проявляются такие качества языка, как мотивированность, не имеющая стабильных границ многознач­ность слов, неавтономность значения слова и его зву­ковой оболочки, связанные с контекстом творческие по­тенции слова, а это все находится в резком противоречии с основными характеристиками кода или знака 1 13 . Оче­видно, в прикладной лингвистике также можно отмысливаться от всех этих качеств языка и в практических це­лях довольствоваться, так сказать, «моментальным сним­ком» языка, который все же способен дать достаточно приближенное представление о механизме его функцио<144>нирования. Однако каждый такой «моментальный сни­мок», если его рассматривать как факт языка, а не как факт системы условных кодов, должен быть включен­ным в бесконечный процесс движения, в котором язык всегда пребывает 1 14 . Его нельзя изучать вне тех кон­кретных условий, которые характеризуют это движение, накладывающее свой отпечаток на данное состояние языка и обусловливающее потенции дальнейшего его развития. Здесь существует такая же разница, как меж­ду моментальной фотографией человека и его портре­том, написанным кистью истинного художника. В про­изведении художника перед нами обобщающий образ человека во всем своеобразии не только его физического облика, но и внутреннего духовного содержания. По ху­дожественному портрету мы можем прочесть и прошлое запечатленного на нем человека и определить, на что он способен в своих поступках. А моментальная фотогра­фия, хотя и способна дать более точное изображение внешности оригинала, лишена этих качеств и нередко фиксирует и случайный прыщ, вскочивший на носу, и<145> совершенно нехарактерную позу или выражение, что в конечном счете приводит к искажению и оригинала.

Следует оговориться, что способ «моментальных снимков» можно, конечно, применять и к фактам разви­тия языка. Но в этом случае мы в действительности будем иметь дело только с отдельными состояниями языка, которые при квантитативной своей характеристике ока­зываются связанными не в большей мере, чем сопоста­вительная квантитативная характеристика разных язы­ков. Подобного рода квантитативная «динамика» ничего органического не будет заключать в себе, и связь от­дельных состояний языка будет покоиться только на со­поставлении числовых отношений. Если и в этом случае прибегать к аналогии, то можно сослаться на рост ре­бенка. Его развитие, разумеется, можно представить в виде динамики числовых данных о его весе, росте, изме­няющихся отношений объема частей его тела, но все эти данные абсолютно отрешены от всего того, что в первую очередь составляет индивидуальную сущность челове­ка - его характера, склонностей, привычек, вкусов и т.д.

Другой негативной стороной математического «мо­делирования» языка является то обстоятельство, что оно не может служить тем общим принципом, на основе которого можно осуществить всестороннее и всеобъемлю­щее - систематическое описание языка. Только лишь математический подход к явлениям языка, например, не даст возможности ответить даже на такие коренные вопросы (без которых немыслимо само существование науки о языке), как: что такое язык, какие явления сле­дует относить к собственно языковым, как определяется слово или предложение, каковы основные понятия и категории языка и пр. Прежде чем обратиться к матема­тическим методам исследования языка, необходимо уже заранее располагать ответами (хотя бы и в форме рабо­чей гипотезы) на все эти вопросы. Нет надобности за­крывать глаза на то, что во всех известных нам случаях исследования языковых явлений математическими мето­дами все указанные понятия и категории неизбежно при­ходилось принимать таковыми, как они были определены традиционными или, условно говоря, качественными методами.

Эту особенность математических методов в их лингви­стическом применении отметил Спанг-Ханссен, когда пи<146>сал: «Следует иметь в виду, что наблюденные факты, по­лучающие квантитативное выражение... не имеют ценности, если они не составляют части описания, а для линг­вистических целей это должно быть систематическое описание, тесно связанное с качественным лингвистиче­ским описанием и теорией» 1 15 . В другом выступлении Спанг-Ханссена мы встречаем уточнение этой мысли: «До тех пор, пока не будет доказана возможность постро­ения квантитативной системы, и до тех пор, пока су­ществует общепринятая качественная система для данной области исследования, частотные подсчеты и иные чис­ловые характеристики с лингвистической точки зрения не имеют никакого смысла» 1 16 . Подоб­ные же идеи вы­сказывает и Улдалль, несколько неожиданно связывая их с разработкой, общетеоретических основ глоссематики: «Когда лингвист считает или измеряет все то, что он счи­тает и измеряет, само по себе определяется не квантита­тивно; например, слова, когда они подсчитываются, определяются, если они вообще определяются, в совершенно иных терминах» 1 17 . <147>

Таким образом оказывается, что как в теоретическом отношении, так и в практическом их применении, мате­матические методы находятся в прямой зависимости от лингвистических понятий и категорий, определенных традиционными, филологическими, или, как говорилось вы­ше, качественными методами. В плане прикладного язы­кознания важно осознание этой зависимости, а следова­тельно, и знакомство со всей совокупностью основных ка­тегорий традиционной лингвистики.

Нет, правда, никаких оснований упрекать представи­телей точных наук, работающих в области прикладной лингвистики, в том, что они не используют данных совре­менной лингвистики. Это не соответствует действитель­ному положению вещей. Они не только отлично знают, но и широко используют в своей работе установленные лингвистами системы дифференциальных признаков, свойственные разным языкам, дистрибуцию и аранжи­ровку языковых элементов в пределах конкретных язы­ковых систем, достижения акустической фонетики и т. д. Но в этом случае необходима весьма существенная ого­ворка. Фактически представители точных наук пользу­ются данными только одного направления в языкозна­нии - так называемой дескриптивной лингвистики, кото­рая сознательно отграничилась от традиционных про­блем теоретического языкознания, далеко не покрывает собой всего поля лингвистического исследования, с соб­ственно лингвистической точки зрения обладает сущест­венными методическими недостатками, что и привело ее к вскрывшемуся в последнее время кризису 1 18 , и, кроме того, имеет сугубо практическую направленность, соответствующую интересам прикладной лингвистики. К дескриптивной лингвистике применимы все те оговорки и упреки, которые выше были сделаны в адрес стати­ческого рассмотрения языка. Подобный односторонний подход дескриптивной лингвистики может, следователь<148>но, оправдываться только теми задачами, которые ста­вит перед собой прикладная лингвистика, но он далеко не исчерпывает всего содержания науки о языке.

В процессе разработки вопросов прикладного языко­знания могут возникнуть и фактически уже возникли но­вые теоретические проблемы. Некоторые из этих проблем тесно связаны с конкретными задачами прикладно­го языкознания и направлены на преодоление тех труд­ностей, которые возникают при разрешении этих задач. Другие проблемы имеют прямое отношение к теоретиче­скому языкознанию, позволяя в новом аспекте взглянуть на традиционные представления или открывая новые области лингвистического исследования, новые понятия и теории. К числу этих последних, например, относится проблема создания «машинного» языка (или языка-по­средника), которая самым тесным образом связана со сложным комплексом таких кардинальных вопросов тео­ретического языкознания, как взаимоотношение понятий и лексических значений, логики и грамматики, диахро­нии и синхронии, знаковой природы языка, сущности лингвистического значения, принципов построения ис­кусственных языков и т.д. 1 19 . В этом случае особенно важно наладить взаимопонимание и содружество в об­щей работе представителей лингвистических дисциплин и точных наук. Что касается лингвистической стороны, то речь в данном случае, видимо, должна идти не о том, чтобы уже заранее ограничивать усилия, например, кон­структоров переводческих машин» и пытаться установить рабочие возможности подобных машин стихами Н. Гри­бачева или прозой В. Кочетова 1 20 . Машина сама найдет границы своих возможностей, а рентабельность - пре­делы ее использования. Но языковеды в качестве своего вклада в общее дело должны внести свое знание особенностей структуры языка, ее многогранности, внутрен­них перекрещивающихся отношений ее элементов, а также широких и многосторонних связей языка с физи­ческими, физиологическими, психическими и логически<149>ми явлениями, специфическими закономерностями функ­ционирования и развития языка. Вся совокупность этих знаний необходима конструкторам соответствую­щих машин, чтобы не блуждать в неверных направле­ниях, но сделать поиски целеустремленными и четко ориентированными. Даже и тот весьма краткий обзор случаев применения математических методов к лингви­стической проблематике, который был сделан в настоя­щем очерке, убеждает, что такие знания отнюдь не будут лишними для представителей точных наук.

На основании всех изложенных соображений можно, очевидно, прийти к некоторым общим выводам.

Итак, математическая лингвистика? Если под этим разумеется применение математических методов в каче­стве универсальной отмычки для решения всех лингви­стических проблем, то такие претензии следует признать абсолютно неправомерными. Все, что было сделано в этом направлении, пока очень мало или даже совсем не способствовало решению традиционных проблем нау­ки о языке. В худшем случае применение математиче­ских методов сопровождается очевидными нелепостями или же с лингвистической точки зрения является абсо­лютно бессмысленным. В лучшем случае математические методы могут быть использованы в качестве вспомога­тельных приемов лингвистического исследования, буду­чи поставлены на службу конкретным и ограниченным по своему характеру лингвистическим задачам. Ни о ка­кой «квантитативной философии языка» при этом не мо­жет быть и речи. На самостоятельность науки о языке в свое время посягали и физика, и психология, и физио­логия, и логика, и социология, и этнология, но не смогли подчинить себе языкознания. Случилось обратное - язы­кознание воспользовалось достижениями этих наук и в нужной для себя мере стало пользоваться их помощью, обогатив тем самым арсенал своих исследовательских приемов. Теперь, видимо, наступила очередь математи­ки. Следует надеяться, что это новое содружество также будет способствовать укреплению науки о языке, совер­шенствованию его рабочих приемов, увеличению их мно­гообразия. О математической лингвистике, следователь­но, правомерно в такой же степени говорить, как и о фи­зической лингвистике, физиологической лингвистике, ло­гической лингвистике, психологической лингвистике и<150> т. д. Таких лингвистик нет, есть только одна лингвистика, с пользой для себя реализующая данные других наук в качестве вспомогательных исследовательских средств. Таким образом, нет никаких оснований отступать перед натиском новой науки и с легкостью уступать ей завое­ванные позиции. Здесь очень уместно вспомнить слова А. Мартине: «Быть может, это и соблазнительно -присоединиться путем использования нескольких удачно выбранных терминов к тому или иному крупному движе­нию мысли, или заявить какой-нибудь математической формулой о строгости своего рассуждения. Однако лин­гвистам уже пришло время осознать самостоятельность их науки и освободиться от того комплекса неполноцен­ности, который заставляет их связывать любое свое действие с тем или иным общенаучным принципом, в ре­зультате чего контуры действительности всегда делают­ся лишь более расплывчатыми, вместо того, чтобы стать более четкими» 1 21 .

Следовательно, математика сама по себе и языко­знание само по себе. Это отнюдь не исключает их взаим­ной помощи или дружеской встречи в совместной работе над общими проблемами. Такого рода местом приложе­ния согласных усилий двух наук и является весь широ­кий круг проблем, входящих в прикладное языкознание и обладающих большой народнохозяйственной значи­мостью. Следует пожелать только, чтобы в своей совместной работе обе науки проявили максимум вза­имопонимания, что, несомненно, будет способствовать и максимальной плодотворности их сотрудничества.<151>

Введение

Глава 1. История применения математических методов в лингвистике

1.1. Становление структурной лингвистики на рубеже XIX – ХХ веков

1.2. Применение математических методов в лингвистике во второй половине ХХ века

Глава 2. Отдельные примеры использования математики в лингвистике

2.1. Машинный перевод

2.2.Статистические методы в изучении языка

2.3. Изучение языка методами формальной логики

2.4. Перспективы применения математических методов в лингвистике

Заключение

Литература

Приложение 1. Ronald Schleifer. Ferdinand de Saussure

Приложение 2. Фердинанд де Соссюр (перевод)

Введение

В ХХ веке наметилась продолжающаяся и поныне тенденция к взаимодействию и взаимопроникновению различных областей знаний. Постепенно стираются грани между отдельными науками; появляется всё больше отраслей умственной деятельности, находящихся «на стыке» гуманитарного, технического и естественнонаучного знания.

Другая очевидная особенность современности – стремление к изучению структур и составляющих их элементов. Поэтому всё большее место как в научной теории, так и на практике уделяется математике. Соприкасаясь, с одной стороны, с логикой и философией, с другой стороны, со статистикой (а, следовательно, и с общественными науками), математика всё глубже проникает в те сферы, которые на протяжении долгого времени было принято считать чисто «гуманитарными», расширяя их эвристический потенциал (ответ на вопрос «сколько» часто помоагет ответить и на вопросы «что» и «как). Исключением не стало и языкознание.

Цель моей курсовой работы – кратко осветить связь математики с такой отраслью языкознания, как лингвистика. Начиная с 50-х годов прошлого века, математика применяется в лингвистике при создании теоретического аппарата для описания строения языков (как естественных, так и искусственных). Однако следует сказать, что она не сразу нашла себе подобное практическое применение. Первоначально математические методы в лингвистике стали использоваться для того, чтобы уточнить основные понятия языкознания, однако с развитием компьютерной техники подобная теоретическая посылка стала находить применение на практике. Разрешение таких задач, как машинный перевод, машинный поиск информации, автоматическая обработка текста требовало принципиально нового подхода к языку. Перед лингвистами назрел вопрос: как научиться представлять языковые закономерности в том виде, в котором их можно подавать непосредственно на технику. Популярным в наше время термином «математическая лингвистика» называют любые лингвистические исследования, в которых применяются точные методы (а понятие точных методов в науке всегда тесно связано с математикой). Некоторые учёные прошлых лет, считают, что само выражение нельзя возводить в ранг термина, так как оно обозначает не какую-то особую «лингвистику», а лишь новое направление, ориентированное на усовершенствование, повышение точности и надёжности методов исследования языка. В лингвистике используются как количественные (алгебраические), так и неколичественные методы, что сближает её с математической логикой, а, следовательно, и с философией, и даже с психологией. Ещё Шлегель отмечал взаимодействие языка и сознания, а видный лингвист начала ХХ века Фердинанд де Соссюр (о его влиянии на становление математических методов в лингвистике расскажу позже) связывал структуру языка с его принадлежностью к народу. Современный исследователь Л. Перловский идёт дальше, отождествляя количественные характеристики языка (например, число родов, падежей) с особенностями национального менталитета (об этом в разделе 2.2, «Статистические методы в лингвистике»).

Взаимодействие математики и языкознания – тема многогранная, и в своей работе я остановлюсь не на всех, а, в первую очередь, на её прикладных аспектах.

Глава I. История применения математических методов в лингвистике

1.1 Становление структурной лингвистики на рубеже XIX – ХХ веков

Математическое описание языка основано на представлении о языке как о механизме, восходящем к известному швейцарскому лингвисту начала ХХ века Фердинанду де Соссюру.

Начальное звено его концепции – теория языка как системы, cостоящей из трёх частей (собственно язык – langue , речь – parole , и речевую деятельность – langage ), в которой каждое слово (член системы) рассматривается не само по себе, а в связи с другими членами. Как впоследствии отметил другой видный лингвист, датчанин Луи Ельмслев, Соссюр «первый требовал структурного подхода к языку, то есть научного описания языка путём регистрации соотношений между единицами» .

Понимая язык как иерархическую структуру, Соссюр первым поставил проблему ценности, значимости языковых единиц. Отдельные явления и события (скажем, история происхождения отдельных индоевропейских слов) должны изучаться не сами по себе, а в системе, в которой они соотнесены с подобными же составляющими.

Структурной единицей языка Соссюр считал слово, «знак», в котором соединялись звучание и смысл. Ни один из этих элементов не существует друг без друга: поэтому носителю языка понятны различные оттенки значения многозначного слова как отдельного элемента в структурном целом, в языке.

Таким образом, в теории Ф. де Соссюра можно увидеть взаимодействие лингвистики, с одной стороны, с социологией и социальной психологией (следует отметить, что в это же время развиваются феноменология Гуссерля, психоанализ Фрейда, теория относительности Эйнштейна, происходят эксперименты над формой и содержанием в литературе, музыке и изобразительном искусстве), с другой стороны – с математикой (понятие системности соответствует алгебраической концепции языка). Подобная концепция изменила понятие языковой интерпретации как таковой: Явления стали трактоваться не относительно причин их возникновения, а относительно настоящего и будущего. Толкование перестало быть независимым от намерений человека (несмотря на то, что намерения могут быть безличными, «бессознательными» во фрейдистском понимании этого слова).

Функционирование же языкового механизма проявляется через речевую деятельность носителей языка. Результатом речи являются так называемые «правильные тексты» – последовательности речевых единиц, подчиняющиеся определённым закономерностям, многие из которых допускают математическое описание. Изучением способов математического описания правильных текстов (в первую очередь, предложений) занимается теория способов описания синтаксической структуры. В подобной структуре языковые аналогии определены не с помощью изначально присущих им качеств, а с помощью системных («структурных») отношений.

На Западе соссюровские идеи развивают младшие современники великого швейцарского лингвиста: в Дании – уже упомянутый мною Л. Ельмслев, давший начало алгебраической теории языка в своём труде «Основы лингвистической теории», в США – Э. Сепир, Л. Блумфилд, Ц. Харрис, в Чехии – русский учёный-эмигрант Н. Трубецкой.

Статистическими же закономерностями в изучении языка стал заниматься не кто иной, как основоположник генетики Георг Мендель. Только в 1968 году филологи обнаружили, что, оказывается, в последние годы жизни он был увлечен изучением лингвистических явлений с помощью методов математики. Этот метод Мендель привнёс в лингвистику из биологии; в девяностые годы девятнадцатого века лишь самые смелые лингвисты и биологи заявляли о целесообразности подобного анализа. В архиве монастыря св. Томаша в г. Брно, аббатом которого был Мендель, были найдены листки со столбцами фамилий, оканчивающимися на «mann», «bauer», «mayer», и с какими-то дробями и вычислениями. Стремясь обнаружить формальные законы происхождения фамильных имен, Мендель производит сложные подсчеты, в которых учитывает количество гласных и согласных в немецком языке, общее число рассматриваемых им слов, количество фамилий и т.д.

В нашей стране структурная лингвистика начала развиваться примерно в то же время, что и на Западе – на рубеже XIX-XX веков. Одновременно с Ф. де Соссюром понятие языка как системы разрабатывали в своих трудах профессора Казанского университета Ф.Ф. Фортунатов и И.А. Бодуэн де Куртенэ. Последний на протяжении долгого времени переписывался с де Соссюром, соответственно, женевская и казанская школы языкознания сотрудничали друг с другом. Если Соссюра можно назвать идеологом «точных» методов в лингвистике, то Бодуэн де Куртенэ заложил практические основы их применения. Он первым отделил лингвистику (как точную науку, использующую статистические методы и функциональную зависимость) от филологии (общности гуманитарных дисциплин, изучающих духовную культуру через язык и речь). Сам учёный считал, что «языкознание может принести пользу в ближайшем будущем, лишь освободившись от обязательного союза с филологией и историей литературы» . «Испытательным полигоном» для внедрения математических методов в лингвистику стала фонология – звуки как «атомы» языковой системы, обладающие ограниченным количеством легко измеримых свойств, были самым удобным материалом для формальных, строгих методов описания. Фонология отрицает наличие смысла у звука, так что в исследованиях устранялся «человеческий» фактор. В этом смысле фонемы подобны физическим или биологическим объектам.

Фонемы, как самые мелкие языковые элементы, приемлемые для восприятия, представляют собой отдельную сферу, отдельную «феноменологическую реальность». Например, в английском языке звук «т» может произноситься по-разному, но во всех случаях человек, владеющий английским, будет воспринимать его как «т». Главное, что фонема будет выполнять свою главную – смыслоразличительную – функцию. Более того – различия между языками таковы, что разновидности одного звука в одном языке могут соответствовать разным фонемам в другом; например «л» и «р» в английском различны, в то время как в других языках это разновидности одной фонемы (подобно английскому «т», произнесённому с придыханием или без). Обширный словарный запас любого естественного языка представляет собой набор сочетаний гораздо меньшего количества фонем. В английском, например, для произнесения и написания около миллиона слов используется всего 40 фонем.