Возьмем предложение The dog likes ice-cream ‘Эта собака любит мороженое’. Первое слово, с которым сталкивается ментальный синтаксический анализатор — это the. Синтаксический анализатор наводит о нем справки в ментальном словаре; это то же самое, что обнаружить данное слово в правой части правила и выяснить его категорию, указанную в левой части. Это детерминатор (determiner, det). Следовательно синтаксический анализатор может вырастить первую веточку предложения на дереве. (Правда, дерево, растущее сверху вниз от листьев к корням невозможно в ботанике.)
Детерминаторы, как и все слова, должны быть частью какой-либо большей синтаксической группы. Синтаксический анализатор может вычислить, какая именно синтаксическая группа имеется в виду, проверив, в правой части какого правила имеется «det». Это будет правило, определяющее именную группу, NP. Дерево может быть продолжено:
Эта обособленная структура должна быть удержана в некой определенной памяти. Синтаксический анализатор запоминает, что находящееся в нашем распоряжении слово the является частью именной группы, которая скоро должна быть укомплектована словами, которые заполнили бы остальные слоты, в данном случае — по меньшей мере одним существительным.
Тем временем дерево продолжает расти, поскольку именные группы не могут оставаться ни к чему не присоединенными. Проверив, правая сторона каких правил содержит символ NP, синтаксический анализатор имеет несколько вариантов на выбор. Только что построенная именная группа может быть частью предложения, частью глагольной группы или частью предложной группы. Эту задачу выбора можно решить, исходя из главного: все синтаксические группы должны быть в итоге включены в предложение (S), а предложение должно начинаться с именной группы, поэтому, чтобы продолжить дерево, логично использовать правило построения предложения:
Обратите внимание, что теперь синтаксический анализатор удерживает в памяти две неукомплектованных ветви: именная группа, для укомплектования которой требуется имя существительное, и предложение, для укомплектования которого требуется глагольная группа.
Обособленная именная ветвь аналогична предсказанию того, что следующее слово должно быть именем существительным. И когда дело доходит до следующего слова dog ‘собака’, просмотр правил подтверждает такое предсказание: слово dog — это часть правила для имени существительного. Это позволяет слову dog быть включенным в дерево, укомплектовывая именную конструкцию:
Синтаксическому анализатору больше не нужно помнить, что следует укомплектовать NP, все, что нужно держать в памяти, — это неукомплектованное S.
На данном этапе можно в какой-то степени предположить значение предложения. Вспомните о том, что одно существительное в именной группе является ядром — вершиной (то, о чем говорит вся группа), а остальные синтаксические группы в составе именной могут определять это существительное. Найдя определения слов dog и the в их словарных статьях, синтаксический анализатор может отметить, что именная группа говорит о какой-то ранее упоминавшейся собаке.
Следующее слово likes ‘любит’ оказывается глаголом. Глаголу неоткуда было взяться, кроме как из глагольной группы, VP, существование которой, к счастью, уже было предсказано, поэтому два этих элемента можно соединить друг с другом. Глагольная группа содержит больше, чем один глагол, она содержит также и именную группу (свое дополнение). Таким образом, синтаксический анализатор предсказывает, что следующее, с чем мы будем иметь дело — это именная группа:
Следующее на очереди — ice-cream ‘мороженое’ — существительное, которое может быть частью именной группы — в точности как предсказывает обособленная ветвь NP. Последние кусочки головоломки идеально укладываются на свое место:
Слово ice-cream ‘мороженое’ укомплектовало именную группу, поэтому ее нет необходимости больше держать в памяти; NP укомплектовала глагольную группу, поэтому и о ней тоже можно забыть, a VP укомплектовала предложение. Когда память освобождается от всех неукомплектованных обособленных ветвей, мы чувствуем в смзнании «щелчок», который свидетельствует о том, что мы только что услышали полностью укомплектованное грамматически правильное предложение.
Одновременно с выращиванием ветвей дерева синтаксический анализатор также выстраивал значение предложения, используя определения в ментальном словаре и принципы их сочетаемости. Глагол является вершиной своей глагольной группы, поэтому VP говорит о любви к чему-либо. NP ice-cream ‘мороженое’ в составе VP является дополнением глагола. Словарная статья для слова likes ‘любит’ говорит о том, что дополнением к этому глаголу будет нечто, вызывающее любовь; отсюда следует, что VP сообщает о любви к мороженому. NP слева от спрягаемого глагола — это подлежащее; словарная статья для likes говорит о том, что подлежащим при этом глаголе будет то, что может испытывать любовь. Совмещая семантику подлежащего с семантикой VP, синтаксический анализатор определил, что в предложении утверждается факт любви вышеупомянутого представителя семейства псовых к замороженным сладостям.
Почему же так сложно запрограммировать компьютер на выполнение такой же операции? Почему и для людей она тоже внезапно становится трудной при чтении бюрократических документов и других образцов плохого стиля? Пройдя по предложению в роли синтаксического анализатора, мы столкнулись с двумя трудностями на пути к получению результата. Первая — это память: нам нужно было удерживать в памяти неукомплектованные группы, которые требовали для комплектации определенные виды слов. Вторая — это принятие решения: когда синтаксическая группа находилась с правой стороны двух различных правил, нам нужно было принять решение, какое из них использовать, чтобы вырастить следующую ветвь дерева. В соответствии с первым правилом искусственного интеллекта о легкости сложных проблем и сложности легких выходит, что часть, относящаяся к памяти, легка для компьютеров и тяжела для людей, а часть, относящаяся к принятию решений, легка для людей (по крайней мере, если предложение было правильно построено) и тяжела для компьютеров.
Синтаксический анализатор предложения требует наличия многих видов памяти, но та, необходимость в которой очевиднее всего, — это память на неукомплектованные конструкции, запоминание того, что подвергается синтаксическому разбору. Компьютеры должны отвести для этой цели набор ячеек в своей памяти, так называемый «стеллаж»; ведь именно это и позволяет синтаксическому анализатору использовать грамматику структуры непосредственно составляющих, а не быть простым генератором цепочек слов. Люди также должны выделять некоторый объем своей оперативной памяти под неукомплектованные синтаксические группы. Но оперативная память — это и есть основное «узкое место» в процессе переработки человеком информации. Только несколько единиц — как правило — семь, плюс-минус две — могут одновременно удерживаться в сознании; и к тому же они немедленно начинают «растворяться», или их начинают вытеснять другие. На примере следующих предложений, вы можете увидеть, к чему приводит слишком долгое удерживание в памяти неукомплектованной группы: