Проблема обучения, в частности в ее приложении к машинам, способным обучаться играм, может показаться несколько далекой от религии. Тем не менее существует теологическая проблема, к которой вышеприведенные рассуждения имеют отношение. Это проблема игры между Творцом и его творением. Это тема книги Иова и «Потерянного рая».
В обоих этих сочинениях Дьявол ведет игру с Богом, причем ставкой является душа Иова или вообще души людей. Но, согласно ортодоксальным иудейским и христианским воззрениям, Дьявол – одно из творений Бога. Любое другое предположение привело бы к моральному дуализму с привкусом зороастризма и того отпрыска зороастризма и христианства, которое называется манихейством.
Но если Дьявол – одно из творений Бога, то игра, составляющая содержание книги Иова и «Потерянного рая», представляет собой игру между Богом и одним из его творений. Подобная игра с первого взгляда представляется чрезвычайно неравноправным состязанием. Вести игру против всемогущего, всезнающего Бога – занятие глупое, а между тем известно, что Дьявол – тонкий мастер козней. Любое восстание ангелов обречено на поражение. Чтобы доказать это, нет нужды в мятеже Сатаны, изображенном в «Манфреде». Да и Всемогущество, которое для своего самоутверждения мечет с небес молнии, вовсе не Всемогущество, а лишь очень большая сила, и восстание ангелов могло бы закончиться восхождением Сатаны на небесный трон и ниспровержением и вечным проклятием Бога.
Таким образом, если мы не запутаемся в догмах Всемогущества и Всезнания, конфликт между Богом и Дьяволом предстанет перед нами как реальный конфликт, а Бог – как нечто меньшее, чем абсолютное Всемогущество. Бог действительно вовлечен в конфликт со своим творением, причем он легко может проиграть. И, однако, это его творение создано им по его собственной воле и, по-видимому, приобрело всю свою способность действия от самого Бога. Может ли Бог вести серьезную игру со своим собственным творением? Может ли любой творец, даже ограниченный в своих возможностях, вести серьезную игру со своим собственным творением?
Изобретатель, конструируя машины, с которыми он может вести игру, присвоил себе в определенных пределах функции творца, какова бы ни была природа создаваемых им игровых устройств. Это в особенности верно в отношении играющих автоматов, которые обучаются на своем опыте. Как я уже упоминал, такие машины существуют. Как же они функционируют? Какого они достигли успеха?
Оказывается, что их действия в значительно большей степени напоминают манеру обычного игрока, чем стратегию, соответствующую теории фон Неймана. На каждой стадии игры выбор очередного хода подчинен установленным правилам, а из ряда возможных очередных ходов должен быть выбран один – согласно некоторому нормативному критерию хорошей игры.
Опыт игры, накопленный человеком, представляет нам разнообразные способы выбора такого критерия. В шахматах (или шашках) обычно невыгодно терять свои фигуры (шашки) и, напротив, обычно выгодно брать фигуры (шашки) противника. Игрок, который сохраняет подвижность своих фигур и право выбора ходов и в то же время держит под боем большое число полей на доске, обычно играет лучше своего противника, не придающего значения этим элементам игры.
Эти критерии хорошей игры сохраняют свою силу на протяжении всей партии, но есть и другие критерии, которые относятся к отдельным ее стадиям. В эндшпиле, когда на доске остается мало фигур, сближение с противником и взятие его фигур все более затрудняется. В дебютной стадии игры – и это более важный фактор в шахматах, чем в шашках, – фигуры расставлены так, что они лишены своей полной подвижности и силы. Вследствие этого требуется развитие фигур, позволяющее расширить их поле действия, необходимое как для нападения, так и для защиты. Далее, в шахматах, с их большим разнообразием фигур по сравнению с шашками, есть множество специальных критериев хорошей игры, важность которых доказана многовековым опытом.
Сочетая такие критерии (аддитивно или более сложным способом), можно для оценки очередного хода игрового автомата получить некоторый числовой показатель эффективности. Это может быть сделано до известной степени произвольно. Тогда машина, сравнив между собой показатели эффективности возможных очередных ходов, выберет ход, соответствующий наибольшему показателю. Это один из методов автоматизации выбора очередного хода.
Такая автоматизация выбора очередного хода в большинстве случаев не обязательно обеспечивает оптимальный выбор, но все же это какой-то выбор, и на его основе машина может продолжать игру. Для оценки такого способа механизации игры следует отрешиться от всех представлений о механизируемом объекте, используемом в известных нам технических устройствах, или от физического образа человека, соответствующего обычному игроку. К счастью, выполнить это нетрудно, так как именно это и делают шахматисты, играющие друг с другом по переписке.
При игре по переписке партнеры посылают свои ходы друг другу по почте, так что единственной связью между игроками служит письменный документ. Даже при таком способе игры опытный игрок вскоре вырабатывает определенные представления о личности своего противника, вернее, о его шахматной индивидуальности. Он узнает, тороплив или осторожен его противник, легко ли его провести, проницателен ли он и способен ли усвоить трюки своего противника или может быть снова и снова «пойман» при помощи той же самой элементарной стратегии. Все это узнается, я повторяю, не из какой-либо дополнительной информации, а в ходе самой игры.
С этой точки зрения любой игрок – будь то человек или машина, – пользующийся простым набором качественных признаков, избранных раз и навсегда, создает впечатление «жесткой» шахматной индивидуальности. Если вам удалось найти у такого игрока слабое место, то вы нашли это слабое место навсегда. Если вы разработали против него стратегию, она всегда окажется эффективной. Для выявления его техники достаточно сыграть с ним очень небольшое количество партий.
Все это относится к механическому игроку, который не обучается в ходе игры. Однако ничто не мешает ему научиться играть более разумно. С этой целью он должен сохранять в своей памяти записи прошлых игр. Затем в конце каждой игры или каждой серии игр определенного типа его механизм должен перестраиваться на совершенно иной образ действий.
При формировании показателя эффективности (оценочной функции) в него вводятся некоторые константы, которые можно выбирать различным образом. Так, например, соотношение констант, соответствующих относительной силе фигур, их подвижности и эквивалентному числу, может составлять 10:3:2 вместо 9:4:4. Новый способ применения регулируемой машины состоит в изучении проведенных игр, с тем чтобы, учитывая их исход, найти соответствующие им показатели эффективности (оценочные функции), отражающие динамику этих игр.
Таким образом, оценочная функция подвергается непрерывной переоценке, при которой более высокое значение этой функции присваивается позициям, характерным для выигранных партий, и меньшее значение – позициям, свойственным большей частью проигранным партиям. Игра должна продолжаться уже с новым значением оценочной функции, которая может быть определена различными способами, отличающимися лишь в деталях. В результате этого игровой автомат будет непрерывно преобразовываться в некую отличную от исходной машину в соответствии с историей развертывающейся игры. В этом случае как для машины, так и для ее противника – человека будут иметь значение их прошлые опыт и успех.
При игре с такой машиной, которая часть своей игровой индивидуальности перенимает от своего противника, эта игровая индивидуальность не остается абсолютно неизменной. Противник может вдруг обнаружить, что стратегии, которые в прошлом приводили к успеху, оказываются несостоятельными. Машина может вырабатывать, таким образом, своеобразную бесхитростную хитрость.
Можно сказать, что весь этот неожиданно возникший машинный интеллект был сообщен машине ее конструктором и программистом. В некотором смысле это верно, но не всегда справедливо утверждение, что все новые приемы машины ее конструктор предвидел до малейших деталей. Если бы это было так, то ему было бы не трудно нанести поражение собственному творению. Однако это не соответствует действительной истории машины д-ра Сэмюэля.