Прямо сейчас ваш мозг совершает подвиг. Как человек научился читать и превращать слова на бумаге в миры и смыслы - Станислас Деан
Шрифт:
Интервал:
Закладка:
В главе 1 я подчеркивал, что слова напоминают иерархические деревья, где листья – это буквы, а ветви – различные комбинации букв, извлекаемые нашей зрительной системой. Такая схема совпадает с анатомическим деревом, состоящим из миллионов нейронов «буквенной кассы» и их миллиардов взаимосвязей. Каждый из них вносит свой небольшой вклад в распознавание слов, начиная от детекторов линий и заканчивая нейронами, чувствительными к биграммам и морфемам. Нигде в этой корковой иерархии слово не представлено одним-единственным нейроном. На каждом уровне множество активных клеток репрезентирует набор признаков, которые в совокупности рисуют пуантилистский[261] портрет письменного слова. Как и столетний дуб, нейронное дерево хорошо структурировано, но при этом оно гибкое и способно противостоять изменениям в естественной среде. Сдвиг слова на сетчатке подобен порыву ветра: он шевелит листья и мелкие сучки, но не затрагивает ствол и главные ветви. В результате нейронное дерево, представляющее слово, сохраняет стабильность при изменении размера, положения, формы и даже локального порядка составляющих его букв.
Нейронное дерево, представленное на рис. 3.9, с его четкой иерархической структурой, вероятно, слишком упрощено и не отражает выраженную избыточность нашей нервной системы. Ради простоты я учитывал только возбуждающие связи. На самом деле некоторые нейроны не задействуют, а, наоборот, тормозят своих соседей, подавляя их активность. Ингибиторные связи могут играть важную роль в распознавании слов – например, сигнализировать об отсутствии определенной буквы во входной цепочке. Кроме того, я исходил из идеи, что каждый нейрон образует синапсы только с клетками следующего уровня. Однако в настоящей нервной системе существуют не только восходящие, но и так называемые латеральные (горизонтальные) связи, которые соединяют нейроны в пределах одной зрительной зоны. В первичной области V1 такие связи помогают активным нейронам поддерживать друг друга, когда все они голосуют за одну зрительную интерпретацию (например, когда нервные клетки кодируют разные участки одного и того же контура). На уровне букв и биграмм латеральные связи могут кодировать вероятные отношения между последовательными буквами – например, закономерность, что за «q» почти всегда следует «u».
Наконец, мы не должны забывать, что зрительная кора содержит огромное количество «нисходящих» проекций, соединяющих конкретную область с предшествующей ей в зрительной иерархии. Эти обратные связи могут заранее отбирать определенные сочетания букв в зависимости от контекста и содействовать устранению двусмысленностей, особенно при декодировании рукописных слов. Текст, написанный от руки, часто невозможно расшифровать последовательно. Вспомните предложение «На шерраее шуршиш оеенняя лисшва». В словах «террасе» и «осенняя» буквы «с» и «е» имеют одинаковую форму. В таких случаях идентификация букв осуществляется после определения слова, а не до него. При поддержке контекста слово «осенняя», вероятно, посылает нисходящий голос в пользу букв «e» и «c»[262]. Постоянное взаимодействие нисходящих и восходящих связей обеспечивает нейронное воплощение идеи «пандемониума» Селфриджа, о котором мы говорили в главе 1. Совокупности нейронов ведут себя как собрание демонов: они посылают сообщения во всех направлениях, передавая друг другу фрагментарные данные, пока вся группа не придет к согласию.
Сколько нейронов нужно для чтения
Может показаться, что иерархическая модель, которую я только что описал, ведет к резкому увеличению числа нейронов, необходимых для чтения. Если каждая стадия в нашей зрительной системе воспроизводит все возможные нейрональные комбинации на предыдущем этапе, количество требуемых нейронов должно выходить за все разумные пределы. К счастью, это не обязательно так.
Простые решения комбинаторной задачи, которую ставит моя модель, действительно существуют. С одной стороны, на каждом этапе обработки нейроны должны извлекать только те комбинации букв, которые встречаются часто и важны для чтения – то есть небольшое подмножество всех возможных сочетаний букв. На уровне биграмм, например, должны существовать специальные детекторы для пары EN, которая типична для английского языка, но едва ли зрительная система станет выделять нейроны для пар, которые никогда не встречаются, например QR или JB. Недавно фМРТ подтвердила эту гипотезу: чем выше употребляемость биграммы, тем сильнее активация «буквенной кассы»[263]. Это объясняет, почему эта область интенсивнее реагирует на слова и правдоподобные псевдослова, такие как «enchible», чем на случайные цепочки согласных, например «zhgsieq»[264].
С другой стороны, чем выше уровень, тем сложнее комбинации зрительных признаков, на которые реагируют нейроны. Их инвариантность возрастает, а потому они могут игнорировать другие различия, несущественные для чтения. Расхождение между прописными и строчными буквами, например, перестает иметь значение уже на ранних этапах зрительной обработки (предположительно в области V8 и далее). Аналогичным образом, для биграммных нейронов большее число возможных пар букв компенсируется уменьшением количества кодируемых позиций, поскольку рецептивные поля нейронов увеличиваются на каждой стадии.
Также мы должны иметь в виду, что в процессе чтения релевантные слова всегда попадают в узкую область зрительного поля, расположенную близко к центральной ямке и в основном справа от нее. Когда мы учимся читать, только те нейроны, которые кодируют эти локации, получают возможность преобразоваться в детекторы букв и биграмм. И действительно, только те слова, которые представлены в центре взгляда (или немного справа от него) и расположены под углом, близким к горизонтальному, эффективно обрабатываются вентральным затылочно-височным путем[265]. Таким образом, число задействованных нейронов относительно невелико.
Можем ли мы приблизительно прикинуть площадь коры, необходимую для зрительного распознавания слов? Если учесть, что в латинском алфавите насчитывается 26 букв, каждая из которых может появиться в одном из 20 сегментов сетчатки, то для первоначального банка детекторов букв требуется примерно 500 колонок нейронов. При 10 колонках на квадратный миллиметр эта стадия обработки должна занимать не больше половины квадратного сантиметра коры. Рассмотрим следующий уровень. Если предположить, что биграммные нейроны кодируют только три приблизительных локации (начало, середину и конец слова) и что 200 наиболее