Паника алгоритма в китайской комнате
Тема гуглопереводчика, актуальный алгоритм которого начал весьма интересно переводить бессмысленные языковые текстуры, уже была затронута многими, а мы суммируем это для тех, кто не успел застать ни самого развлечения со смыслостроительством, ни его обсуждений.
Есть три разных проявления особенностей нового алгоритма от Google Translate, которые всячески вызывали внимание любопытствующей общественность в минувшие месяцы. Первое такое проявление выражается в том, что если вводить несколько одинаковых иероглифов на японском или китайском, добавляя одни и те же символы с каждой новой строкой, Google Translate будет выдавать осмысленные фразы и выражения, а иногда даже будет рифмовать строки.
Второе проявление связано с переводом с сомалийского – если, скажем, загонять в перевод с сомалийского на русский последовательность слов «ooga booga nigga», то можно тоже добиться весьма странных результатов. Более того, можно заполнять форму перевода с сомалийского и вовсе текстом на русском языке – правда, для этого его надо обессмыслить многократными повторениями букв или слоговых паттернов: тогда алгоритм будет пытаться перевести это все в осмысленную речь.
Третье проявление и вовсе было пугающим – если в форму перевода с монгольского забивать кириллицей серии одинаковых гласных или согласных, алгоритм будет выдавать совершенно криповые результаты.
Наиболее рациональное объяснение связало суть третьего проявления особенностей переводческого алгоритма Google Translate с первым: алгоритм переводит монгольский язык на любой иной с использованием третьего, промежуточного языка – которым, скорее всего, является китайский. По данной версии однообразные повторения кириллических монгольских букв алгоритм конвертировал в китайские иероглифы и переводил уже по принципу «иероглифической поэзии», создавая контекст через получающиеся паттерны. Это объяснило, например, почему буквы связанны с отдельными темами (если забивать в форму ввода паттерны из буквы «д», то в выводе будут фразы, связанные с детьми – видимо, тот иероглиф, которым передается монгольская кириллическая «д», как-то связан с детьми).
Однако самой изящной версией, которая нам больше всего нравится, является версия паникующей китайской комнаты – ведь алгоритм Google Translate это и есть китайская комната. Согласнос данной версии, алгоритм получает запросы с символьными представлениями, соответствий которых у него нет (бессмысленные строки с гласными), но он начинает генерировать соответствия самостоятельно, подобно тому, как человек видит лица везде, где есть три точки, которые можно опознать как глаза и рот (парейдолия); или же слышит в белом шуме человеческую речь; или же иным способом генерирует смысл из паттернов, которые изначально не содержат смысла (апофения). Такое поведение алгоритма уже чем-то напоминает попытки самосознания, хотя мы до сих пор не можем быть уверены, что сами не являемся ходячими китайскими комнатами, неспособными вникать в смысл.
Версия про паникующую китайскую комнату, допускающую возможность самосоознания того, что обитает в ней, но не понимает происходящего, довольно пугающа – и поэтому весьма интересна. Хорошо, что все оказалось намного проще и обыденней, правда ведь?
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: