Как работает нейронная сеть: deep dream

Как работает нейронная сеть: deep dream

Практически сразу после того, как код Deep Dream был в открытом доступе, энтузиасты добавили к нему web-интерфейс и разрешили всем желающим загружать собственные картины для обработки. Уже через несколько дней увлечение купило темперамент страшной пандемии.

Как успели узнать уже все, такие картины являются побочным продуктом работы неестественной нейронной сети, которую в Гугл применяют для классификации и анализа большого массива графических файлов, отысканных поисковиком в сети. Это не единственный пример: нейронные сети оказывают помощь вырабатывать прогнозы погоды и биржевых котировок, их применяют и Facebook, и «Яндекс».

Поиск «Яндекса» по картинам, распознавание а также перевод текста на них, возможность руководить приложениями посредством голосовых команд — все это снабжают неестественные нейронные сети. Но кроме того сами создатели таких сетей не смогут во всех подробностях растолковать, как они трудятся: как раз в этом вся их сущность. Но чтобы выяснить это, нам пригодится сделать маленький ход назад —

К мозгу

Человеческий глаз может показаться верхом совершенства. Недаром поколения креационистов приводят его как пример таковой сложной совокупности, которая якобы ни за что не имела возможности бы показаться без какого-либо изначального замысла. Но в случае если б они заметили ту неотёсанную, необработанную картину, которую в конечном итоге поставляют глаза, их ожидало бы разочарование.

По-настоящему острое цветное зрение охватывает только маленький конус с углом около пятнадцати градусов, окруженный смутными, размытыми, неразличимыми пятнами. К тому же картина оказывается перевернутой и изрядно подпорченной достаточно широким слепым пятном. Но как раз из этого неотёсанного полуфабриката появляется целый объемный, наполненный образами видимый мир, в котором мы живем.

Несёт ответственность за это превращение отечественный основной орган зрения — мозг . Глаза смогут видеть что угодно, принципиально важно то, что мы способны воссоздать и осознать из данной картины. Выделить на пейзаже пастуха и его собаку, оценить его ее размеры и возраст на фоне окружающих предметов Около решения таких непростых задач выстроены многие функции мозга а также его анатомия.

Первичная обработка оптических сигналов происходит уже в зрительном нерве, по окончании чего информация попадает в аналитические отделы «и мозг» зрительных центров. Это вовсе не строгое и последовательное перемещение, при котором ход за шагом на картине выделяются все более сложные подробности: зрительные центры мозга не имеют четкой линейной иерархии. Они образуют ошеломляюще сложную распределенную сеть, сигналы по которой распространяются параллельно многими дорогами сходу.

    Сети обучаются у великих Еще до громкого успеха Deep Dream Андрей Плахов стал автором подобного проекта. Его нейронная сеть, обучаясь на работах ветхих мастеров, находит характерные изюминки их стиля, дабы после этого переработать картину «в духе Ван Гога» либо «под Гогена».

Любой узел данной сети прямо либо косвенно воздействует на все остальные, причем их конкретные роли остаются до конца неустановленными. Неизвестно кроме того правильное количество центров, вовлеченных в обработку зрительной информации у человека, не смотря на то, что в большинстве случаев говорят о «более чем тридцати», между которыми существует обратной 200 линий связи и порядка прямой.

Очевидно, одни из них возможно назвать низшими, важными за распознавание несложных изюминок картины — скажем, форм либо перемещения. Другие, высшие зрительные центры, больше заняты поиском лиц и образов. Но это разделение достаточно условно — достаточно заявить, что информация движется между зрительными центрами не только «снизу вверх», но и «сверху вниз».

Время от времени это заставляет нас обманываться зрительными иллюзиями: мозг дополняет «низшие» элементы картины несуществующими «высшими». В следствии мы можем совсем четко заметить лицо в смесителе с парой вентилей либо обратить внимание на облако в форме вертолета. Похожая картина откроется нам и глубоко в программного «мозга» нейронной сети, распознающей изображения. По крайней мере, у нее те же самые

    Несложная альтернатива Из-за долгой очереди желающих «прогнать» собственные картины через Deep Dream ожидание может занять пара дней — время от времени бельше семи дней. Но в случае если у вас не хватает терпения, возможно воспользоваться более несложной имитацией, при которой на изображение «» графические фильтры Dream Scope, дающие весьма похожий итог.

Но — ненастоящий.

Методы мышления

В отличие от мозга, компьютер выстроен около математических операций и центрального процессора, каковые тот делает. И как мы неспособны сымитировать его свирепую скорость вычислений, так и компьютер не хорошо приспособлен для исполнения задач, в которых столь превосходно демонстрирует себя мозг. Познание живой речи, распознавание образов, обобщения — для этого уже больше полувека и разрабатывается практика и теория нейронных сетей.

Не обращая внимания на собственный наименование, нейронная сеть может пробовать, быть может и не пробовать в какой-то степени повторить структуры головного мозга. Но ее элементарная ячейка, перцептрон, показалась как раз как попытка воспроизвести обработки и процессы восприятия мозгом сенсорной информации.

Только в редких случаях такую модель воплощают в «железе», в микросхемах, каковые имитируют нейроны и связывающие их синапсы. Чаще она создается в виде компьютерных методов, благодаря которым человеческое мышление пробуют приспособить под изюминки устройства компьютеров. В собственном хорошем виде перцептрон складывается из входного и выходного слоев нейронов, между которыми находятся один либо пара «скрытых» слоев.

    Почва, видимость хорошая В Стэнфордском университете создана личная совокупность NeuralTalk: распознавая образы и предметы на изображении, она пробует обрисовать их «собственными словами». Как и Deep Dream, эта сеть часто дает забавные сбои и незнакомое ей животное — жирафа — может назвать «любопытной собакой, выглядывающей из окна».

Любой нейрон приобретает возбуждающий либо тормозящий сигнал от нейронов прошлого слоя (а первый слой — от входных «рецепторов»). Любой сигнал умножается на определенный весовой коэффициент, усиливаясь либо ослабевая. Нейрон только суммирует их, и в случае если в итоге сумма этих взвешенных сигналов превышает определенную пороговую величину, нейрон срабатывает и передает личный сигнал нейронам следующего слоя.

Такая организация в некоей степени воспроизводит нейронную структуру «микроколонки», минимальной структурно-функциональной единицы коры головного мозга. В большинстве случаев, любая микроколонка неокортекса содержит шесть слоев и около сотни нейронов.

Но неспециализированное число микроколонок в отечественном мозге исчисляется миллионами — запредельное количество для обсчета кроме того на самых современных компьютерах. Несложная неестественная нейронная сеть может состоять всего из одного перцептрона. Так как кроме того в таковой элементарной форме она способна к самосовершенствованию на протяжении того, что именуется

    Нейронная почта Готовая и обученная сеть может подвергаться процедуре «прореживания», по окончании которой в ней сохраняются только нужные для работы параметры и элементы. После этого ее код может копироваться и употребляться для ответа конкретных задач, будь то денежные прогнозы либо распознавание образов.

Машинное обучение

Никто не рождается суперменом в деле распознавания образов: как и ходьбе, этому нужно обучаться. Мозг приобретает добрый совет и зрительный сигнал от своих родителей: это поле, это пастух, а вот его собака В следующий раз — «Где тут собака?» — верный ответ будет означать награду и похвалу. Так, раз за разом, много тысяч раз видя различные предметы с различных сторон, мы совершенствуем данный ответственный навык, определим все новые образы и обучаемся их выяснять.

Так действует и нейронная сеть, неизменно производя перерасмотрение собственную работу и адаптируясь чтобы выяснять тот либо другой образ. Весовые коэффициенты, каковые определяют значимость сигналов, приобретаемых нейроном от прошлого слоя, сначала задаются случайным образом. Но по окончании того, как совокупность выдала первый — само собой разумеется, неверный — итог, она начинает их изменять и уточнять.

Обрабатывая тысячи снимков, нейронная сеть любой раз вносит трансформации в собственную работу, пока не начнет стабильно приобретать верный итог.

Очень многое тут зависит от книжки — правильнее говоря, от комплекта обучающих изображений. «В действительности в сети картин не так много, — говорит глава работы функциональности поиска «Яндекса» Андрей Плахов, — особенно в сравнении с тем большим числом, каковые мы видим в течение судьбы». Это формирует опасность, привычную разработчикам нейронных сетей: обучение может превратиться в зубрежку.

В случае если выбрана неполная либо однообразная обучающая база, совокупности будет несложнее затвердить верные ответы на все изображения, чем обучаться распознавать на них сложные подробности. Такую сеть именуют «переобученной» (а по-английски «избалованной», grandmothered): она великолепно справляется со привычными изображениями, но не позволит ничего, в случае если ей предложить новую, незнакомую картину.

Исходя из этого для обучения нейронных сетей распознаванию картин, в большинстве случаев, применяют стандартизованные базы. Самой популярной и широкой из них возможно назвать ImageNet, поддерживаемую Стэнфордским университетом. База включает больше 14 млн картин, упорядоченных в 27 категорий верхнего уровня иерархии — от «инструмент» до «гриб» и от «геологическое образование» до «овощ» — и 27?000 категорий всех уровней.

На данной библиотеке обучается большая часть аналогичных нейронных сетей, и ее случайные изюминки смогут во многом выяснить их «метод мышления».

Быть может, как раз изюминками обучающей базы разъясняется склонность Deep Dream обнаружить везде как раз животных и дальневосточные пагоды: нейронная сеть обучалась на изображениях, где их было особенно большое количество. Но, так ли это, сообщить тяжело, поскольку кроме того разработчики толком не знают

Что у нее в

Современная нейронная сеть может включать десятки, в противном случае и много слоев-перцептронов с множеством нейронов в каждом. Как и зрительные центры мозга, они организованы в сложную сеть связей — и, как в мозге, эта совокупность пластична. Сконструировав и научив нейронную сеть, разработчик остается в полном неведении о том, что именно в итоге в ней происходит, как она изменяется на протяжении обучения, на какие конкретно особенности изображений начинает обращать внимание, а какие конкретно отбрасывает.

«Биологические аналогии не должны сбивать с толку: нейронные сети — продукт программирования и математики, — говорит Андрей Плахов. — С данной точки зрения нейронную сеть возможно представить как поразительно сложную функцию с малоизвестной формулой. Запись «формулы» Deep Dream заняла бы, возможно, несколько дюжина томов. Но в целом мы знаем только эти, каковые она приобретает на входе, и итог, что выдает на выходе.

Какие конкретно как раз операции совершаются в ходе, сообщить обычно нереально».

По всей видимости, так показался и Deep Dream — из чистого любопытства к тому, как как раз трудятся нейронные сети, ведущие распознавание и классификацию изображений. Самый очевидный метод заметить результаты работы каждого слоя-перцептрона — вынудить его визуализировать эти результаты. Нам, людям, по большому счету эргономичнее мыслить картинами, исходя из этого программисты Гугл доработали нейронную сеть так, дабы различные слои, участвующие в распознавании, усиливали на изображении как раз те особенности, каковые они сами увидели и выделили.

Как и при мозга, возможно подметить, что одни слои нейронной сети берут на себя задачи ближе к «нижнему» уровню восприятия — такие как выделение границ фигур на картине, а другие трудятся с более сложными образами. Это проявляется и в изюминках «художественного стиля», в котором «творят» различные варианты Deep Dream.

Но и тут не существует четкого разделения полномочий: все слои нейронной сети взаимосвязаны, как зрительные центры отечественного мозга. Быть может, это совершает картины такими завораживающими, такими похожими на

Настоящее мастерство

Из-за чего картины, каковые формирует Deep Dream, воспринимаются как что-то близкое к мастерству? Эксперты дали на отечественный вопрос достаточно неожиданный ответ. «Это возможно связано с современной парадигмой зрения, распространившейся В первую очередь XIX века, — предполагает искусствовед Глеб Напреенко. — До того времени наблюдатель уподоблялся бестелесной точке, находящейся как бы за пределами действительности, которую он принимает, как будто бы зритель, заглядывающий в камеру-обскуру. Только примерно двести лет назад субъект взял телесность, его зрение было помещено в глаз, он стал практически соучастником замечаемой сцены».

«Данный переход видно и по той роли, которую играется взор на красивом полотне: в случае если прежде он скользил по нему, не рискуя натолкнуться на встречный интерес, то уже во французской живописи второй половины XIX столетия появляются образы, возвращающие взор зрителю, наблюдающие на него в ответ, — додаёт Глеб Напреенко. — Эта парадигма опять актуализируется в «работах» Deep Dream. Его свойство выявлять в произвольных изображениях рожицы и мордочки соответствует отечественному внутреннему рвению обнаруживать направленные на нас взоры, таящиеся в вещах».

Сети сходят с ума

Deep Dream уже успел породить «городскую легенду» о том, что обработка методом нисколько не меняет картины Иеронима Босха с их фантасмагорическими существами. Это не верно — имеете возможность проверить сами, но вправду остаются практически теми же фракталоподобные работы британского живописца Луиса Уэйна, написанные им сейчас и по окончании нескольких психозов.

В действительности, кидается в глаза необычное сходство изображений, каковые порождает Deep Dream, с некоторыми образчиками творчества психически больных либо людей, находящихся под действием «психоделических» наркотиков. Это не простое совпадение: среди множества действий, каковые оказывают эти вещества на мозг, не последнюю роль играется нарушение скоординированной работы зрительных центров.

Статья «Мастерство цифровых фантазий: из-за чего нейронным сетям снятся электроовцы» размещена в издании «Популярная механика» (№155, сентябрь 2015).

<

h4>

ЧТО ТАКОЕ НЕЙРОСЕТИ? (GOOGLE DEEP DREAMING, ИИ)

Статьи, которые будут Вам интересны: