Жрица, Постум, и общается с богами
Thursday, 25 April, 23:04,
asena.livejournal.com
С телеком очень смешно получилось. Все началось с канала Дождь, который имеет привычку каждый день звать кого-нибудь из вчерашних авторов Слона. Меня туда звали несколько раз, но мне же все время некогда, и поэтому после статей про ГМО я не ходила - а пошла в итоге после статьи про память. А надо сказать, что все телевизионщики внимательно отслеживают, кто ходит к конкурентам в соответствующей тематической нише, и запоминают - ага, вот этого человека можно звать на такую-то тему. Вот так и вышло, что я у нас теперь совершенно случайно считаюсь девочкой, которую надо звать на мозг и память, и после сегодняшней программы этот эффект только усугубится - хотя это никогда не была моя самая любимая тема в биологии. Впрочем, чем больше я думаю о мозге, тем больше он мне нравится.
А потом у меня было полурабочее-полусветское (извините за невольный каламбур) общение с macroevolution, тоже про мозг, и он рассказывал ужасно интересные штуки о том, как закрепляется ритуальное поведение - это можно свести к системе буквально из десятка нейронов. И в процессе выкристаллизовалась такая мысль - я не пишу, что она принадлежит Александру, потому что я ее сейчас существенно упрощаю - что, вообще говоря, как ни странно, похоже, что нейронные сети гораздо больше настроены на обучение за счет положительных стимулов, чем за счет отрицательных. Это совершенно не очевидная вещь, но чем больше о ней задумываешься, тем красивее она кажется. Это так, если смотреть на уровне всего мозга, где для положительных стимулов целая огромная мезолимбическая система, пронизывающая его весь, а для отрицательных стимулов почти что совсем не выделено специальных отдельных центров (в основном горе реализуется по принципу "стало меньше счастья" - то есть дофамина - в той же мезолимбической системе). Это остается так, и если смотреть на уровне системы обучения из десятка нейронов.
Здесь смысл вот в чем: если в ответ на какое-то действие пришло отрицательное подкрепление, то мозг, возможно, запомнит, что больше так делать не надо. Но это ни о чем. У него останется стопятьсот других вариантов неправильного поведения. Это не обучение, а фиг знает что. Да, получив отрицательное подкрепление, вы, возможно, больше не сделаете конкретно эту ошибку - но вы еще совершите множество других. А вот если в ответ на какое-то действие пришло положительное подкрепление - то мозг сразу же запомнит, что вот оно, что вот именно так-то и надо делать. То есть с первого раза произошло настоящее полноценное обучение, четкая связь между стимулом и реакцией.
По-моему это ужасно красивая мысль. Буду ее дальше думать.
Комментарии (0)