Банк идей

-> -> Компьютер, имитирующий человеческий мозг, выиграл у профессионала в игре "Го"


08.02.2016

Компьютер, имитирующий человеческий мозг, выиграл у профессионала в игре "Го"

Компьютер, имитирующий человеческий мозг, выиграл у профессионала в игре "Го"

Через восемнадцать лет после победы компьютера над чемпионом мира Гарри Каспаровым в шахматы, машина победила профессионального игрока в древневосточную настольную игры "Го". Прогресс огромен, говорят разработчики искусственного интеллекта, т.к. "Го" очень требовательная к вычислениям игра, про которую еще десять лет назад некоторые исследователи говорили, что компьютеру никогда не победить в нее человека-эксперта. Более того, машина выиграла не благодаря вычислительной мощности, а используя инструменты "машинного обучения", которые позволяют ей учить себя и думать как люди.

"Го" выглядит по-детски просто. Доска состоит из квадратов 19-на-19. Один игрок имеет запас черных камней, другой запас белых, и они по-очереди размещают свои камни на доске, черные начинают первыми. Игрок старается окружить «цель» из одного или более камней противника так, чтобы не осталось открытой клетки, в то время как противник делает то же самое. Окруженные камни удаляются с доски и, грубо говоря, выигрывает тот, кто окружит больше камней.

Тем не менее, "Го" с трудом поддается компьютерному анализу по 2-м причинам. Во-первых, доска настолько большая, что кол-во возможных ходов астрономическое. В начале игры каждый игрок имеет примерно 360 вариантов размещения каждого камня. Таким образом, после пяти ходов, доска может быть в любой из более чем 5 триллионов различных расстановок. В общей сложности, число различных возможных расстановок камней выходит за пределы 10100, что делает невозможным для компьютера игру с помощью прямого вычисления всех возможных комбинаций.

Во-вторых, для любого конкретного расположения камней на доске трудно оценить, черные или белые имеют преимущество. В шахматах, например, игроки или компьютеры могут примерно оценить, насколько сильны их позиции на доске просто сравнивая части, которые они захватили с теми, которые потеряли, говорит Коулом. Но вести такой учет "на лету" намного сложнее в "Го", говорит он, так как большая часть подсчета делается в конце игры.

Предыдущие программы были нацелены не столько на оценку состояния доски, сколько на скоростное моделирование, как игра может закончиться. "Crazy stone" использует алгоритм, называемый "дерево поиска Монте-Карло", который, вместо того чтобы рассчитать все возможные последовательности игры, образует только некоторые из них с помощью генератора случайных чисел на каждом шаге, выбирая между различными ходами. Он использует небольшое количество адаптивного программирования, или машинного обучения, чтобы узнать, как избежать бесполезных шагов. Crazy stone выигрывал у сильных игроков людей, говорит Бруно Bouzy, программист в Парижском Университете Декарт, но только тогда, когда позволялось выгодно размещать первые три или четыре камня на безальтернативной основе.

Теперь, однако, Дэвид Сильвер, Демис Хассабис, и 18 других компьютерных ученых Google DeepMind, разработали программу, которая противостоит непосредственно прямым вызовам "Го". Вместо того, чтобы случайно генерировать последовательности ходов, программа AlphaGo учится различать хорошие ходы и плохие, и оценивать силу своей позиции на доске. Чтобы сделать подобное, программа опирается на "глубокие нейронные сети" - компьютерную программу, которая имитирует соединения нейронов в головном мозге и обладает способностью к обучению.

Такие сети состоят из слоев абстрактных взаимосвязанных "нейронов". Один нейрон может помогать или препятствовать другим, и происходит обучение, так как система регулирует связи между нейронами. Например, AlphaGo использует "сети политики", чтобы судить о жизнеспособности возможных ходов. Нижний слой сети состоит из массива нейронов 19-на-19, который в основном делает снимок состояния доски и использует его в качестве входа. Верхний слой состоит из массива, который показывает все возможные места для укладки следующего камня и вероятности принятия каждого из этих ходов. А между ними лежат еще 11 слоев.

Цель состоит в том, чтобы автоматически получить сеть с лучшим следующим ходом при любой начальной конфигурации. Чтобы обучить сеть, исследователи наполняли его базу данных 30 млн конфигураций доски и последующими играми опытных игроков. Чтобы все входные данные соответствовали всем выходным, компьютер сравнивал связи в промежуточной сети, которые затем кодировали в данные. Затем они позволяли программе дополнительно обучать себя, играя против себя снова и снова. Таким образом, AlphaGo получала опыт перехода от худшего хода к лучшему. "То, как ведет себя система, больше похоже на поведение человека" говорит Хассабис.

AlphaGo легко победила Crazy Stone и другие Go-игры, выиграв 99,8% игр, когда работала на одном можщном компьютере и 100% игр, когда работала на нескольких компьютерах. Она обошла Фан Хуэй, профессионального игрока и чемпиона Европы по "Го" 2013 года, победив в трех из пяти игр. AlphaGo получила ​​шанс сыграть среди высокоранговых профессионалов в марте, говорит Сильвер, когда он сразится с Ли Седоль, 32-летним южнокорейским Go-чемпионом самого высокого ранга, на матче в Сеуле.

Коулом отмечает, что это не главное назначение нового изобретения. "Это больше похоже на большое инженерное достижение", говорит он. "Сложив все кусочки вместе, оно действительно становится инновационным."

Глубокие нейронные сети и глубокое изучение уже находят применение в таких областях, как распознавание образов, автоматизированный перевод, медицинская диагностика и т.д. Таким образом, концепция AlphaGo может уже использоваться в нашей жизни.

Даже если AlphaGo выиграет у Седола, этот триумф не будет выглядеть, как поражение Каспарова в шахматы, прогнозируют ученые-компьютерщики. Люди просто привыкли к мысли, что в играх в конечном счете компьютеры преобладают. Но компьютеры еще не выигрывают их все, отмечает Боузи. Как ни странно, люди по-прежнему могут иметь большое преимущество в видеоиграх. "Они, как правило, очень сложны", говорит он, "с большим количеством символов, большим количеством действий, большим количеством локаций." В настоящее время, мозг 13-летнего человека может справляться со всем лучше, чем компьютер.

Оставить комментарии

Имя:E-mail (не публикуется):

аватар

Я не робот



Еще Новости

01.08.2017 - Кухонная губка содержит 2 млн микробов
Согласно новому исследованию, кухонная губка в вашей раковине содержит в себе миллионы микробов, включая близких родственников бактерий, вызывающих пневмонию и менингит. Один из микробов, Moraxella osloensis, может вызвать инфекции у людей со слабой иммунной системой и также известен тем, что обладает запахом белья, объясняя неприятный запах вашей губки. Исследователи сделали открытие путем извлечения микробной ДНК из 14 использованных кухонных губок.

14.07.2017 - Робот-строитель построит дом за 2 дня
Мир стал на один шаг ближе к роботу-строителю, который может построить каменный каркас дома менее чем за три дня. Caterpillar инвестировала 2 миллиона долларов в Fastbrick Robotics, австралийскую компанию ботов строителей. Названный Hadrian X, "быстро-укладывающий каменщик" построен на стреле длиной 30 м, прикрепленной к грузовику. В систему вводится 3D CAD модель дома и, в соответствии с этими инструкциями, робот способен обрезать и разместить до 1000 кирпичей в час с учетом дверей, окон, элементов и каналов для электропроводки и сантехники.

06.07.2017 - Мобильный телефон без батарейки
Прототип сотового телефона без батарейки является кульминацией многолетних поисков Вамси Таллы, научного сотрудника лаборатории Джошуа Смита, который изучает компьютерную науку и электротехнику в Университете Вашингтона. "Если вам нужно выбрать одно устройство без батарейки, что бы вы выбрали?", - спрашивает Смит. "Сотовый телефон - один из самых полезных объектов. Теперь представьте, закончилась ваша батарея, а вы все равно можете отправлять тексты и звонить."

29.06.2017 - Алгоритм Оригами поможет профессионально собирать бумажные фигуры
Если вы когда-либо пытались собрать бабочку оригами и беспомощно наблюдали, как ваши руки измяли ее в болезненного птеродактиля, вы знаете, что складывать фигуры из бумаги очень сложно. Решить эту задачу вам может помочь новый алгоритм. Как только вы создали многогранный рисунок на своем компьютере, например, кролика, «Origamizer» отобразит карту плоских граней-треугольников и других угольников на листе бумаги. Затем он определит, как избавиться от лишних частей бумаги, чтобы грани собрались вместе правильно.

23.06.2017 - Шанхай получил футуристический магазин на колесах
Небольшой шведский стартап под названием "Wheelys" пытается состязаться с Amazon в создании магазинов без кассиров, с автоматическим контролем. Но после выхода первого тестового магазина в Шанхае в начале этого года, компания переходит к совершенно новой идее: автономный магазин, который постоянно катается по улицам и называется Moby Mart.

05.06.2017 - 7 признаков высокого интеллекта
1. Эмоциональная нестабильность
Нарушения настроения могут быть ценой, которую некоторые люди платят за высокий уровень интеллекта, показали недавние исследования. Психологи обнаружили, что более высокий IQ связан с особенностями биполярного расстройства в детстве. Повышенный интеллект Homo Sapiens был первоначально результатом мутаций генов. Однако цена этих мутаций - увеличение психических заболеваний

30.05.2017 - Бессонные ночи из-за глобального потепления
К 2050 году бессонных ночей может быть почти вдвое больше, чем сейчас. Это заключение крупнейшего исследования по проблемам сна и температуры, которое показывает, что изменение климата может сделать беспокойные ночи более частыми. Предыдущие исследования показали, что более высокая температура тела связана с беспокойным сном, и что ночные температуры нагреваются быстрее, чем дневные.

17.05.2017 - Рабочая голограмма Cortana претворяет фантазию в жизнь
Преимущество персонального ассистента с искусственным интеллектом у вымышленного персонажа состоит в том, что у вас есть его готовое визуальное представление. Когда указанный вымышленный персонаж принимает форму голограммы, он так и просит получить облик в реальном мире. В этом смысле удивительно, что в Cortana от Microsoft так мало возможностей для полнофункциональной голограммы, которая, конечно же, может рассказать вам и о погоде.

27.04.2017 - Пятиместное летающее такси
Мы все еще ждем летающих машин, но, может быть, летающие такси появятся первыми. Поднявшись с аэродрома в Германии, Lilium Aviation Jet вертикального взлета и посадки, на электрической тяге, завершил свой первый полет. Контролируемый с земли, беспилотный двухместный автомобиль подвергся серии испытаний, включая зависание в воздухе и горизонтальный полет. Компания нацелена на пилотируемый полет в 2019 году и ставит своей целью создание пятиместного воздушного такси.

21.04.2017 - Создан универсальный отпечаток пальца
Считыватели отпечатков пальцев, такие как TouchID на iPhone, существуют, чтобы сделать ваше устройство более безопасным, сохраняя легким процесс его разблокировки. Ученые из Университета Нью-Йорка и штата Мичиган нашли "дыру" в этой системе безопасности. Подобно мастер-ключу, который может открыть любую блокировку, разработчики создали цифровые «отпечатки», которые могут эмулировать различные частичные отпечатки пальцев, достаточные для гипотетического взлома устройства.

Страницы: [ 1 ][ 2 ][ 3 ][ 4 ][ 5 ][ 6