Главная -> Новости -> Компьютер, имитирующий человеческий мозг, выиграл у профессионала в игре "Го"

08.02.2016

Компьютер, имитирующий человеческий мозг, выиграл у профессионала в игре "Го"

Через восемнадцать лет после победы компьютера над чемпионом мира Гарри Каспаровым в шахматы, машина победила профессионального игрока в древневосточную настольную игры "Го". Прогресс огромен, говорят разработчики искусственного интеллекта, т.к. "Го" очень требовательная к вычислениям игра, про которую еще десять лет назад некоторые исследователи говорили, что компьютеру никогда не победить в нее человека-эксперта. Более того, машина выиграла не благодаря вычислительной мощности, а используя инструменты "машинного обучения", которые позволяют ей учить себя и думать как люди.

"Го" выглядит по-детски просто. Доска состоит из квадратов 19-на-19. Один игрок имеет запас черных камней, другой запас белых, и они по-очереди размещают свои камни на доске, черные начинают первыми. Игрок старается окружить «цель» из одного или более камней противника так, чтобы не осталось открытой клетки, в то время как противник делает то же самое. Окруженные камни удаляются с доски и, грубо говоря, выигрывает тот, кто окружит больше камней.

Тем не менее, "Го" с трудом поддается компьютерному анализу по 2-м причинам. Во-первых, доска настолько большая, что кол-во возможных ходов астрономическое. В начале игры каждый игрок имеет примерно 360 вариантов размещения каждого камня. Таким образом, после пяти ходов, доска может быть в любой из более чем 5 триллионов различных расстановок. В общей сложности, число различных возможных расстановок камней выходит за пределы 10¹⁰⁰, что делает невозможным для компьютера игру с помощью прямого вычисления всех возможных комбинаций.

Во-вторых, для любого конкретного расположения камней на доске трудно оценить, черные или белые имеют преимущество. В шахматах, например, игроки или компьютеры могут примерно оценить, насколько сильны их позиции на доске просто сравнивая части, которые они захватили с теми, которые потеряли, говорит Коулом. Но вести такой учет "на лету" намного сложнее в "Го", говорит он, так как большая часть подсчета делается в конце игры.

Предыдущие программы были нацелены не столько на оценку состояния доски, сколько на скоростное моделирование, как игра может закончиться. "Crazy stone" использует алгоритм, называемый "дерево поиска Монте-Карло", который, вместо того чтобы рассчитать все возможные последовательности игры, образует только некоторые из них с помощью генератора случайных чисел на каждом шаге, выбирая между различными ходами. Он использует небольшое количество адаптивного программирования, или машинного обучения, чтобы узнать, как избежать бесполезных шагов. Crazy stone выигрывал у сильных игроков людей, говорит Бруно Bouzy, программист в Парижском Университете Декарт, но только тогда, когда позволялось выгодно размещать первые три или четыре камня на безальтернативной основе.

Теперь, однако, Дэвид Сильвер, Демис Хассабис, и 18 других компьютерных ученых Google DeepMind, разработали программу, которая противостоит непосредственно прямым вызовам "Го". Вместо того, чтобы случайно генерировать последовательности ходов, программа AlphaGo учится различать хорошие ходы и плохие, и оценивать силу своей позиции на доске. Чтобы сделать подобное, программа опирается на "глубокие нейронные сети" - компьютерную программу, которая имитирует соединения нейронов в головном мозге и обладает способностью к обучению.

Такие сети состоят из слоев абстрактных взаимосвязанных "нейронов". Один нейрон может помогать или препятствовать другим, и происходит обучение, так как система регулирует связи между нейронами. Например, AlphaGo использует "сети политики", чтобы судить о жизнеспособности возможных ходов. Нижний слой сети состоит из массива нейронов 19-на-19, который в основном делает снимок состояния доски и использует его в качестве входа. Верхний слой состоит из массива, который показывает все возможные места для укладки следующего камня и вероятности принятия каждого из этих ходов. А между ними лежат еще 11 слоев.

Цель состоит в том, чтобы автоматически получить сеть с лучшим следующим ходом при любой начальной конфигурации. Чтобы обучить сеть, исследователи наполняли его базу данных 30 млн конфигураций доски и последующими играми опытных игроков. Чтобы все входные данные соответствовали всем выходным, компьютер сравнивал связи в промежуточной сети, которые затем кодировали в данные. Затем они позволяли программе дополнительно обучать себя, играя против себя снова и снова. Таким образом, AlphaGo получала опыт перехода от худшего хода к лучшему. "То, как ведет себя система, больше похоже на поведение человека" говорит Хассабис.

AlphaGo легко победила Crazy Stone и другие Go-игры, выиграв 99,8% игр, когда работала на одном можщном компьютере и 100% игр, когда работала на нескольких компьютерах. Она обошла Фан Хуэй, профессионального игрока и чемпиона Европы по "Го" 2013 года, победив в трех из пяти игр. AlphaGo получила шанс сыграть среди высокоранговых профессионалов в марте, говорит Сильвер, когда он сразится с Ли Седоль, 32-летним южнокорейским Go-чемпионом самого высокого ранга, на матче в Сеуле.

Коулом отмечает, что это не главное назначение нового изобретения. "Это больше похоже на большое инженерное достижение", говорит он. "Сложив все кусочки вместе, оно действительно становится инновационным."

Глубокие нейронные сети и глубокое изучение уже находят применение в таких областях, как распознавание образов, автоматизированный перевод, медицинская диагностика и т.д. Таким образом, концепция AlphaGo может уже использоваться в нашей жизни.

Даже если AlphaGo выиграет у Седола, этот триумф не будет выглядеть, как поражение Каспарова в шахматы, прогнозируют ученые-компьютерщики. Люди просто привыкли к мысли, что в играх в конечном счете компьютеры преобладают. Но компьютеры еще не выигрывают их все, отмечает Боузи. Как ни странно, люди по-прежнему могут иметь большое преимущество в видеоиграх. "Они, как правило, очень сложны", говорит он, "с большим количеством символов, большим количеством действий, большим количеством локаций." В настоящее время, мозг 13-летнего человека может справляться со всем лучше, чем компьютер.

Оставить комментарии

Еще Новости

27.12.2017 - Создан самый продвинутый робот-гуманоид
Команда исследователей из Токийского университета создала, кажется, самого передового гуманоидного робота, - на самом деле двоих, - один из которых называется Кенширо, другой Кенгоро. В своей статье, опубликованной в журнале Science Robotics, команда описывает работу над созданием роботов, максимально приближенных к людям, и демонстрирует, что могут сделать их две последние модели.

08.12.2017 - 3D-печать "живыми чернилами" позволит создать биозаводы
Исследователи из Швейцарского Федерального Технологического Института в Цюрихе (ETH Zurich) разработали чернила с использованием двух бактерий в качестве активного компонента: Pseudomonas putida, которая может разрушить очень часто используемый, но токсичный химический фенол; и Acetobacter xylinum, которая выделяет чрезвычайно чистую наноцеллюлозу, перспективный материал для перевязывания ожогов, поскольку он обладает обезболивающими и увлажняющими свойствами.

04.12.2017 - Создан материал с разной температурой на сторонах
Поддерживать правильную температуру теперь можно легко, так как ученые создали двусторонний материал, который может либо охладить вас, либо помочь согреться. Одежда имеет много возможностей для регулировки тепла. Это не только удобно, но и хорошо для окружающей среды. Если вы можете эффективно нагреть свое тело, вам не нужно будет тратить много энергии, чтобы нагреть или остудить комнату. Ученые из Стэнфордского университета создали материал, который контролирует, сколько тепла теряется в зависимости от того, как вы его надели.

17.11.2017 - Робот Atlas делает сальто назад
Мы уже видели робота Atlas от Boston Dynamics, и он был очень интересным, но теперь у бота есть несколько новых панелей и, по-видимому, какое-то новое оборудование и/или программное обеспечение, потому что мы никогда не видели, чтобы он так двигался. Робот, - ростом под 2 метра и весом почти в 80 кг, - всего несколько месяцев назад был объектом насмешек. Теперь «самый динамичный гуманоид в мире» вернулся.

03.11.2017 - Нейронные сети способны создавать портреты несуществующих людей
В 2015 году Google выпустила программу DeepDream, основанную на нейронных сетях и генерирующую различные коллажи, шокировавшие пользователей. DeepDream, возможно, была прелюдией к более эстетичному и гораздо более значительному приложению, например, созданию фотореалистичных изображений людей, которые никогда не существовали.

27.10.2017 - Открыт первый в мире мост, напечатанный на 3D-принтере
Голландские чиновники открыли первый в мире бетонный мост, напечатанный на 3D-принтере, который в первую очередь предназначен для использования велосипедистами. «Мост не очень большой, но он был сделан принтером, что делает его уникальным», - сказал Тео Сале из Технологического университета Эйндховена. Работа над печатью моста, который имеет около 800 слоев, заняла около трех месяцев после начала работы, и он изготовлен из усиленного бетона.

10.10.2017 - Google AlphaGo умнее, чем Siri, Bing и Baidu
Трое исследователей из Китая разработали систему для измерения интеллекта систем ИИ. Они также создали классификационную схему, предназначенную для ранжирования различных систем. Feng Liu, Yong Shi и Ying Liu сообщают в своей статье, что система AlphaGo от Google в настоящее время оценивается выше всех тестируемых. Ученые и граждане выражают страх в отношении систем искуственного интеллекта, некоторые из них предполагают, что он может привести к уничтожению людей, как это показано в научно-фантастических фильмах.

04.10.2017 - The Float - победитель конкурса дизайна автомобиля будущего.
Всегда здорово видеть, что думают дизайнеры об автомобилях будущего. Недавно Renault провела конкурс на проектирование автомобиля будущего на DesignJunction 2017. В этом году акцент дизайна автомобиля был сделан на электроэнергию, автономное вождение и технологии соединения. Участниками конкурса были студенты MA Industrial Design, а судьями Энтони Лоу и Ник Родос из команды дизайнеров Renault.

29.09.2017 - Ford использует HoloLens для создания новых автомобилей
Традиционные методы проектирования транспортных средств производятся с использованием глиняных моделей, но использование такого метода дорогостоящее и трудоемкое. Дизайнеры Ford планируют объединить новое со старым, используя 3D-голограммы в сочетании с глиняными моделями. Сделав этот шаг, дизайнеры получают более творческую гибкость, поскольку каждая часть не будет физически прототипирована в глину.

25.09.2017 - Камеры видеонаблюдения оказались уязвимы
Исследователи Израильского Университета им. Бен-Гуриона из Негева продемонстрировали, что камеры видеонаблюдения, зараженные вредоносными программами, могут получать скрытые сигналы и информацию, чувствительную к утечке, из тех же устройств наблюдения, которые используются для защиты объектов. Метод, по мнению исследователей, будет работать как на профессиональных, так и на домашних камерах, а также на светодиодных дверных звонках, которые работают с инфракрасным светом (ИК), невидимым человеческому глазу.

Страницы: [ 1 ][ 2 ][ 3 ][ 4 ][ 5 ][ 6 ][ 7 ]