Банк идей

-> -> Компьютер, имитирующий человеческий мозг, выиграл у профессионала в игре "Го"


08.02.2016

Компьютер, имитирующий человеческий мозг, выиграл у профессионала в игре "Го"

Компьютер, имитирующий человеческий мозг, выиграл у профессионала в игре "Го"

Через восемнадцать лет после победы компьютера над чемпионом мира Гарри Каспаровым в шахматы, машина победила профессионального игрока в древневосточную настольную игры "Го". Прогресс огромен, говорят разработчики искусственного интеллекта, т.к. "Го" очень требовательная к вычислениям игра, про которую еще десять лет назад некоторые исследователи говорили, что компьютеру никогда не победить в нее человека-эксперта. Более того, машина выиграла не благодаря вычислительной мощности, а используя инструменты "машинного обучения", которые позволяют ей учить себя и думать как люди.

"Го" выглядит по-детски просто. Доска состоит из квадратов 19-на-19. Один игрок имеет запас черных камней, другой запас белых, и они по-очереди размещают свои камни на доске, черные начинают первыми. Игрок старается окружить «цель» из одного или более камней противника так, чтобы не осталось открытой клетки, в то время как противник делает то же самое. Окруженные камни удаляются с доски и, грубо говоря, выигрывает тот, кто окружит больше камней.

Тем не менее, "Го" с трудом поддается компьютерному анализу по 2-м причинам. Во-первых, доска настолько большая, что кол-во возможных ходов астрономическое. В начале игры каждый игрок имеет примерно 360 вариантов размещения каждого камня. Таким образом, после пяти ходов, доска может быть в любой из более чем 5 триллионов различных расстановок. В общей сложности, число различных возможных расстановок камней выходит за пределы 10100, что делает невозможным для компьютера игру с помощью прямого вычисления всех возможных комбинаций.

Во-вторых, для любого конкретного расположения камней на доске трудно оценить, черные или белые имеют преимущество. В шахматах, например, игроки или компьютеры могут примерно оценить, насколько сильны их позиции на доске просто сравнивая части, которые они захватили с теми, которые потеряли, говорит Коулом. Но вести такой учет "на лету" намного сложнее в "Го", говорит он, так как большая часть подсчета делается в конце игры.

Предыдущие программы были нацелены не столько на оценку состояния доски, сколько на скоростное моделирование, как игра может закончиться. "Crazy stone" использует алгоритм, называемый "дерево поиска Монте-Карло", который, вместо того чтобы рассчитать все возможные последовательности игры, образует только некоторые из них с помощью генератора случайных чисел на каждом шаге, выбирая между различными ходами. Он использует небольшое количество адаптивного программирования, или машинного обучения, чтобы узнать, как избежать бесполезных шагов. Crazy stone выигрывал у сильных игроков людей, говорит Бруно Bouzy, программист в Парижском Университете Декарт, но только тогда, когда позволялось выгодно размещать первые три или четыре камня на безальтернативной основе.

Теперь, однако, Дэвид Сильвер, Демис Хассабис, и 18 других компьютерных ученых Google DeepMind, разработали программу, которая противостоит непосредственно прямым вызовам "Го". Вместо того, чтобы случайно генерировать последовательности ходов, программа AlphaGo учится различать хорошие ходы и плохие, и оценивать силу своей позиции на доске. Чтобы сделать подобное, программа опирается на "глубокие нейронные сети" - компьютерную программу, которая имитирует соединения нейронов в головном мозге и обладает способностью к обучению.

Такие сети состоят из слоев абстрактных взаимосвязанных "нейронов". Один нейрон может помогать или препятствовать другим, и происходит обучение, так как система регулирует связи между нейронами. Например, AlphaGo использует "сети политики", чтобы судить о жизнеспособности возможных ходов. Нижний слой сети состоит из массива нейронов 19-на-19, который в основном делает снимок состояния доски и использует его в качестве входа. Верхний слой состоит из массива, который показывает все возможные места для укладки следующего камня и вероятности принятия каждого из этих ходов. А между ними лежат еще 11 слоев.

Цель состоит в том, чтобы автоматически получить сеть с лучшим следующим ходом при любой начальной конфигурации. Чтобы обучить сеть, исследователи наполняли его базу данных 30 млн конфигураций доски и последующими играми опытных игроков. Чтобы все входные данные соответствовали всем выходным, компьютер сравнивал связи в промежуточной сети, которые затем кодировали в данные. Затем они позволяли программе дополнительно обучать себя, играя против себя снова и снова. Таким образом, AlphaGo получала опыт перехода от худшего хода к лучшему. "То, как ведет себя система, больше похоже на поведение человека" говорит Хассабис.

AlphaGo легко победила Crazy Stone и другие Go-игры, выиграв 99,8% игр, когда работала на одном можщном компьютере и 100% игр, когда работала на нескольких компьютерах. Она обошла Фан Хуэй, профессионального игрока и чемпиона Европы по "Го" 2013 года, победив в трех из пяти игр. AlphaGo получила ​​шанс сыграть среди высокоранговых профессионалов в марте, говорит Сильвер, когда он сразится с Ли Седоль, 32-летним южнокорейским Go-чемпионом самого высокого ранга, на матче в Сеуле.

Коулом отмечает, что это не главное назначение нового изобретения. "Это больше похоже на большое инженерное достижение", говорит он. "Сложив все кусочки вместе, оно действительно становится инновационным."

Глубокие нейронные сети и глубокое изучение уже находят применение в таких областях, как распознавание образов, автоматизированный перевод, медицинская диагностика и т.д. Таким образом, концепция AlphaGo может уже использоваться в нашей жизни.

Даже если AlphaGo выиграет у Седола, этот триумф не будет выглядеть, как поражение Каспарова в шахматы, прогнозируют ученые-компьютерщики. Люди просто привыкли к мысли, что в играх в конечном счете компьютеры преобладают. Но компьютеры еще не выигрывают их все, отмечает Боузи. Как ни странно, люди по-прежнему могут иметь большое преимущество в видеоиграх. "Они, как правило, очень сложны", говорит он, "с большим количеством символов, большим количеством действий, большим количеством локаций." В настоящее время, мозг 13-летнего человека может справляться со всем лучше, чем компьютер.

Оставить комментарии

Имя:E-mail (не публикуется):

аватар

Я не робот



Еще Новости

17.11.2017 - Робот Atlas делает сальто назад
Мы уже видели робота Atlas от Boston Dynamics, и он был очень интересным, но теперь у бота есть несколько новых панелей и, по-видимому, какое-то новое оборудование и/или программное обеспечение, потому что мы никогда не видели, чтобы он так двигался. Робот, - ростом под 2 метра и весом почти в 80 кг, - всего несколько месяцев назад был объектом насмешек. Теперь «самый динамичный гуманоид в мире» вернулся.

03.11.2017 - Нейронные сети способны создавать портреты несуществующих людей
В 2015 году Google выпустила программу DeepDream, основанную на нейронных сетях и генерирующую различные коллажи, шокировавшие пользователей. DeepDream, возможно, была прелюдией к более эстетичному и гораздо более значительному приложению, например, созданию фотореалистичных изображений людей, которые никогда не существовали.

27.10.2017 - Открыт первый в мире мост, напечатанный на 3D-принтере
Голландские чиновники открыли первый в мире бетонный мост, напечатанный на 3D-принтере, который в первую очередь предназначен для использования велосипедистами. «Мост не очень большой, но он был сделан принтером, что делает его уникальным», - сказал Тео Сале из Технологического университета Эйндховена. Работа над печатью моста, который имеет около 800 слоев, заняла около трех месяцев после начала работы, и он изготовлен из усиленного бетона.

10.10.2017 - Google AlphaGo умнее, чем Siri, Bing и Baidu
Трое исследователей из Китая разработали систему для измерения интеллекта систем ИИ. Они также создали классификационную схему, предназначенную для ранжирования различных систем. Feng Liu, Yong Shi и Ying Liu сообщают в своей статье, что система AlphaGo от Google в настоящее время оценивается выше всех тестируемых. Ученые и граждане выражают страх в отношении систем искуственного интеллекта, некоторые из них предполагают, что он может привести к уничтожению людей, как это показано в научно-фантастических фильмах.

04.10.2017 - The Float - победитель конкурса дизайна автомобиля будущего.
Всегда здорово видеть, что думают дизайнеры об автомобилях будущего. Недавно Renault провела конкурс на проектирование автомобиля будущего на DesignJunction 2017. В этом году акцент дизайна автомобиля был сделан на электроэнергию, автономное вождение и технологии соединения. Участниками конкурса были студенты MA Industrial Design, а судьями Энтони Лоу и Ник Родос из команды дизайнеров Renault.

29.09.2017 - Ford использует HoloLens для создания новых автомобилей
Традиционные методы проектирования транспортных средств производятся с использованием глиняных моделей, но использование такого метода дорогостоящее и трудоемкое. Дизайнеры Ford планируют объединить новое со старым, используя 3D-голограммы в сочетании с глиняными моделями. Сделав этот шаг, дизайнеры получают более творческую гибкость, поскольку каждая часть не будет физически прототипирована в глину.

25.09.2017 - Камеры видеонаблюдения оказались уязвимы
Исследователи Израильского Университета им. Бен-Гуриона из Негева продемонстрировали, что камеры видеонаблюдения, зараженные вредоносными программами, могут получать скрытые сигналы и информацию, чувствительную к утечке, из тех же устройств наблюдения, которые используются для защиты объектов. Метод, по мнению исследователей, будет работать как на профессиональных, так и на домашних камерах, а также на светодиодных дверных звонках, которые работают с инфракрасным светом (ИК), невидимым человеческому глазу.

11.09.2017 - Wi-Charge превратит комнату в беспроводную "зарядку"
Устали находиться привязанными к розетке, от которой заряжается мобильное устройство? Это реальная помеха, когда вам нужен телефон или планшет, а он не может двигаться дальше, чем на несколько метров. Wi-Charge превращает целые комнаты в беспроводные "зарядки", позволяя свободно перемещаться, все еще заряжая устройство.

30.08.2017 - Гироскопический транспорт - будущее городов
Мы все понимаем, что существует глобальная проблема, когда дело касается дорожного движения, и что любое невероятное решение может стать прорывом в мгновение ока. Был автобус, который "накрывал" трафик. Летающие автомобили, которые подключаются к беспилотным самолетам. Но ни один из них не подошел и близко к тому, что готовит российская дизайнерская фирма Dahir Insaat. Суть в том, что одним из возможных решений для городов с повышенным транспортным потоком может быть большой автомобиль, размером с комнату и высокой посадкой, который передвигается по дорогам над автомобилями.

23.08.2017 - VR система для обучения пожаротушению
Корпорация NEC и MX Mobiling Co Ltd выпустит систему, использующую виртуальную реальность (VR) и позволяющую испытать пожаротушение в сентябре 2017 года. Система «VR Fire Simting Experience Simulator» не требует специальных средств для обучения методам пожаротушения. Поэтому учебная тренировка может выполняться в различных местах как внутри здания, так и снаружи. Новая система состоит из смартфона Samsung S8(S8+), головного дисплея «Galaxy Gear VR с контроллером» (HMD), огнетушителя для обучения, специализированного программного обеспечения и монитора для инструктора.

Страницы: [ 1 ][ 2 ][ 3 ][ 4 ][ 5 ][ 6 ][ 7