Вести.net: нейронна мережа AlphaGo навчилася грати в го як людина

размещено в: Новости | 0
Вести.net: нейронна мережа AlphaGo навчилася грати в го як людина
0 голосов, 0.00 общий. рейтинг (0% сумма)

Штучний інтелект, схоже, створений: комп’ютер навчився перемагати людини в гру Го. Це дуже давня і дуже проста з точки зору правил настільна гра, в якій неможливо прорахувати всі ходи. Тобто в ній перемагають не обчислювальні ресурси, а інтуїція і суб’єктивна оцінка ситуації.

Гра між людиною і штучним інтелектом виходять на новий рівень. На цьому тижні Седоль, чемпіон світу з го з Південної Кореї, програв два матчі поспіль в серії ігор з системою штучного інтелекту AlphaGo, і ще одна поразка в серії приведе до перемоги комп’ютера над людиною в цій грі. Від попереднього, першого тестового поєдинку між AlphaGo від Google і чемпіоном Європи Фан Ху (який, до речі, програв усі п’ять матчів машині), ця серія ігор відрізняється тим, що до неї прикута увага всього світу. І суть цього поєдинку — далеко не стільки в самому змаганні, скільки в можливому якісний стрибок розвитку і визнання рівня штучного інтелекту.

“Чому? Тому що це одна з найбільш складних, якщо не найскладніша гра з точки зору кількості варіантів, — каже Олександр Крайнов, керівник служби комп’ютерного зору і технологій штучного інтелекту компанії “Яндекс”. — Вона дуже проста за правилами, але варіантів в го безліч. Розрахунки свідчать, що їх набагато більше, ніж атомів у Всесвіті. І розрахувати їх, в якихось інших іграх, не представляється можливим. Зробити хід і прорахувати його наслідки в го неймовірно важко”.

Тут варто обмовитися, що AlphaGo — це не класична обчислювальна модель, а ціла система паралельної обробки інформації. Пропускаючи через нейронні шари, вона відразу дає відповідь. І він буде правильним, якщо програму навчати на величезній вибірці даних. Фахівці вважають, що нейронна мережа AlphaGo (а з точки зору обладнання — це кластер з 1200 процесорів і 176 спеціальних серверних відеокарт) навчалася стратегії го близько двох років. І якщо у людини з роками ігрової практики виробляється інтуїція на сильні і значущі ходи, то програму AlphaGo в Google вирішили навчити цієї самої інтуїції. У програму завантажили базу партій професійних гравців, позначили як хороші ходи переможців і як погані — ходи гравців переможених.

“Нейронна мережа стала діяти як людина, — пояснює Олександр Крайнов, керівник служби комп’ютерного зору і технологій штучного інтелекту компанії “Яндекс”. — Тобто на початку вона висловлювала якесь припущення, куди потрібно сходити, потім прораховувала кроки на кілька ходів вперед, як це робили інші програми до цього, намагаючись визначити, чи вірне це припущення чи ні. І, прийшовши в якусь точку, оцінювала цю позицію — добре вийшло чи ні. І так програма грає. Крім того, навчаючись на іграх кращих гравців і досягнувши певного рівня, програма стала грати сама з собою, стала глибоко, на багато ходів вперед розбирати свої гіпотези, свої припущення, і вчитися на власних іграх. Коли я кажу “стала”, я не хочу сказати, що це припинилося. Це робиться прямо зараз. Ось я про це розповідаю, а де-то нейронна мережа продовжує грати сама собою, вчитися на своїх помилках і вдосконалюватись”.

І штучний інтелект від Google перевершив всі очікування. Коментатори зазначили, що AlphaGo грає подібно людині: система шукає і створює вразливі групи каменів, щоб зробити сильні ходи. Але все-таки говорити про історичному моменті поки рано. Остання п’ята гра серії відбудеться 15 березня. Тоді ж визначиться доля призового мільйона доларів: або він піде на благодійність, або його отримає гравець-людина.

При цьому значення цього поєдинку — у разі якщо переможе ІІ — для світу стане настільки ж великим, як легендарне шахове протистояння Deep Blue — Каспаров, що проходило 20 років тому. Втім, деякі скептики впевнені, що знаменитий шаховий матч у дев’яностих був саморекламою IBM. Зараз же піариться Google.

“Вперше стаття про те, як грає AlphaGo, з’явилася в листопаді, але з’явилася вона тихо, мало кому помітним ресурсі, і надбанням широкої громадськості не стала, — розповідає Олександр Крайнов, керівник служби комп’ютерного зору і технологій штучного інтелекту компанії “Яндекс”. — У статті розповідалося, як грає програма, говорилося, що їй вдалося здобути перемогу над європейським чемпіоном. Європейські чемпіони, звичайно, слабкіше азіатських, але все одно це був дуже сильний гравець. Раніше нічого подібного програми не демонстрували. Але ніхто на це не зреагував. А цієї зими Цукерберг ще раз всім сказав: Facebook працює над штучним інтелектом, в тому числі — над тим, щоб побороти людини в го. Ну тут PR-відділ Google підметушився і сказав: “Ми ще в жовтні обіграли людини в го, в листопаді про це вийшла стаття”. І це прозвучало як грім серед ясного неба, стало повною сенсацією. Бідного цього француза Фан Ху прям замордували питаннями: як же так, чому він так погано грав, може бути, він спеціально піддався? Як він так — раптом програв програмі? Ну і закрутилося”.

Оставить ответ