AlphaGo

"Let's build your own Dreams Together"

AlphaGo
2020: Rise of the Machines
By admin | | 0 Comments |

ni James Grosjean Bilangin ako sa mga drone ng Netflix na gustung-gusto ang The Queen's Gambit (2020), ngunit palagi akong naging isang mahilig sa chess. Sa aking mga taon sa kolehiyo, malamang na kumain ako ng isang libong mga croissant ng tsokolate habang pinapanood ang kagila-gilalas, kamangha-manghang Murray Turnbull (aka "The Chess Master") na kinukuha ang lahat ng mga comers sa plaza ng bayan - "$ 2, i-refund kung manalo ka o gumuhit." Ito ang aking karangalan na makunan ng larawan ng dakilang Karpov na naka-frame ng may basang salamin ng Memorial Hall nang gumawa siya ng 40-board simul sa campus. Bahagi ako ng press ng mag-aaral nang gawin ni Kasparov ang kanyang naging kontrobersyal na pahayag na ang isang computer ay magiging grand champion bago ang isang babae ay maging. Ang pag-save ng debate tungkol sa posibleng pagkawalang-saysay ni Kasparov para sa isa pang forum at ibang araw, kinuha ko ang kanyang pahayag bilang isang proyekto lamang batay sa empirical na pagmamasid sa komunidad ng chess. Ang pakikilahok ng babae ay palaging mababa, at hindi makahulugan na pagtaas, habang ang mga computer ay malakas na, at mabilis na lumalakas. Ang mga makina ay magpapasimula ng isang bagong pagkakapantay-pantay - kung saan ang lahat ng kasarian ay durog tulad ng mga langgam. Sinasabi sa amin ng Theermem ni Zermelo na ang isang laro na may buong impormasyon (maaaring makita ng parehong mga manlalaro ang lahat ng mga piraso sa chess board), iyon ay may hangganan (ang laro AY TATAPOS pagkatapos ng ilang bilang ng mga galaw), ay may isang solusyon, at na kung i-play ito ng magkabilang panig pinakamainam na solusyon, pagkatapos ang bawat laro ay may parehong resulta. Sapat na kumplikado ang Chess na hindi namin sigurado kung ano ang magiging resulta, ngunit sa palagay namin ay mananalo ang White sa tuwing, sa kasong iyon ay walang Black na tugon na maaaring magbago sa kinalabasan. Ang laro ng Connect Four ay nahuhulog din sa ilalim ng Theorem ni Zermelo, at natukoy ng pagtatasa na sa larong iyon, palaging nanalo ang palihim na sis kung siya ang mauuna at mahusay na naglalaro. Kung ikaw ay isang AP na nagustuhan ang QGambit, at nagugutom para sa higit pang nilalaman sa walang katapusang pandemikong ito, pagkatapos ang iyong susunod na takdang-aralin ay upang panoorin ang AlphaGo, isang dokumentaryo tungkol sa pagtaas ng mga computer sa sinaunang laro ng Go, na mas kumplikado kaysa chess. Hindi katatawanan, ang pelikulang ito ay isang nakakaiyak para sa mga taong interesado sa larangang ito at pinahahalagahan ang matinding emosyonal na drama para sa kampeon ng sangkatauhan, si Lee Sedol — ang pinakamahusay na nagawa ito. Nakukuha ng pelikula ang pagkabalisa, tapang, ningning ni Sedol, pagkatapos ay pagpapakumbaba, dahil napagtanto niya na ang laban na ito laban sa makina ay hindi lamang isang laro, ngunit ang paglitaw ng isang bagong kaayusan sa mundo. Hindi isang programmer, hindi pinahahalagahan ni Sedol kung ano ang makakalaban niya, ngunit bilang isang dalubhasa sa kanyang bapor, sa pisara ay madama niya ang walang tigil, hindi malalabag na bigat ng kanyang kalaban. Matapos mong masiyahan sa AlphaGo, inirerekumenda ko (talaga, inirerekumenda ng Google) na panoorin mo ang ilan sa laban sa poker sa pagitan ng dating paaralan na Dan Negreanu at ng modernong computer-clone na si Doug Polk. Ang pinakamahusay na manlalaro sa mundo ay ang makina, kaya ang isang matalinong tao tulad ni Polk ay ginagaya ang diskarte ng makina. Adapt o mamatay. Minsan ay nagkaroon ako ng isang maikling palitan kay Howard Lederer. Tinanong ko siya tungkol sa mga bot sa mga site ng poker. Inalis niya ang isyu sa pagsasabing: “Ang Poker ay hindi tulad ng chess. Ang Poker ay isang laro ng hindi kumpletong impormasyon. Hindi magaling ang mga computer doon. ” Hindi ko masabi kung siya ay isang walang muwang na tanga o isang conman shill para sa Full Tilt Poker. Alinmang paraan, hindi ko nais na ipagpatuloy ang pag-uusap 15 taon na ang nakakaraan. Ngunit ngayon narito kami, noong 2021, at oras na upang ipagpatuloy ang pag-uusap na iyon, sa pamamagitan ng pagtanggi sa unang kamalian tungkol sa mga computer ng GTO (pinakamainam na teorya ng laro), at lahat ng iba pang magkakapatong na mga kamalian na ang mga poker dinosaur at nagpahayag ng mga poker savant na sarili ay desperadong kumapit sa: Fallacy # 1: Ang mga computer ay hindi magaling sa mga laro ng hindi kumpletong impormasyon. Ignorante lang ito. Totoo na ang Theorem ng Zermelo ay hindi nalalapat sa mga laro tulad ng poker. Para sa poker, may IBA pang mga teorya na karaniwang sinasabi na mayroong isang solusyon sa laro, at ang isang solusyon sa computer sa pangkalahatan ay magsasangkot ng "halo-halong mga diskarte" na nangangahulugang mayroong ilang randomizing na sangkap sa diskarte (tulad ng pagtawag sa Gunting na may posibilidad na 1/3 ). Ang mga computer ay lubos na mahusay, mas mahusay kaysa sa mga tao, sa pagkalkula ng inaasahan sa mga probabilistic na kinalabasan, lalo na kapag ang mga pamamahagi ng posibilidad ay tiyak na alam, dahil ang mga ito ay nasa mga laro ng card. Halimbawa, alam mismo ng computer kung ano ang posibilidad ng pagguhit ng isang backdoor Flush at kung ano ang mga posibilidad ng palayok na kinakailangan nito upang bigyang katwiran ang paghabol. Kahit na ang poker ay nagsasangkot ng hindi kumpletong impormasyon, ang mga nangungunang walang limitasyong poker ay isang mas simpleng laro kaysa sa Pumunta, kahit na ang Go ay nagsasangkot ng buong impormasyon (impormasyong pangkaraniwang kaalaman). Fallacy # 2: Ang kataasan ng computer ay nagmula sa pagiging naaalala ang bawat kamay na nilaro ko, at naaayos nang naaayon. Habang ang isang "mapagsamantalang bot" ay talagang susuriin ang iyong nakaraang pag-play at ayusin sa mga pinaghihinalaang kahinaan, ang isang karaniwang bot ng GTO (na ginamit naming tawaging isang "Nash bot") ay ang katumbas ng poker ng BS sa blackjack. Ang diskarte ng GTO ay hindi nagbabago, hindi alintana kung paano mo nilaro ang mga nakaraang kamay. Hindi nito kailangan ang impormasyong iyon, at walang pakialam. Fallacy # 3: Ang solusyon sa GTO ay "tama" lamang kung naglalaro laban sa isa pang bot ng GTO, sapagkat iyon ang ipinapalagay noong nabuo ang bot - ang bot na "natutunan" sa pamamagitan ng paglalaro laban sa sarili nito. Ito ay hindi totoo. Ang "bot na nilalaro laban sa sarili upang matuto ng poker" ay isang maling paglalarawan sa proseso ng pag-unlad. Gustung-gusto ng media na i-hype ang clickbait nito upang makagawa ng bawat resulta sa tunog ng pag-compute tulad ng isang henerasyon ng henerasyon, na humihiling sa HAL at Skynet. Ang isang bot ng GTO ay walang alam tungkol sa poker. Ang pagkuha ng diskarte sa GTO ay isang ehersisyo sa pagkalkula, ginawang posible ng napakalaking memorya at bilis ng CPU na magagamit sa mga computer ngayon at pagbuo ng isang mahusay na algorithm upang gawin ang pagkalkula ("pagsisiwalat sa pagliit"). Hindi namin ginamit upang ilarawan ang algorithm bilang "pag-aaral ng makina" o "AI" -inatawag namin itong "pag-akyat sa burol" o "pag-maximize" o "pag-optimize." Sa bawat hakbang ng umuulit na algorithm, ang computer ay may kasalukuyang diskarte sa ilalim ng pag-unlad para sa bawat upuan sa talahanayan, at ang kasalukuyang diskarte na ito ay maaaring sikat na inilarawan bilang "mismo," tulad ng sa: "Ang PokerSnowie ay naglalaro laban sa sarili nito." Ngunit ito ay talagang isang pag-ulit lamang sa landas nito ng pag-akyat sa burol upang magtagpo sa tuktok-isang pinakamainam na diskarte para sa poker. Ang pinakamabuting kalagayan na iyon ay hindi inaako ang anumang partikular na kalaban. Mayroong iba pang mga paraan na maaari nating makalkula ang solusyon (kahit na maaaring hindi ito napakabilis), at magiging wasto rin ito. Ang diskarteng ito ng GTO ay "The Book" para sa poker, at hindi ito magiging dehado, anuman ang kalaban nito. Walang diskarte na maaaring makakuha ng isang laban laban dito. Fallacy # 4: Ipinapalagay ng bot ng GTO na maglalaro ako ng isang tiyak na paraan, ngunit lokohin ko ito sa pamamagitan ng paglalaro ng aking off-suit 72 na wala sa posisyon. Mali Ang GTO bot ay hindi ipinapalagay ang anumang bagay tungkol sa kung paano ka maglaro. Wala itong pakialam. Ito ay hindi matatalo laban sa ANUMANG salungat na diskarte. Isipin na mayroon kang darating na laban laban kay Floyd Mayweather, at sasabihin mo, "Inaasahan ako ni Floyd na magpapakita sa hindi maayos na pisikal na pag-condition. Ipinapalagay niya na magsasanay ako ng husto para sa susunod na anim na buwan. Lilinlang ko siya — Manonood lang ako ng Netflix at kakain ng mga donut sa susunod na anim na buwan. ” Walang ideya si Floyd kung magkano ang iyong sanayin. Alam niya na kung siya mismo ay magpapakita sa perpektong hugis, kung gayon walang kalaban ang makakakuha laban sa kanya. May katuturan bang sabihin na, "Ipinapalagay ng bot na maglalaro ako ng maayos. Malilinlang ko ang bot sa pamamagitan ng paglalaro ng masamang poker! " Yeah, sigurado kang ipinakita sa kanila! Pagkakamali # 5: Natagpuan ko ang isang kahinaan — kapag mayroon akong ganyan at tulad, mula sa ganoong at ganoong posisyon, kung gayon ang bot ay dapat gawin X, ngunit ito ay Y. Mali. Ang bot ay walang kahinaan. Nakatingin ka sa isang partikular na hawak ng kamay, at isang partikular na resulta, ngunit batay sa posibilidad na mapunta sa senaryong iyon, at lahat ng mga posibleng kamay na maaari mong hawakan na tingnan mula sa pananaw ng bot, tama ang paglalaro nito, at maaari mong hindi makahanap ng butas doon. Napakapanganib na tingnan ang isang dula nang nakahiwalay. Gumagawa ang bot ng mga hakbang upang balansehin ang mga saklaw nito, upang hindi ka makakapagpuputi sa ibang mga sitwasyon, o kung may iba't ibang mga kard na dumating sa ilog. Kung hindi mo ito nakikita, kung gayon ang pagkakamali ay nasa iyong sariling pag-iisip ng poker, hindi ang bot. Fallacy # 6: Kung nilalaro ko ito nang ilang sandali, malalaman ko kung paano ito gumaganap at makahanap ng isang kahinaan. Mali Walang kahinaan. Sa katunayan, maaari naming mai-publish ang diskarte ng bot, at hindi ito makagagawa ng anumang pagkakaiba. Kung sasabihin ko sa iyo na maglalaro ako ng Gunting, Bato, at Papel na may posibilidad na 1/3 sa bawat isa, ang katotohanang alam mo ang aking diskarte ay hindi nagbibigay sa iyo ng kakayahang makakuha ng isang gilid. Walang takong Achilles. Fallacy # 7: Ang Heads-Up Limit bot na ipinakilala sa mga casino ay lubhang matalo, kaya marahil ang mga bot ng GTO ay pati na rin. Hindi ito isang makahulugang paghahambing. Ang ilan sa mga bot ng casino ay inatasan na huwag maglaro ng kanilang A game, sapagkat ito ay masyadong malakas laban sa average na mga tao. Kung itinakda ng casino ang bot upang i-play ang B game nito, upang makamit, sabihin, isang 5% edge laban sa karamihan sa mga manlalaro, kung gayon ang isang talagang mabuting tao ay maaaring kumita ng pera laban sa botang GTSO na iyon (sub-optimal na bot ng teorya ng laro). Ngunit ibang isyu iyon. Wala akong pakialam kung sino ka: Kung maglaro ka laban sa PokerSnowie, talo ka. Fallacy # 8: Ang mga bot ng GTO ay maaaring talunin ang mga mahihinang manlalaro, ngunit ang mga bot ay magkakaroon ng problema laban sa mga nangungunang kalaban tulad nina Phil Ivey o Dan Negreanu. Mali Ang isang magandang bagay tungkol sa isang bot ng GTO ay hindi mahalaga kung sino ang kalaban. Pinakamahusay, ang isang tao ay maaaring maglaro kahit sa bot. Ang isang singsing ng mga bot ng GTO ay magiging tulad ng isang lababo, na may pera na dumadaloy pakanan sa paghabol sa pindutan, at maalis ang gitna ng mesa dahil sa pagsisiksik. Ang isang praktikal na problema na mayroon ang mga tunay na kalamangan sa mundo ay ang pagpapasya kung kailan ang kanilang kasanayan ay sapat na upang umakyat sa susunod na mas mataas na pusta na magagamit, kung saan ang mga manlalaro ay maaaring mas malakas. Ngunit ngayon, ang isang manlalaro na gumagaya sa diskarte ng GTO ay maaaring umupo sa anumang mesa sa mundo, sa anumang mga pusta, at hindi mag-alala tungkol sa pagiging isda. Pinakamahusay, ang laro ay magiging pantay (sa labas ng rake), at sa pagsasagawa, ang isang diskarte ng GTO ay nagbibigay ng isang malaking sukat laban sa sinumang makakaharap mo sa ligaw. Fallacy # 9: Si Dan Negreanu ay isang matagal nang poker pro na may N bracelets, kaya't crush niya ang mga nits sa computer tulad ni Doug Polk na hindi nauunawaan ang mga nuances ng totoong poker. Kung ang isang lalaki tulad ni Polk ay kabisado lamang ang "mga tsart" at ginagaya ang diskarte ng GTO, hindi niya kailangang maunawaan ang isang sumpain. Hindi niya kailangang malaman kung ano ang ibig sabihin ng salitang "nuance". Ang karanasan sa Poker ng mga kalamangan tulad ng Negreanu ay kung saan pinagana ang mga ito upang malaman ang pinakamahusay na pag-play sa mga sitwasyon na kumplikado. Ang karanasan na iyon ay lipas na ngayon na kinalkula lamang ng mga computer kung ano ang tamang pag-play. Marahil noong 1950, ang karanasan ng isang manlalaro ay pinagana siya upang matukoy na ang pagpindot sa 14 v T ay mas mahusay kaysa sa pagtayo. Sa sandaling kinalkula ng Apat na Kabayo ang tsart ng BS, ang karanasan sa blackjack na iyon ay naging walang katuturan. Ang Pag-render ng Aklat ay karanasan ng hindi kinakailangan. Ngayon si Doug Polk ay hindi isang bot ng GTO. Siya ay isang nangungunang pro na gumagamit ng mga diskarte sa GTO. Kaya, ang kuha lamang ni Negreanu upang talunin si Polk ay kung ang pagtulad ni Polk sa GTO ay hindi tumpak, at kung ang mga butas ay sapat na malaki para makahanap at magsamantala ang Negreanu. Duda ako. Ang isa pang longshot ay magiging kung naglalaro sila ng live, at kung si Polk ay may pisikal na nagsasabi na magbigay ng impormasyon tungkol sa kanyang mga hole card, at kung mabasa siya ng Negreanu sa ganoong paraan. O kung ang Polk ay may mga ikiling isyu at nagsisimulang lumayo mula sa GTO kung mayroon siyang hindi magandang pagpapatakbo ng mga kard. Hindi malamang. O, marahil ang laro ay sapat na maikli upang ang Negreanu ay mapalad sa isang maliit na sample. Matapos maglaro laban sa AlphaGo, itinaas ni Lee Sedol ang kanyang laro at sinimulang durugin ang lahat (hindi na hindi pa niya nagagawa), ngunit pagkatapos ay nagretiro na sa laro! Sumang-ayon siya na siya ay binigyan ng pinakamahusay na (kung ano ang isang konsepto!), At walang sinumang tao ang muling hamunin ang pinakamahusay na manlalaro sa mundo, ang AlphaGo. Makikita natin kung magkakaroon ang Negreanu ng parehong epiphany. Ang isang kamakailang tweet ay nagtataka sa akin, dahil ang Negreanu ay tila nagtatanong ng isang paglalaro ng bot, at nagmumungkahi na mayroong isang manipis na linya sa pagitan ng henyo at kawalang-galang. Sa palagay ko umaasa pa rin siya na may pagkukulang sa diskarte ng GTO. Wala naman. Huling narinig ko, ang Negreanu ay nakahabol sa paligsahan, at mayroong ilang pahiwatig na ang isang kadahilanan ay, sa kanyang kredito, si Negreanu ay nagsasanay sa PokerSnowie, at umaangkop! Kung ang Negreanu ay maaaring mabilis na matuto ng diskarte sa GTO, kung gayon maipapantay niya ang patlang ng paglalaro, na kung saan ay isang napakalaking tagumpay. Ang tanging paraan lamang upang mabuhay ang isang dinosauro ay sa pamamagitan ng pag-unlad. Makikita natin sa 2021. [Next time, I’ll discuss some of the limitations and weaknesses of the poker bots, unless we thrash them out in the Comments below.]
แทงบอล คาสิโน sa คาสิโน คาสิโน ออนไลน์ มือถือ คาสิโนtrue wallet ไม่มีขั้นต่ำ คาสิโนbet