首页 > 科技 > 问答 > 科技知识 > 0完胜AlphaGo,alphago利用了哪些特征

0完胜AlphaGo,alphago利用了哪些特征

来源:整理 时间:2022-04-29 02:09:17 编辑:科技知识 手机版

但AlphaGo可以强制其对手展示其计划,以便AlphaGo能够以最佳方式进行响应。下面的例子实际上来自一个AlphaGo的更高版本与自己对抗的游戏。 探测和迫使的密度是惊人的。令人难以置信的是,没有人明确地向AlphaGo教授关于未来的实验或计划。 好奇的行为是AlphaGo自学的东西。AlphaGo如何做到这一点?AlphaGo的远见卓识,灵活性和独创性来源于其丰富而详细的经验,以及完全免于执行力的限制。

世界对神经网络来说,是很混乱,而一个神经网络却看到了可能性:“兔子有80%,鸭子有15%,手巾有5%。”我们的视错觉体验模仿了这种视觉会是什么样子。 著名的鸭兔幻觉包含鸭子或兔子的各个方面,因此我们看来是任何一个:通过一个神经网络来观察发现每个动物身上有一个动物园。 谷歌和麻省理工学院(MIT)于2015年合作,设法梳理出一些神经网络可以看到的更高层次的特征。

梦幻般的结果揭示了一种普遍存在的想象力。像一个pareidoliac注意到斗篷中的鱼眼球,AlphaGo看到奇怪的特征,并产生我们永远不会发生的联想。尽管它有惊人的能力,但AlphaGo并不完美。而在第四场,李在石就破解了它的代码。在比赛的大部分时间里,李在石允许AlphaGo欺负他,为他的数字对手留下小小的优势,以确保自己的领地是安全的。

然后,李在石在一次冒险的攻击中赌博整个游戏。这个策略是有效的,因为它迫使AlphaGo进入一个令人眼花缭乱的复杂和独特的情况,其模式识别软件无法匹配人类的直觉。李在石表示,他直观而迅速地看到了这一举动,AlphaGo的模式识别估计了李在石不到1万分之一的情况。现在机器变得困惑和不知所措。 它粗暴地试图挽救它右边的阵型,反而失去了更多的领土,然后莫名其妙地把棋子放到左下角堡垒。

总之,AlphaGo的崩溃持续了很久。感觉就像看足球比赛:深度学习的快速发展覆盖了公众的想象力,这种技术是一种不可战胜的力量。 但神经网络面临着实际的限制。 第四场中AlphaGo的崩溃揭示了三个这样的缺点。首先,神经网络比人类学习效率低。 他们依靠大量的经验,所以在非常情况下可能会失败。其次,他们的失误可能是毫无意义和莫名其妙的。

一个Go初学者可以把这12个动作识别为非理性的,而左下角的棋子就像是无用的。这里还有一个例子:一组Google的研究人员训练神经网络,以95%的精度写图像标题。 但看看它的一些错误是多么的不寻常。第三个问题是从深度学习的行为主义方法到人工智能。尽管DeepMind在更高版本中修正了AlphaGo崩溃的原因,但是由于神经网络的黑盒质量,没有人会理解AlphaGo如何犯下原来的错误。

我们可能会学习神经网络的预测能力,但是如果缺少解释能力,我们就不愿意将它们赋予充分的自主权。一份2017年“人工智能”报告突出了以下一些问题:目前大数据和深度学习的进展周期还没有系统地解决工程“可用性”:可靠性,可维护性,可调试性,可进化性,脆弱性和可攻击性等等。此外,目前还不清楚现有的AI范例是否适用于任何类型的软件工程验证和验证。

这是一个严重的问题。最后,鉴于AI过去的适应和开始,许多研究人员仍然有点怀疑,夸大的期望不会让位于一个新的、不可预知的进展障碍。10月份推出的AlphaGo Zero甚至不需要向人类学习。根据“自然”杂志上的一篇文章,只用游戏的规则和三天的练习,就可以击败AlphaGo。经过40天的训练,它击败了AlphaGo Master 89-11。

奇怪的是,AlphaGo Zero的开发并没有看到人类的游戏比深奥的大师更加人性化。然后,在十二月初,DeepMind设置了一个名为AlphaZero的版本,这是国际象棋专业人员用于自己训练的高级象棋AI。在学习国际象棋规则的四个小时内,AlphaZero超过了Stockfish,三天后,它在一场非正式比赛中摧毁了以前的卓越象棋AI。

go可能只是一个游戏,但它表达了现实生活中所带来的许多相同的智力挑战。 DeepMind已经将其机器学习发现转化为推荐医学治疗的AI软件。许多其他人也在使用AlphaGo技术来诊断,还有自动驾驶车辆和聊天机器人。AlphaGo的能力和个性预示着未来。这显示了我们人工智能的灵活性、长期规划、甚至原创性以及无情、偏见和不透明的能力。

在围棋历史上,有没有哪位棋手的风格和AlphaGo近似?

这个答案应该是吴清源了,除了他,人类还真没另一位棋手的棋风更像阿尔法狗了。阿尔法狗的着法超人类,其实在80多年来,吴清源的一些着法给棋界(主要是日本围棋界)带来的冲击力一点也不亚于今天的阿尔法狗。这是1933年年仅19岁的吴清源与日本秀哉名人特别对局中下出的布局,直至今天,这个布局还没有人来模仿,第一手三、三,这是日本本因坊一门的禁着点,第二手星位,第三手天元,一手占角,一手在角上星位取势取地两相宜,一手在棋盘正中央,这是多么具有创意的布局!竟然出现于80多年前最为传统保守的日本!吴清源在棋盘上百无禁忌,就像现在的阿尔法狗一样自由自在,什么棋都敢下,什么局面也能掌控,这不就是当年的阿尔法狗吗?这是吴清源与桥本宇太郎十番棋的第一局,吴清源执黑,看看左上大雪崩定式,吴清源黑11脱先了!并不像其他棋手一样非要将大雪崩定式完成;左下角黑棋的着法也不是一般人能想得出来的,白34枷死黑三子后,黑35冲,黑37断是不是很有创意?至黑41贴,黑棋弃掉四子,先手拔花,右边阵势宽广,再回头处理左上。

AlphaGo Zero三天击败人类的背后究竟意味着怎样的进步?

学习3天:AlphaGo Zero

文章TAG:AlphaGoalphago完胜特征利用

最近更新

  • 手机里的图片都在哪里?,你们手机里的照片都存在哪里

    手机空间释放后,上传到腾讯相册不显示占用空间,手机操作过程中也不会出现卡顿现象。清理手机垃圾时,腾讯相册不会有垃圾,所以整体上没有发现内存占用现象。我给大家分享一个储存照片的好方法 ......

    科技知识 日期:2022-07-20

  • 人为什么要有价值观,一个人存在的价值是什么

    树立正确的人生观和积极的价值观,首先要树立正确的是非观。决定一个人价值观的标准不一样。根本区别在于各自的创造力、精力,差异化的社会分工,利益分配平衡中相对统一的需求。一个人的认识和 ......

    科技知识 日期:2022-07-19

  • 为什么黄牛抢票用什么软件,为什么还会有黄牛抢票

    黄牛使用的抢票软件是独立软件。最后黄牛用的抢票软件和我们的差别很大。我们平时用的软件都是市面上常用的。这些抢票软件都是很多人用的,服务器平均分配后自然减少了我们每个人的份额,这也是 ......

    科技知识 日期:2022-07-18

  • 为什么苹果亮银贵,为什么苹果的数据线这么贵

    你知道为什么苹果的数据线贵但是容易断吗?苹果手机最大的优势就是iOS系统和苹果的A系列处理器。关键是最便宜的苹果数据线官方售价149元。按照大部分苹果数据线不到一年的使用寿命,光是 ......

    科技知识 日期:2022-07-18

  • 谷歌眼镜显示屏在哪里,哪些VR眼镜值得买

    VR眼镜的分类目前VR眼镜主要分为VR盒子VR一体机和PCVR。去的太早了,先发明骑行用的智能眼镜还好,但还没消失。第二代企业版谷歌眼镜高通SnapdraonXR1平台运行,不出售 ......

    科技知识 日期:2022-07-18

  • 上海哪里体验一加手机,一加手机真的快不行了吗

    说到一加,总会有一大批人说一加手机只活在互联网上。比如现实中没有一加手机的踪迹。一加定位,首先你必须是网络爱好者,否则一般没机会看到。其次,一加一直以来都是精品旗舰策略,每一次新机 ......

    科技知识 日期:2022-07-17

  • 为什么冬季雾霾最严重怎么办,夏天难道就没有雾霾吗

    为什么冬天有雾霾,夏天没有?看来雾霾的主要原因还是气象条件。其实冬天的雾霾已经比以前轻很多了。所以直到现在,冬天还是有雾霾。个人认为和农民烧麦秸没关系。入秋以来,随着来自中国的西北 ......

    科技知识 日期:2022-07-17

  • 苹果为什么好用,苹果的系统那么难用

    我用的是苹果安卓,我觉得苹果不好用。我承认苹果系统很流畅,但是旗舰安卓机型还可以,更重要的是也很耐用。苹果系统真的没有安卓系统自由。换了苹果第二天就开始想念安卓了,应用很忙。微信视 ......

    科技知识 日期:2022-07-17