智能时代：大数据与智能革命重新定义未来

势胜笔记 242 阅读在线记录

大数据和人工智能迅猛发展，对社会和商业的影响日益深刻，从学术界到企业界，智能化浪潮的来临，已经成为共识。可以比肩于大航海时期和工业革命的此次变革浪潮，必然会对我们的技术发展、商业和社会都会产生重大的影响。作者吴军在《智能时代：大数据与智能革命重新定义未来》中指出，首先，我们在过去被认为非常难以解决的问题，会因为大数据和机器智能的使用而迎刃而解，比如解决癌症个性化治疗的难题。同时，大数据和机器智能还会彻底改变未来时代的商业模式，很多传统的行业都将采用智能技术实现升级换代，同时改变原有的商业模式。大数据和机器智能对于未来社会的影响是全方位的。

另一方面，智能化也会对整个社会带来巨大的冲击，尤其是在智能革命的初期。因此，在智能时代开始的时候，我们需要未雨绸缪，力争做控制世界的2%人，而不是被智能化浪潮淘汰。

作者简介
吴军

博士，著名自然语言处理和搜索专家，硅谷风险投资人。他的著作《数学之美》荣获国家图书馆第八届文津图书奖、第五届中华优秀出版物奖，《文明之光》被评为2014年“中国好书”，《浪潮之巅》荣获“蓝狮子2011年十大极佳商业图书”奖。

吴军博士曾经担任Google资深研究员，设计了Google中、日、韩文搜索算法以及Google的自然语言分析器。2010-2012年期间担任腾讯负责搜索和搜索广告等业务的副总裁，后回到Google负责计算机自动问答项目。

吴军博士自2008年开始从事风险投资，并于2014年作为创始合伙人创立了硅谷丰元资本风险投资基金。他也是上海交通大学客座研究员和约翰·霍普金斯大学工学院董事。

-------------------------

目　　录
序一大数据与机器智能催生智能时代邬贺铨

序二智能时代，未来已来李善友

前言人类的胜利

第一章数据—人类建造文明的基石

如果我们把资本和机械动能作为大航海时代以来全球近代化的推动力的话，那么数据将成为下一次技术革命和社会变革的核心动力。

现象、数据、信息和知识

数据的作用：文明的基石

相关性：使用数据的钥匙

统计学：点石成金的魔棒

数学模型：数据驱动方法的基础

第二章大数据和机器智能

在有大数据之前，计算机并不擅长于解决需要人类智能的问题，但是今天这些问题换个思路就可以解决了，其核心就是变智能问题为数据问题。由此，全世界开始了新的一轮技术革命——智能革命。

什么是机器智能

鸟飞派：人工智能1.0

另辟蹊径：统计数据

数据创造奇迹：量变到质变

大数据的特征

变智能问题为数据问题

第三章思维的革命

在无法确定因果关系时，数据为我们提供了解决问题的新方法，数据中所包含的信息可以帮助我们消除不确定性，而数据之间的相关性在某种程度上可以取代原来的因果关系，帮助我们得到我们想知道的答案，这便是大数据思维的核心。

思维方式决定科学成就：从欧几里得、托勒密到牛顿

工业革命，机械思维的结果

世界的不确定性

熵—一种新的世界观

大数据的本质

从因果关系到强相关关系

数据公司Google

第四章大数据与商业

在未来我们可以看到，大数据和机器智能的工具就如同水和电这样的资源，由专门的公司提供给全社会使用。

从大数据中找规律

巨大的商业利好：相关性、时效性和个性化的重要性

大数据商业的共同点—尽在数据流中

把控每一个细节

重新认识穷举法—完备性带来的结果

从历史经验看大数据的作用

技术改变商业模式

加大数据缔造新产业

第五章大数据和智能革命的技术挑战

大数据的数据量大、维度多、数据完备等特点，使得它从收集开始，到存储和处理，再到应用，都与过去的数据方法有很大的不同。因此，使用好大数据也需要在技术和工程上采用与过去不同的方法。

技术的拐点

数据收集：看似简单的难题

数据存储的压力和数据表示的难题

并行计算和实时处理：并非增加机器那么简单

数据挖掘：机器智能的关键

数据安全的技术
保护隐私：靠大数据长期挣钱的必要条件

第六章未来智能化产业

现有产业机器智能=新产业，未来的农业、制造业、体育业、医疗、律师，甚至编辑记者行业都将迎来崭新形态，新产业将取代旧产业满足人类的个性化需求，大数据将导致我们整个社会的升级和变迁。

未来的农业

未来的体育

未来的制造业

未来的医疗

未来的律师业

未来的记者和编辑

第七章智能革命和未来社会

在历次技术革命中，一个人、一家企业，甚至一个国家，可以选择的道路只有两条：要么加入智能浪潮，成为前2%的人，要么观望徘徊，被淘汰。

智能化社会

精细化的社会

无隐私的社会

机器抢掉人的饭碗

争当2%的人

后记

参考文献

-------------------
前　　言
2016年是机器智能历史上一个具有纪念意义的年份，它是一个时代的结束，也是新时代的开端。这一年距离1956年麦卡锡、明斯基、罗切斯特和香农等人提出人工智能的概念正好过去了六十年，按照中国的习惯正好过去了一个甲子。而当年在达特茅斯学院提出这个概念的10位科学家中最后一位科学家明斯基也在这一年的年初离开了人世，这或许标志着人类在机器智能领域第一阶段的努力落下来帷幕。就在明斯基去世后的两个月，Google的围棋计算机AlphaGo在同世界著名选手李世石的对局中，以4:1取得了压倒性的胜利，成为第一个战胜围棋世界冠军的机器人，它的意义要远远超过1997年IBM深蓝战胜卡斯帕罗夫，因为从难度上讲，围棋比国家象棋要难6-9个数量级。这件事不仅是人类在机器智能领域取得的又一个里程碑式胜利，而且标准这一个新的时代----智能时代的开始。

从计算机发展的角度看，智能机器在所有棋类战胜人类其实只是一个时间问题，因为机器运算能力的提升是指数增长的，而人类智力能够做到线性增长就不错了。因此一定存在一个时间点——在所有的棋类比赛中都会超过人。在1997年IBM的深蓝战胜卡斯帕罗夫之后，围棋不仅是最后一个计算机尚未超越人类的主要棋类，而且还担负了上千年东方文化的蕴含，即棋道。虽然大部分人相信计算机最终可以在围棋上超越人类，但是总是觉得那还是几年后的事情。就在AlphaGo和李世石比赛之前，李世石本人认为前者的水平和他差出一到两个子，也就是说，即使他让先也能5：0获胜。中国围棋界的泰斗聂卫平也认为今天的计算机是不可能战胜人类的冠军的。就连曾经在Google工作过的IT行业老兵李开复博士也不相信AlphaGo能赢。这并非李开复等人对今天机器智能的发展状况不够了解，而是因为下围棋是一件太难的事情。2015年年底，AlphaGo仅仅赢了樊麾二段而已，离九段还差得远呢。但是大家忘记的一件事情，那就是AlphaGo水平的提高并不需要人那么长的时间，事实上在Google内部，大家在开赛前已经知道AlphaGo的水平并在九段之下。

2016年3月9日，AlphaGo和李世石之间的世纪大战开始了。AlphaGo在第一盘出人意料地轻松获胜。当然，大部分人在赞誉AlphaGo水平的同时，依然认为这可能是李世石在试探计算机而已，毕竟那是五盘的比赛，用一盘棋试探毫不了解的对手未尝不是明智之举。但是当AlphaGo在第二盘获得连胜并且下出了很多人类想不到的好棋后，对机器智能持怀疑态度的聂卫平等人，都对它产生了致敬。在AlphaGo获得第三盘胜利之后，很多超一流的棋手都渴望和它一比，希望以此检验自己的水平，并且能够提高技艺。虽然李世石在第四盘抓住AlphaGo的一个失误打了一个漂亮的翻身仗，但是AlphaGo在最后一盘稳稳地控制着局面，直到胜利。可以讲在那一次人机大战之后，围棋界对机器智能从怀疑变成了顶礼膜拜，大家都意识到，按照AlphaGo在过去几个月里的进步速度，只要Google愿意继续投入科研，很快人类所有的围棋高手都无法和它过招了。

计算机之所以能战胜人类的，是因为机器获得智能的方式和人类不同，它不是靠逻辑推理，而是靠大数据和智能算法。在数据方面，AlphaGo在训练时使用了几十万盘围棋高手之间对弈的数据，这是它获得所谓的“智能”的原因。在计算方面，AlphaGo采用了上万台服务器训练它下棋的模型，并且让不同版本的AlphaGo相互对弈了上千万盘，这才保证了它能做到“算无遗策”。具体到下棋的策略，AlphaGo里面有两个关键的技术：把棋盘上当前的状态变成一个获胜概率的数学模型，这个模型里面没有任何人工的规则，而是完全靠前面所说的数据训练出来的。第二个关键技术是启发式搜索算法----蒙特卡洛数搜索算法（MonteCarloTreeSearch），它能将搜索的空间限制在非常有限的范围内，保证计算机能够快速找到好的下法。虽然AlphaGo的训练使用了上万台服务器，但是它在和李世石对弈时仅仅用了几十台服务器（1000多个内核以及一百多个GPU）。相比国际象棋，围棋的搜索空间要大倍，AlphaGo的计算能力相比深蓝，其实并没有这么多倍的提高，它靠得是好的搜索算法，能够准确地聚焦搜索空间，因此能够在很短的时间里算出最佳行棋步骤的。由此可见，下围棋这个看似智能型的问题，从本质上讲，是一个大数据和算法的问题。

当然，Google开发AlphaGo的最终目的，并非要证明计算机下棋比人强，而是要开发一种机器学习的工具，让计算机能够解决智能型的问题。AlphaGo和李世石对弈，实际上是对当今机器智能水平的一个测试。从樊麾到李世石，实际上是用他们的专才在帮助Google测试当今机器智能的发展水平。在人机对弈的第四盘李世石反败为胜的过程中，他无意中发现了AlphaGo的一个缺陷。因此，Google的成功里面也有李世石等棋手的功劳。从这个角度讲AlphaGo的胜利标志着人类在机器智能方面达到了一个崭新的水平，因此它是人类的胜利。

AlphaGo无论是在训练模型时，还是在下棋是所采用的算法都是几十年前大家就已经知道的机器学习和博弈树搜索算法，Google所做的工作是让这些算法能够在上万台甚至上百万台服务器上并行运行，这就使得计算机解决智能问题的能力有了本质的提高。这些算法并非是专门针对下棋而设计的，很多已经在其它智能应用的领域（比如语音识别、机器翻译、图像识别和大数据医疗）获得了成功。AlphaGo成功的意义不仅在于它标志着机器智能的水平达到了一个新的台阶，还在于计算机可以解决更多的智能问题。今天，计算机已经开始完成很多过去必须用人的智力才能够完成的任务，比如医疗诊断，阅读和处理文件，自动回答问题，书写新闻稿和驾驶汽车等等。可以讲，AlphaGo的获胜，宣告了机器智能时代的到来。

AlphaGo的获胜让一些不了解机器智能的人开始杞人忧天，担心机器在未来能够控制人类。这种担心是不必要的，因为AlphaGo的灵魂是计算机科学家为它编写的程序。机器不会控制人类，但是制造智能机器的人可以。而科技在人类进步中总是扮演着最活跃最革命的角色，它的发展是无法阻止的，我们能做的是面对现实，抓住智能革命的机遇，而不是回避它、否定它和阻止它。未来的社会，属于那些具有创意的人，包括计算机科学家，而不属于掌握某种技能做重复性工作的人。

在AlphaGo取得人机大战胜利之际，我们出版这本书，希望能让大家更多地了解大数据的本质、它的作用、它和机器智能的关系、机器智能的原理和发展过程，以及它们二者对未来产业和社会的影响。本书一共分为七章，分别介绍了数据的作用，大数据的本身，机器智能的原理及其发展过程，大数据思维的核心及其重要性，大数据和机器智能与商业的关系，它们对社会正反两个方面的巨大影响。书中的核心内容来自我在研习社和一些大学商学院讲课的讲义，但是考虑到大家读书和听课毕竟有很大的区别，因此在将讲义改写成书的时候，我在书中增加了大量的案例和历史背景介绍，以方便大家能够系统地了解大数据和机器智能的来龙去脉，以及我们对未来进行分析的依据。

#现在前往

精选留言

TA的推荐