人工智能从1955年走上人类历史舞台以来,表现出内涵性、渗透性和支撑性的特点。特别是近年来在大数据、互联网、物联网等信息环境推动以及新的算法、模型和硬件助力下,人工智能在自然语言理解、语音识别、视觉分析和数据挖掘等领域取得了显著进展,成为社会经济发展的引擎。
本系列课程从搜索推理,机器学习,博弈对抗和伦理安全等角度成系统介绍人工智能的基本概念和基础算法,帮助学习者了解人工智能的历史和趋势,模型与方法,应用及挑战,了解人工智能通过自然语言理解,视觉分析和语音识别等手段赋能实体经济。
包括如下:探索求解、逻辑与推理、监督学习、无监督学习、深度学习、强化学习、博弈与伦理和安全。
第一讲 人工智能概述
1.1 可计算思想起源与发展
计算的诞生
20世纪初,对于可计算问题和不可计算问题的猜想
费马定理
整数n>2时,关于x,y,z的方程 xn + yn = zn 没有正整数解
孪生素数
相差2的素数对,是否存在无穷多个素数p, 使得p+2是素数。
世界三大数学猜想
- 费马猜想 1994年由英国数学家Andrew Wiles 完成,费马大定理
- 四色猜想 1976年由美国数学家Kenneth Appel与Wolfgang Haken借助计算机完成,四色定理
- 哥德巴赫猜想尚未解决 (任何不小于4的偶数,都可以是两个质数之和)
问题: 可计算与不可计算,可解与不可解
- 原始递归函数(哥德尔 Godel)
- 图灵机(Turing)
- lambda验算 (丘奇, Church)
不可计算:图灵机不可停机
On Computable Numbers, with an Application to the Entscheidungsproblem,1937
图灵奖:计算机界最高奖(1966年设立)
图灵测试
1.2 人工智能的发展简史
四位学者在1955年提出人工智能术语及研究范畴
- John McCarthy
- Marvin Lee Minsky
- Claude Shannon
- Nathaniel Rochester
A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence, 1955, Dartmouth
值得关注的七个问题
- Automatic Computers
- How Can a Computer be Programmed to Use a Language
- Neuron Nets
- set of (hypothetical) neurons be arranged so as to form concepts
- Theory of the Size of a Calculation
- Self-improvement:自我学习与提高
- Abstractions: 归纳与演绎
- Randomness and Creativity
AI 的三次低谷
- 1973年英国发表James lighthill报告,评判AI基础研究中的自动机、机器人、中央神经系统
AI winter
Sir James Lighthill, Artificial Intelligence: A General Survey, Science Research Council, 1973)
AI尚属婴儿期,难以测算准确 - 日本智能(第五代)计算机研制失败
- 1982年日本通产省主持第五代计算机
- 从存储数据向直接推理与知识处理的新型结构过度
- 1992年研制失败
驱动AI的发展要靠软件、数据和知识,而非硬件
3.知识词典日趋式微,网络百科兴起
- 斯坦福1984年通过专家来建设知识百科全书Cyc
- 90年代后期衰败,搜索引擎崛起
- Cyc开始链接外部知识库
知识不能靠专家表达,要自动学习
1.3 人工智能研究的基本内容
从典型任务、应用对人工智能分类(上世纪70年代以来)
- 机器定理证明(逻辑和推理),仿解题者
- 机器翻译(自然语言理解),仿译者
- 专家系统(问题求解和知识表达),仿专家
- 博弈(树搜索),仿译者
- 模式识别(多媒体认知),仿认知者
- 学习(神经网络),仿初学者
- 机器人和智能控制(感知和控制),仿生物
形成了符号学派,连接学派,行为学派
从智能角度分类
- 领域人工智能
任务导向,依葫芦画瓢,Deep Blue,AlphaGo - 通用人工智能(跨领域人工智能)
举一反三,从经验中学习 - 混合增强人工智能
- 人类智能+机器智能:达芬奇外科手术机器人
- 外骨骼机器人
- 人、机、物、网互联:智慧城市系统
Traditional AIArtificial General Intelligencefocus on having knowledge and skillsfocus on acquiring knowledge and skillsaction acquiring via programmingability acquiring via learningdomain-specific ability via rule-based and example-basedgeneral ability via abstraction (intuition) and context (common sense)learning by data and ruleslearning to learn
人工智能历史上的主流方法:
- 用规则教
符号主义人工智能(symbolic AI)
用规则教
符号逻辑表示下的推理 ———— 知识图谱
1997, IBM DeepBlue
2011, IBM Watson
知识图谱 数据库
问题输入 —— 问题理解 主题分析 - 潜在答案搜索 - 答案合成 - 置信度 计算和排序 - 答案输出
David Ferrucci, et.al., Building Watson: An Overview of the DeepQA Project, AAAI 2010
- 用数据学
数据驱动的人工智能(data-driven AI)
用大数据学(有监督)
挖掘数据所蕴含的内在模式 ———— Visualized hierarchical learning patterns
- 从经验中学
用问题引导(反馈牵引)
从经验中的策略学习
Reinforcement Renaissance, Communications of the ACM, 2016,59(8):12-14
人工智能历史上的主流学习方法
学习模式优势不足用规则教与人类逻辑推理相似,解释性强难以建立完备的知识规则库用数据学直接从数据中学深度学习:依赖于数据、解释性不强用问题引导从经验中进行能力的持续学习非穷举式搜索而需要更好策略
从数据到知识与能力,能力增强是最终目标,综合利用三种方法
1.4 新一代人工智能 (AI2.0)
三波人工智能浪潮
first wave(rule-based)符号主义人工智能为手段 (以语言和可描述信息处理为主)second wave(statistical-learning-based)以模型假设的机器学习为手段(在数据建模基础上,从数据中学习模式)third wave(theory and applications)以自适应和推理为核心目标(human-like communication and reasoning capabilities)
AI2.0
- 本世纪信息环境已发生巨大深刻变化
世界已从二元空间结构PH(physics,Human Society)变为三元空间结构CPH(Cyber) - 对AI需求大爆发
- AI目标和理念大改变
由“用计算机模拟人的智能”变为:
机器+人:人机融合智能系统
机器+人+网络:群智系统
人、机、网、物相加:智能城市等复杂智能系统 - AI的数据基础大改变
三步走、四大任务、五大智能技术方向
三步走四大任务五大智能技术2020:同步构建科技创新体系大数据智能2025:部分领先把握技术属性和社会属性高度融合群体智能2030:AI创新中心“三位一体”推进跨媒体智能
支撑国家发展混合增强智能
自主无人系统
five features
- From rule-based logic reasoning inference to data-driven knowledge learning
- From single media data processing to cross-media learning and reasoning
- From machine intelligence to Human-machine hybrid-augmented intelligence
- From individual intelligence to collective intelligence (crowdsourcing intelligence)
- From robots t autonomous unmanned systems
1.5 案例
完全信息条件下博弈
AlphaGo:从数据驱动学习到策略能力提升(数据+强化学习)
第二代AlphaGo:AlphaGo Master仅进行强化学习(利用exploitation与探索exploration的有机协调和统一
AlphaGo Zero: starting tabula rasa
非完全信息条件下博弈
- Hidden information
- Uncertainty about future events
- Deceptive strategies needed in a good player
- Very large game tree
无限注德州扑克程序Libratus
从经验中进行策略学习的人工智能能力
Libratus由纳什均衡、残局终结和自我学习三个模块组成,涉及到蒙特卡洛采样、反事实悔值最小和强化学习等算法
Deepstack
基于深度学习,采用递归推理来处理信息不对称性,以及引入直觉进行自我能力提高