人工智能(Artificial Intelligence, AI),又称机器智能(MI,Machine Intelligence),
主要研究用人工的方法和技术开发智能机器或智能系统,以模仿、延伸和扩展人的智能、生物智能、自然智能,实现机器的智能行为。
简略概括:用机器模拟或实现人类智能。
注:人工智能定义分为四类:
(1)像人一样思考的系统
(2)像人一样行动的系统
(3)理性地思考的系统
(4)理性地行动的系统
近期目标:部分或某种程度实现机器智能,使现有的计算机更灵活好用、更聪明有用。
远期目标:制造智能机器,使其具有看、听、说、写等感知和交互能力,联想、学习、推理、理解等高级思维能力,分析、解决问题和发明创造的能力。
(1)知识表示技术
(2)知识推理、计算和搜索技术
(3)系统实现技术
1956年夏,十位来自数学、心理学、神经生理学、信息论和计算机方面的专家在美国达特莫斯大学召开一次历时两个月的会议,讨论了机器智能有关问题,会上麦卡锡提议用“人工智能”一词,标志人工智能学科的正式诞生。
发展:
(1)推理期
(2)知识期
(3)学习期
传统划分方法:
- 符号主义学派(Symbolicism)(功能模拟)
- 连接主义学派(Connectionism)(结构模拟)
- 行为主义学派(Evolutionism)(行为模拟)
现代划分方法:
1.符号智能流派
2.计算智能流派
3.群体智能流派
(1)叙述性知识(描述问题状态)
(2)过程性知识(描述状态之间变换)
(3)控制性知识(描述如何在当前状态下选择合适操作)
状态空间图
与或图
谓词逻辑
产生式
框架
语义网络
按照有无导向可区分为盲目搜索和启发式搜索
盲目搜索:无向导的搜索,也称穷举搜索。
在搜索过程中,没有任何背景知识作指导,不考虑任何与解有关的信息,随机地按预先规定的顺序(如广度优先和深度优先)机械地生成树的节点,并判断是否为解,直到找到解或证明问题无解为止。
(对于较大或无限状态空间问题,盲目搜索效率太低)
启发式搜索:利用“启发性信息”作为导航的搜索过程。“启发性信息”就是与问题有关的、有利于尽快找到问题的信息或知识,如待解问题解的分布规律、求解该问题的经验、窍门等。(博弈、机器学习、数据挖掘、智能检索等)
深度优先效率高,可能进入无限分支,在问题有解的情况下肯找不到解,并且不能保证是最优解。
宽度优先效率低,但是如果问题有解,一定能找到解,而且是最优解。
OPEN表:动态数据结构,登记记录当前待考察的节点
CLOSED表 :动态数据结构,记录考察过的节点。
归结原理是鲁冰逊在1965年提出的,又称消解原理
通常使用归结反演方法(反证法)
(1)消去蕴含词和等值词
(2)缩小否定词的作用范围,使否定词仅作用于原子公式。
(3)变量标准化
(4)消去存在量词,同时进行变量替换:
A.存在量词不再全称量词辖域内,此时消去存在量词,用一个新的个体常量;
B.存在量词出现在全称量词的辖域内,此时消去存在量词,并用一个全称量词约束的变量的函数代替存在量词辖域内的约束变量,这个函数被称为Skolem函数。
(5)消去所有全称量词
(6)将公式化为合取范式
(7)适当改名,使子句之间不含同名的指导变量。
(8)消去合取词,以子句为元素组成一个集合S。
(1)简化性策略
删除策略(删除新生成的类含于已有的)
(2)限制性策略
支持集策略(至少有一个非G中或者后裔的子句)
线性归结策略(必须有一个是推出的)
祖先过滤型策略(要么至少有一个是原始子句集中的,要么一个是另一个祖先)
语义归结策略
(3)有序性策略
单元归结策略(必须有一个单元子句)
优点:形式单一,处理规则十分简单
缺点:在变换子句集的过程中许多重要语义信息都丢失了,保留下来的仅仅是形式上的一种逻辑关系,对应于启发搜索和人机交互带来了很多困难。
自然演绎推理
归结演绎推理
基于规则的演绎推理
正向演绎推理
反向演绎推理
双向演绎推理
不确定性推理:
指从不确定的初始证据出发,运用不确定性知识,推出既保持一定程度的不确定性又合理或基本合理结论的推理过程。
不确定性推理 = 符号推演 + 不确定性计算
(1)随机不确定性
即知道会发生的所有结果,但不知道发生哪个,而且知道每个发生的概率。
(2)模糊不确定性
就是指没有标准(例如:小王是高个子)。
(3)不完全性
就是指对某事物了解不完全。
(4)不一致性
就是指随着时间推移,前后结论不相容。
(1)不确定性的表示与度量
(2)不确定性的匹配算法
(3)不确定性的计算与传播
注:确定性理论和证据理论解决随机不确定性
模糊推理解决模糊不确定性
学习:系统在不断重复的工作中对本身能力的增强和改进,使得系统在下一次执行同样任务或类似任务时会比现在做得更好或效率更高(西蒙)。
机器学习:实现通过经验来提高对某任务处理性能的行为的计算机程序。
注:模型可换为知识库
环境:提供外界信息
学习环节:处理环境提供的信息并接收执行环境的反馈信息,以便改善知识库中的知识,满足性能要求
知识库:学到的知识
执行环节:测试所学习到的知识的性能
是指用计算机来分析、处理自然语言,让计算机理解并能表达自然语言,实现人与计算机的自然语言交流。(IBM Watson核心)
(1)语音分析:
(2)词法分析:识别和词性判断
汉语分词有哪些方法
(1)基于词的方法(与已有的词表进行匹配)
(2)基于字的方法(根据字在词中的位置进行标记,然后扫描)
(3)句法分析(语法分析):判断是否合法
分为句法结构分析和依存关系分析
(4)语义分析:一段文字的意义
A.词义消歧
方法:
基于知识的方法
基于监督学习的方法
基于无监督学习的方法
B.语义角色标识
(5)语用分析
3.自然语言的特点
(1)新词不断出现,很难完全收入词典
(2)自然语言的表达非常灵活,很难完全形式化
(3)自然语言充满歧义,很难完全消解
读音、分词、词性、句法结构、词义歧义
(4)自然语言中有各种语言创新,机器很难应付