Abstract:本文以简短通俗的语言阐释AI的几个基本概念。AI本质是函数。
1.人工智能
- AI:让机器具备类似人的智能,从而替代人类去完成某些工作和任务
- 强AI:像人类一样去思考和推理,且具备知觉和自我意识(发展处于停滞状态)
- 弱AI:看起来像是智能的,但不会具备知觉和意识
- AI实现:
- 基于规则进行编程:让机器能按照程序中存在的逻辑处理特点任务,从结果上看机器是智能的
- 机器学习:喂给机器大量针对某一任务的数据,让机器自己去学习,继而挖掘出规律,从而具备完成某一任务的智能
如识别狗:
1.基于规则:告诉机器狗的特征,机器去识别出满足这些规则的东西
2.机器学习:不告诉机器狗的特征,但喂给机器10万张狗的图片,机器自己从图片中学习到狗的特征,从而具备识别狗的智能
2.机器学习
从模型层次结构角度划分:浅层学习和深度学习
浅层学习(shadow Learning)
模型层次较浅,通常无隐藏层或只有一层隐藏层(hidden layer)
常见算法:线性回归,逻辑回归,随机森林,SVM,K-means,RBM,AutoEncoder,PCV,SOM等
深度学习(Deep Learning)
- 深:有较多的隐藏层(使得深度学习网络拥有表达更复杂函数的能力,能够识别更复杂的特征,完成更复杂的任务)
- CNN与RNN
- CNN(Convolutional Neural Networks): 计算机视觉最主要的算法
- Prisma:图像风格迁移
- 美颜相机:滤镜
- 交通监控视频识别:识别车牌号
- 商场监控视频:识别人脸
- 无人车:用CV去观察和理解世界
- RNN(Recurrent Neural NetWorks): 循环神经网络
- RNN衍生算法:LSTM、GRU(Gated Recurrent Unit),其拥有时间记忆功能,可用来处理一些具有时间序列属性的数据,适合处理语言、文字
- 应用:语音识别、机器翻译、合成音乐
- 如:对话机器人、讯飞输入法(TTS)
3.AI的本质——函数
AI其实就是我们喂给机器目前已有的数据,机器就会从这些数据里去找出一个最能满足(此处用“拟合”或可提升逼格)这些数据的函数,当有新的数据需要预测的时候,机器就可以通过这个函数去预测出这个新数据对应的结果是什么。
一个具备智能的模型具备三要素:
- 数据:大数据量(只有数据量足够大,模型才能够学习到足够多且准确的区分猫和狗的特征,才能在区分猫狗这个任务上表现出足够高的准确性)
- 算法:神经网络架构的设计(构建模型时我们打算用浅层的网络还是深层的,如果是深层的话我们要用多少层,每层有多少神经元、功能是什么,etc)
相当于我们确定了我们的预测函数应该大致结构是什么样的,我们用Y=f(W,X,b)来表示这一函数,X是已有的用来训练的数据(猫和狗的图片),Y是已有的图片数据的标签(该图片是猫还是狗),函数里的W(权重)和b(偏差)是需要机器学习后自己找出来的,找的过程也就是模型训练的过程。
- 模型: 我们把数据带入到算法中进行训练,机器就会去不断地学习,当机器找到最优W(权重)和b(偏差)后,我们就说这个模型是train成功了,这个时候我们的函数Y=f(W,X,b)就完全确定下来了。