中国移动研究院常耀斌：主流人工智能技术栈的深度探讨和实践总结

发布时间：2019-04-26 17:08:37 所属栏目：建站来源：常耀斌

导读：副标题#e# 导语：这几年人工智能技术之所以能够获得快速发展，主要是有三个元素的融合：神经元网络、芯片以及大数据。人工智能是让机器像人一样思考甚至超越人类，而机器学习是实现人工智能的一种方法，它最基本的做法是使用算法来解析数据、从中学习，然后

然后，分析一下人工智能平台分析引擎的处理过程。分析引擎的主要技术是机器学习和深度学习。机器学习框架涵盖用于分类，回归，聚类，异常检测和数据准备的各种学习方法，也可以包括神经网络方法。深度学习框架涵盖具有许多隐藏层的各种神经网络拓扑，包括模式识别的多步骤过程。网络中的层越多，可以提取用于聚类和分类的特征越复杂。常见的深度学习框架有Caffe，CNTK，DeepLearning4j，Keras，MXNet和TensorFlow。其中Deeplearning4j是应用最广泛的JVM开源深度学习工具，面向Java、Scala和Clojure用户群。它旨在将深度学习引入生产栈，与Hadoop与Spark等主流大数据框架紧密集成。DL4J能处理图像、文本、时间序列和声音等所有主要数据类型，提供的算法包括卷积网络、LSTM等循环网络、Word2Vec和Doc2Vec等NLP工具以及各类自动编码器。Deeplearning4j自带内置Spark集成，用于处理在集群上开展的分布式神经网络训练，采用数据并行来将网络训练向外扩展至多台计算机，每个节点靠一个(或四个)GPU运行。

深度学习框架的计算需要大量的图像数据，数据从前端传输到后端进行预处理，然后进行标注，获得训练数据集。数据整理好之后，进行模型训练，这是一个计算和通信非常密集的过程;模型训练完之后，我们进行推理预测，其主要是一个前向计算过程。其需要对批量样本的高吞吐高并发响应和单个样本的低延时响应。下面以图像识别的过程为例说明如下：

1. 数据的采集和获取：

是通过物联网传感器，将光或声音等信息转化为电信息。信息可以是二维的图象如文字、图象等，可以是一维的波形如声波、心电图、脑电图，也可以是物理量与逻辑值。

2. 数据预处理：

包括AD、二值化、图象的平滑、变换、增强、恢复、滤波等, 主要指图象处理。

3. 特征抽取和选择：

在模式识别中，需要进行特征的抽取和选择，例如，一幅64x64的图象可以得到4096个数据，这种在测量空间的原始数据通过变换获得在特征空间最能反映分类本质的特征。这就是特征提取和选择的过程。

4. 分类器设计：

分类器设计的主要功能是通过训练确定判决规则，使按此类判决规则分类时，错误率最低。

5. 分类决策：

在特征空间中对被识别对象进行分类。

最后，探讨人工智能平台分析引擎的深度学习，它是如何针对多层神经网络上运用各种机器学习算法解决图像、文本等问题?深度学习从大类上可以归入神经网络，不过在具体实现上有许多变化。深度学习的核心是特征学习，旨在通过分层网络获取分层次的特征信息，从而解决以往需要人工设计特征的重要难题。深度学习是一个框架，包含多个重要算法: CNN卷积神经网络、AutoEncoder自动编码器、Sparse Coding稀疏编码、RBM限制波尔兹曼机、DBN深信度网络、RNN多层反馈循环神经网络神经网络，对于不同问题(图像，语音，文本)，需要选用不同网络模型才能达到更好效果。

重点讲一下卷积神经网络，它就是至少包含一层的神经网络，该层的功能是：计算输入f与可配置的卷积核g的卷积，生成输出。卷积的目的就是把卷积核应用到某个张量的所有点上，通过卷积核的滑动生成新的滤波后的张量。卷积的价值在于对输入降维能力，通过降维改变卷积核的跨度strides参数实现。设置跨度是调整输入张量维数的方法，strides参数格式与输入向量相同，面临挑战：如果应对输入在边界，可以采用对图像边界填充方式。数据格式NHWC(数目，高度，宽度，通道数)。卷积核的作用常常是增强卷积核中心位置像素的灰度。卷积神经网络CNN主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。

（编辑：西安站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

2/4

首页

尾页