技术资料

量子通信与神经网络的区别 你还不知道神经网络是啥?十分钟教你跟上人工智能热潮

小编 2024-11-24 技术资料 23 0

你还不知道神经网络是啥?十分钟教你跟上人工智能热潮

原作 Jay Shah

Root 编译自 Jay Shah寄几的博客

量子位 出品 | 公众号 QbitAI

最近,神经网络这个词特别火,吸引不少眼球。但是神经网络是个啥?有啥用?

这篇文章和大家唠唠,啥是神经网络,对于初学者来说主要有哪些挑战,以及介绍几种经典的神经网络类型,和相关行业应用。

神经网络的工作原理

基本上,神经网络是由一层一层的不同的计算单位连接起来的。我们把计算单位称为神经元,这些网络可以把数据处理分类,就是我们要的输出。

每个神经元把最初的输入值乘以一定的权重,并加上其他输入到这个神经元里的值(并结合其他信息值),最后算出一个总和,再经过神经元的偏差调整,最后用激励函数把输出值标准化。

迭代的学习过程

神经网络有个很关键的特征,它的学习过程是迭代的。也就是说,在学习期间,处理数据的过程会不断重复,而且为了准确预测输入值的分类,每次都会调整和输入数据有关的权重。

神经网络的优点,在于他们对很乱的数据的容忍度很高,同时也有很强的分类能力,连未训练的数据也能区分出来。

而最受欢迎的神经网络算法,是反向传播算法。

为了解决某个特定问题,神经网络要得到足够的训练。在训练最开始的时候,初始权重是随机定的。

如果在输出层得不到期望的输出值,则取输出与期望的误差的平方和作为目标函数,转入反向传播,逐层求出目标函数对各神经元权值的偏导数,构成目标函数对权值向量的梯量,作为修改权值的依据,网络的学习在权值修改过程中完成。误差达到所期望值时,网络学习结束。

神经网络通过隐藏层里的权重和函数,一次处理训练集里的一组数据,然后

把输出值和实际结果作对比。 然后把误差返回给整个网络系统,针对要解决的问题来调权重。再输入下一组数据,看偏差值有没有变小。

这个过程要不断地反复调整权重。所以在训练的过程中,同一组数据会被处理很多次,直到每一层的权重都被精细地调校过。

这个过程有多困难呢?

对于神经网络的初学者来说,其中的一个挑战是要理解每一层有什么用。我们知道,在训练过后,每一层都会抽取出来输入值的高阶或更高阶的特征,直到最后一层决定输入的特征所指的是什么。那这个过程是怎么完成的?

与其指定神经网络最后放大的特征,还不如让神经网络自己得出来。

由于神经网络的每一层的处理,是不同维度的抽象特征。所以强化哪一层,会对最后的值的特征的复杂性有不同的影响。而在我们选了其中一个层后,就可以看到神经网络最后增强了什么的特征。

流行的神经网络类型及其应用

接下来,我们会了解一下自动编码器,卷积神经网络和循环神经网络。

自动编码器

根据之前的经验,随机初始化的结果并不好。所以为了获得更好的初始权重,我们可以考虑用无监督学习算法来预训练每个层。

类似的例子,可以参考被无监督算法训练的Deep Belief Networks。 最近,有一些新的研究尝试在这个领域寻找突破,比如,使用概率自动编码器的变分方法。

不过实际上,它们很少被用到。 最近,对于更深的神经网络来说,已经可以进行批量地标准化。通过残差学习,我们能从头开始训练任意深度神经网络了。在适当的维度和稀疏性的约束下,自动编码器可以学习到,比PCA或其他基本技术更有趣的数据投影。

我们来看看两个有趣的自动编码器的实际应用:

医学图像的降噪

通过卷积层,自动编码器实现高效降噪。

降噪自动编码器,就是设定为忽略某些输入的

在随机干扰过程中,通过随机地将一些输入数据设为零,让降噪自动编码器自己判断哪些是丢失(损坏)的值,从而预测出哪些是丢失模式的子集。

数据可视化

用主成分分析(PCA),和t分布随机相邻嵌入(t-SNE)等方法,可以实现降维。 在训练神经网络的时候,结合以上方法,能提高模型的预测精度。而且,多层神经网络的预测精度很大程度上依赖于神经网络结构,预处理的数据,以及该神经网络要解决的问题类型。

卷积神经网络

卷积神经网络,这个名字是来源于“卷积”运算符。 它的主要目的,在于从输入的图像中提取特征。而特征的提取,是通过使用输入数据里3×3的区域学习到的。这样,卷积网络就能够保留像素之间的空间关系。

卷积神经网络在以下领域取得了成功:

人脸识别

级联卷积神经网络,可以快速高效地识别人脸。 检测器先用低分辨率评估输入图像,把非面部区域快速排除掉,再以更高的分辨率,仔细处理并精确检测更复杂的区域。

为了加速检测并提高边框质量,还在级联中引入了校准网络。

自动驾驶

卷积神经网络传统上用于图像分析和目标识别。

在自动驾驶的项目中,空间纵深的估算能力特别重要。没有它,就无法确保乘客和其他车辆的安全。NVIDIA的自动驾驶汽车等项目,就已经开始使用CNN了。

CNN非常灵活,可以通过多层的参数来处理输入,其中还包括深度信念网络(DBN)。

另外,还有个好玩的用法, 可以在游戏模拟器中,用CNN来开车并预测转弯的角度 。

循环神经网络

循环神经网络可以生成序列。每次处理单组的真实数据序列之后,就预测接下来会发生什么。那这种模型是怎么一步一步搭起来的呢?

假设,预测的结果是存在概率分布的话,那么可以反复取各种输入值,产生新的序列。输入值的来源可以是已经训练过的网络的输出值,取得越分散越好。换句话说,让神经网络把自己生成的结果,当作真实世界里产生的数据值,用作输入,就像一个人在做梦一样。梦里那些虚幻不存在的场景,也能成为我们记忆中感知的一部分。

预测

神经网络经过训练后,给定一个输入值,就能得到在预期内的输出值。

如果我们有个神经网络,能够完美地拟合一系列已知的值,那么这个网络也能预测未来的值。

现在,预测股价的模型用得最6。

不同领域里神经网络的应用

在真实的商业环境里,神经网络已经应用很广泛了,比如销售量预测,用户调查,数据有效性,和风险调控。

市场

目标市场与市场细分有关,根据用户不同的消费行为,我们能把市场划分得很细。

按地域分布,经济能力、购买习惯、对产品的态度等维度分类,是神经网络最拿手的事。无监督学习可以自动把有相似属性的用户分类到一起。

零售行业

神经网络用来预测超市的销售量特别有优势,因为它能多维度考虑问题。比如一个产品可能有多大的市场需求量,一个消费者的收入,人口分布,产品价格等方面。

一旦两个商品,在某段时间内他们的销售量存在间接的联系,像一个用户买完打印机之后,很大可能会在3到4个月的时候需要补充新墨盒,那么零售商可以从顾客的购买数据来有效地推产品,避免顾客流失到竞争对手那。

金融行业

神经网络已经成功解决了多个金融类的问题,比如衍生类的保值型理财产品,未来价值的预测,外汇汇率的预测,以及股票市场的表现。以前,是数据技术驱动着软件的发展;现在,神经网络驱动着大家做出更优的理财选择。

医药行业

高效的人体生理系统建模、快速检测疾病这些方面的工作,需要大量神经网络来支持。大家都很看好未来神经网络在医疗领域大规模的应用。

结论

也许,用神经网络解决实际问题的同时,未来神经网络还能当艺术家创作的工具,混合出新的视觉效果。说不定我们还可以从中发现创意的规律。

总的来说,神经网络让计算机更像人,get到越来越多的技能,可以帮我们做更多的事儿。

原文链接:

http://t.cn/RYqmhBG

— 完 —

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

一文带你看懂什么是神经网络

原作 Jean-Carlos Paredes

Root 编译自 TowardDataScience

量子位 出品 | 公众号 QbitAI

卷积神经网络本身好复杂的说,想入门的小白们迫切希望有个太长不看版。

正好最近,国外最潮的DL学习网站Fast.ai在GitHub分享了个用Excel画的图,简单地解释了下啥是卷积神经网络。原作Jean-Carlos Paredes还特地把要点整理在博客上,顺便给大家介绍下搭建深度学习模型的大概过程。以下是原文。

下面这个图,是简化版的神经网络。

输入层

这个数字7的图像数据是MNIST数据集里的(默认大家都是用预训练模型来分类)。

第1个隐藏层

隐藏层从输入数据中提取出更复杂的特征,传给输出层,从而做出更好的评估。

两个过滤器将负责处理不同的形状。第一个过滤器负责检测水平边缘,第二个过滤器负责检测垂直边缘。 这个3x3过滤器被称为卷积核 。 如果检测到输入图像有水平边缘,那过滤器1就会被激活。 Conv1(下图右侧区域)显示,从输入值中取出3x3的区域后,乘以卷积核,会让两个过滤器都被激活。 看下图会更好理解。

尽管这是用二维数组表示的,但按道理来说,它们是一个张量 。 每个矩阵表示张量中的一个切片。以上这些都是线性代数的行运算。

= SUM(F11:H13 * $ AD $ 11:$ AF $ 13)表明在用卷积。

该总和将导致输入中该特定3×3区域的激活值为3。

这可以代表单层

激活函数

接下来,为了把负数去掉,我们用ReLU激活函数作非线性单位。处理后,下一张照片的负数就消失了。

第2个隐藏层

接下来,作为下一个隐藏层,Conv2会用乘积和函数权衡两个Conv1矩阵。 这里的卷积核将代表一个2X3X3的张量。

在使用ReLU函数之后,我们现在来创建第二层。

第1层和第2层

最大池化

在Conv2中(下图的左侧部分),最大池化的高度和宽度的分辨率仅为2x2的最大值的一半。 在最大池化的矩阵中,我们可以看到Conv2的2x2区域的最大值,即33(小蓝框的左下角和右下角都是)。也就是说,池化的计算速度比卷积更快。 此外,池化还能有一些平移不变性 。

输出层

然后,我们把层都全部连接起来,并给最大池化中的所有的激活值用矩阵函数加个权重。

最后,在Excel中,算出激活值和权重的乘积和。完全连接的层(密集层)对卷积层提取的特征分类,并经最大池化层处理向下取样。而不必像以前那样,在卷积层中解析每个部分。

这篇文章呢,就只举数字7这个例子,代表一个数字类的识别过程。大家可以试试拿其他数字练个手,遇到啥不懂的就查一下原文和GitHub呗ヾ(o◕∀◕)ノ

原文链接及fast.ai做的Excel表链接:

https://towardsdatascience.com/understanding-convolutions-using-excel-886ca0a964b7

https://github.com/fastai/fastai/tree/master/courses/dl1/excel

— 完 —

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

相关问答

“对抗性 神经网络 ”是什么?

我是萌新程序猿,科技圈的事情欢迎邀请我来回答!对抗性神经网络又称作生成对抗网络,英文:GenerativeAdversarialNetwork,简称GAN。对抗性神经网络的诞生...

【麻烦简单介绍一下 量子力学 】作业帮

[最佳回答]不喜欢复制人家的东西,我就自己所了解的回答一下.量子力学和老爱的相对论是同一个时代的成果.但却和相对论的一些理论相悖,老爱一直推崇这个宇宙的...

世界最顶端的信息技术?

答:量子通讯技术是我国在通讯领域的世界第一。量子通讯技术是根据量子的不确定性,来实现随时发送密钥,再通过传统的加密算法,确保密钥不会被破解。换句话说,...

人工智能 神经网络 中的基础概念有哪些?

以下给出简单介绍,关于神经网络的学习方式以及深度神经网络的更多内容,欢迎到作者主页查看系列文章《神经网络与深度学习概述》。神经网络全称人工神经网络(A...

未来是否可以把人类大脑的 神经 元与人工智能结合起来,实现人机一体?

然而这仅仅是搞开发试验,也不一定成功。机器人的发展有它们自己升级的空间,根据人类对它们的喜好,稍加改造,会让它们跟人一样聪明,根本不需要费力不讨好的人...

量子 计算机与光子计算机生物计算机哪个更强?

量子计算机、光子计算机和生物计算机都是新兴的计算机技术,各自具有不同的应用优势。因此,无法简单地判断哪种计算机更强大,而需要根据具体的应用场景和需求来...

请问 量子 力学与脑科学有什么关系?

有联系,算法上可以建立的联系。认知,神经网络,方法学上,也是有一定联系的。听说去有些牵强实际这方面的跨领域研究是有的,看你从哪方面论述了。有联系,算法...

你觉得人类的意识是否可以用 量子 力学来解释?为什么?

人的意识不需要用量子力学来解释,到原子层面就足够了。人的意识由大脑产生,大脑中每天都会发生上亿次微观化学反应,人的情绪情感都是由脑中的化学物质控制的...

量子 成对纠缠,实现远距离 通信 ,是不是如科学家所说,真的无法破解?

量子纠缠并不能携带信息,所以所谓量子加密并不是用量子纠缠作为加密信道来传输需要保密的数据,而是用量子纠缠现象像发送方和接收方生成并分发加密数据所需的...

如何控制 量子 纠缠?

量子纠缠是一种量子力学现象,它描述了两个或更多粒子之间的非常特殊的关联状态。控制量子纠缠需要使用适当的实验技术和量子设备。以下是一些控制量子纠缠的...

 竹板  鬼街 

猜你喜欢