数学与计算

什么是神经网络

字号+ 作者:admin 来源:小丑鱼-分享科普知识 2019-11-04 18:06

如果计算机能够在没有精确说明的情况下自行解决问题,那将不是一件很美好的事情吗?神经网络具有这一希望,但科学家必须谨慎使用它们-否则冒险发现它们已经完全解决了错误的问题,詹妮尔沙恩(Janelle Shane)写道 生成游戏:由卷积神经网络生成的重力透镜图像,用于训练另一个神经网络以识别新的重

  如果计算机能够在没有精确说明的情况下自行解决问题,那将不是一件很美好的事情吗?神经网络具有这一希望,但科学家必须谨慎使用它们-否则冒险发现它们已经完全解决了错误的问题,詹妮尔·沙恩(Janelle Shane)写道

  

什么是神经网络

 

  生成游戏:由卷积神经网络生成的重力透镜图像,用于训练另一个神经网络以识别新的重力透镜。(摘自:Emergent Scientist 2 1,CC BY 4.0 J Pearson et al。,EDP Sciences,2018年出版)

  什么是神经网络?

  人工神经网络是一种机器学习算法,其结构大致基于人脑。像其他类型的机器学习算法一样,它们可以通过反复试验解决问题,而无需明确遵循规则进行编程。它们通常被称为“人工智能”(AI),尽管它们不如科幻小说AI先进,但它们可以控制自动驾驶汽车,提供广告,识别人脸,翻译文字甚至帮助艺术家设计新绘画 –或使用“突然的松木”和“淡灰色”之类的名称创建奇异的新油漆颜色。

  神经网络如何工作?

  神经网络最早是在1950年代开发的,用于测试有关人脑中相互连接的神经元存储信息并对输入数据做出反应的方式的理论。就像在大脑中一样,人工神经网络的输出取决于其虚拟神经元之间的连接强度–除非在这种情况下,“神经元”不是实际的细胞,而是计算机程序的连接模块。当虚拟神经元多层连接时,这称为深度学习。

  一个学习过程会通过反复试验来调整这些连接强度,从而尝试最大化神经网络在解决某些问题上的性能。目标可能是匹配输入数据并对网络之前从未见过的新数据做出预测(监督学习),或者最大化“奖励”功能以发现问题的新解决方案(强化学习)。通常针对每个问题量身定制神经网络的体系结构,包括其神经元的数量和排列,或专用子模块之间的分工。

  为什么我听到这么多关于他们的消息?

  廉价云计算和图形处理单元(GPU)的可用性不断增长是神经网络兴起的关键因素,这使它们既强大又易于访问。大量新培训数据的可用性,例如带有标签的医学图像,卫星图像的数据库或客户浏览历史记录,也有助于增强神经网络的功能。此外,Tensorflow,Keras和Torch等新的开放源代码工具的泛滥,使来自各个领域的程序员和非程序员都可以访问神经网络。最后,成功将带来成功:随着神经网络在商业应用中的价值越来越明显,开发人员寻求了新的方法来利用其功能-包括使用它们来辅助科学研究。

  神经网络擅长什么?

  他们擅长匹配模式并在高度多元的数据中发现细微的趋势。至关重要的是,即使程序员不知道如何提前解决问题,他们也会朝着自己的目标迈进。这对于解决方案复杂或理解不足的问题很有用。例如,在图像识别中,程序员可能无法写下所有用于确定给定图像是否包含猫的规则,但是如果有足够的示例,神经网络可以自行确定重要特征。同样,神经网络可以学习识别行星运输的特征却没有被告知哪些功能很重要。它所需要的只是一组与行星轨道相对应的示例星光曲线,以及另一组与之不同的光曲线。这使得神经网络成为异常灵活的工具,而神经网络框架具有专门用于任务的“风味”,例如对数据进行分类,进行预测以及设计设备和系统,这只能增加其灵活性。

  

什么是神经网络

 

  尚未准备就绪:神经网络可以学习模仿数据集,包括油漆颜色名称列表。但是,他们的结果可能需要人类专家进行审查。

  神经网络也特别适用于生成太多数据以至于不易于分类或存储的项目,尤其是在可以容忍偶尔的错误的情况下。通常,它们用于标记感兴趣的事件以供人工检查。例如,在2017年对系外行星候选者的研究中,谷歌大脑的软件工程师Christopher Shallue和德克萨斯大学奥斯汀分校的天文学家安德鲁·范德堡(Andrew Vanderburg)使用神经网络搜索了候选光曲线列表,以寻找最可能与真实行星过渡相对应的那些。结果使他们能够减少候选人数量超过一个数量级。在另一个天文学应用中,瑞士萨维尼天文台的一个团队使用神经网络检查了巨大的数据集寻找可能包含重力透镜的图像。其他小组使用神经网络分类器来识别来自CERN的大型强子对撞机的数据中的罕见,有趣的碰撞事件。

  另一种神经网络可以基于输入数据生成预测。在给出其他纳米颗粒及其吸收光谱的例子之后,这种类型的网络例如已经被用于基于纳米颗粒的结构来预测其吸收光谱。这样的网络也被用于化学和药物发现中,例如基于其结构来预测蛋白质和配体的结合亲和力。

  结合称为强化学习的技术,神经网络也可以用于解决设计问题。在强化学习中,神经网络没有尝试模仿示例列表,而是尝试最大化奖励函数的值。例如,控制机器人肢体的神经网络可能会通过反复试验来调整自己的连接,从而最终使机器人的水平速度最大化。另一种算法可能是控制超短激光脉冲的光谱相位,试图最大化当激光脉冲撞击某个分子时生成的两个碎片产物的比率。

  听起来不错!有什么收获?

  因为神经网络算法以其可以管理的任何方式解决问题,所以有时它们会得出并非特别有用的解决方案,并且可能需要专家来检测问题的出处和方式。因此,它们不能代替对问题的良好理解。以下是一些可能的陷阱。

  黑盒解决方案

  通常,神经网络(和其他机器学习算法)不会解释它们如何得出解决方案。这可能会使您很难理解这些解决方案是在利用新的物理学,还是基于错误或一些被忽略的简单效果。机器学习研究充满了算法的轶事,最终得出了看似完美的解决方案,这些解决方案最终源于算法本身的问题。例如,2013年,麻省理工学院林肯实验室的研究人员测试了一种计算机程序,该程序本来可以学习对数字列表进行排序。它取得了完美的成绩,但是程序员通过删除列表发现了它的成功。。(根据算法的奖励函数,删除的列表产生了完美的分数,因为从技术上讲,列表不再是未排序的。)在另一个示例中,机器学习算法用于整形激光脉冲以选择性地使分子破碎。尽管产生的激光脉冲非常复杂,但在许多情况下,主要的结果是激光脉冲强度的整体变化,而不是脉冲的复杂结构。

  为了解决这个问题,研究人员正在研究算法的可解释性,开发用于发现算法如何做出决策的技术。例如,某些图像识别算法现在可以报告哪些像素在做出决定时很重要,而神经元的各个层可以报告他们已学会寻找的特征(例如狗的软耳朵)。

  解决错误的问题

  神经网络的用户还必须确保他们的算法实际上已经解决了正确的问题。否则,输入数据集中未检测到的偏差可能会产生意外的结果。例如,美国斯坦福大学的临床皮肤科医生罗伯托·诺沃亚(Roberto Novoa)描述了一段时间,他和他的同事设计了一种识别皮肤癌的算法-只是发现他们不小心设计了标尺检测器,因为肿瘤已经被拍到与旁边的规模统治者。另一个小组,这次是在华盛顿大学,展示了一个故意错误的算法 从理论上讲,这本来应该将哈士奇犬和狼归为一类,但实际上起着积雪探测器的作用:他们使用一个数据集训练了其算法,在该数据集中,大多数狼图片都有下雪的背景。

  

什么是神经网络

 

  计算不存在的绵羊:Microsoft Azure的图像识别算法主要在这种绿色环境中显示绵羊。类不平衡和过度拟合的现象共同导致算法猜测该类似的绿色景观也包含绵羊。(礼貌:詹妮尔·谢恩(Janelle Shane))

  人类专家的算法的结果进行认真审查可以帮助检测和纠正这些问题。例如,上述关于恒星过境的研究标记了疑似系外行星供人类审查,而不是简单地生成“我们找到了新行星!”新闻稿。这是幸运的,因为大多数“系外行星”原来是算法尚未学会检测的伪像。

  类不平衡和过度拟合

  当研究人员尝试训练数据分类的机器学习算法时,他们经常会遇到称为类不平衡的问题。这意味着他们在一个数据类别上的训练示例要比其他数据类别更多,这在研究稀有事件的研究中通常是这种情况。类不平衡的结果可能是一种算法,它没有足够的数据来取得进展,但是“认为”它正在做得非常出色。援引NASA前沿发展实验室太阳风暴小组最近报道的一个例子,如果太阳耀斑在训练数据集中非常少见,则该算法可以通过预测零太阳耀斑来达到接近完美的精度。对于行星轨道研究而言,这也是一个问题,因为真正的行星轨道是相对罕见的。

  为了解决班级不平衡问题,经验法则是在每个类别中包括大致相等数量的培训示例。数据增强技术可以帮助实现这一目标。但是,使用数据扩充或模拟数据可能会导致另一个问题:过度拟合。这是神经网络最持久的问题之一。简而言之,该算法学会了很好地匹配其训练数据,但是无法将其推广到新数据。一个可能的例子是Google流感算法,该算法在2010年代初成为头条新闻,因为它能够通过跟踪人们搜索流感症状信息的频率来预测流感爆发。但是,随着新数据的开始累积,Google Flu的准确度大大降低,现在人们认为它的成功之处在于由于过度拟合。在另一个例子中,一种算法被认为可以演化出可以产生振荡信号的电路。取而代之的是,英国布里斯托尔的苏塞克斯大学和惠普实验室的研究人员发现,它开发了一种无线电,可以从附近的计算机中接收振荡信号。这是过度装配的一个明显例子,因为该电路只能在其原始实验室环境中工作。

  检测过度拟合的方法是针对模型和数据(未见情况)进行测试。如果模型是在模拟数据(例如重力透镜的模拟图像或模拟物理学)上训练的,这对于确保模型尚未学会使用模拟伪像来说尤其重要。

  结论

  神经网络可能是非常有用的工具,但用户必须小心不要盲目地信任它们。他们令人印象深刻的能力是对批判性思维和人类专业知识的补充,而不是替代。

转载请注明出处。

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。转载请注明seohttp://www.swlxs.com