第5章人工智能的未来发展 5.1人工智能现存的主要问题 随着人工智能领域的大力发展,人工智能对人类生活生产的影响将不断增加。虽然我们在很多领域取得了历史性的成就,但人工智能离我们的目标仍然很远,尚存在许多问题。 首先,到目前为止我们仍然处于弱人工智能阶段,也就是普遍来看都还在处理特定问题的阶段。人工智能强调的是拥有像人一样的能力,虽然人工智能在单个方面超越了人类的能力水平,比如Alpah Go在围棋大赛中、IBM计算机系统沃森在电视智力竞赛中都超越了人类顶尖水平,但是除此之外的能力,比如认知、知识获取等方面都还有很大的差距。智能的重点是系统与环境及目标之间的动态交互反馈关系[1],而现在的专用智能系统在各个方面的能力都还很分散,缺少一种将各个系统组合调用起来的控制中心,所以现在的弱人工智能仍无法通过学习胜任人类的所有工作。 人工智能目前存在的第二个问题是人工数据标注的效率低、成本高。数据采集标注是大部分人工智能算法能够有效运行的关键步骤,标注的质量和规模直接影响AI模型应用效果。对于采集得到的原始数据,需要根据用户或企业不同的需求,对语音、图片、文本、视频等进行不同的标记处理,使机器知道需要识别物体的具体概念。目前的问题是不同行业的标注要求具有差异化,比如在医学成像、自动驾驶、工业质检等领域中,需要利用专业领域的数据定制AI模型应用,然而目前不够细化的人工数据标注达不到新技术的要求。其次,现有数据标注平台普遍采用众包模式来分配标注任务[2],造成标注结果的质量参差不齐、合格率低、标注不完备[3]等问题,这些问题都会影响后续分析结果的准确性。所以目前人工数据标注不仅无法保证用户数据安全性,在效率和质量方面也存在很多亟须解决的问题。 人工智能第三方面的问题在于其通过计算机模拟人类的智能活动,主要是对人类大脑的一种仿生和类比[4],而脑科学的理论体系还没有完整构建起来,因此由这种残缺式“仿生”带来的智能,就会存在很多局限性。所以人工智能技术最新研发领域之一是各国政府倡导的“脑计划”,对于大脑如何处理外部视觉听觉信息等方面还将进一步深入研究,从而对人脑的工作活动进行更好的模拟,以替代人类的更多工作。并且人工智能要达到我们通用智能的目标,不仅需要对大脑如何调控、学习有更彻底的认识,还需要与各个学科交叉融合,比如信息科学、心理学、认知科学和生物科学等,所以对多个学科的深度研究以及融会贯通也是我们面临的挑战。 人工智能导论 第 5 章 人工智能的未来发展 第四个问题是目前数据资源孤岛状态还较为明显,掌握在各组织机构的数据资源还需要进一步地开放才能让人工智推动万物互联到智联万物[5]的进程。数据开放的主要目的是从其他领域的数据中,筛选出本领域相关的所需数据,实现数据融合,从而将多个领域智能地关联起来。然而实现数据融合的基础是针对相同实体在不同领域进行描述的元数据库,人工智能算法可以通过这个元数据库的调用[6],实现对其他领域的数据标注及理解应用。然而,目前我们数据资源的开放共享十分有限,元数据库对算法的普适性不高。 最后,人工智能还存在训练AI模型产生的能耗问题。随着人工智能的不断发展,由此产生的二氧化碳也成倍增加。2012年以来,人工智能的每个进步无疑都需要进行密集型的模型计算,比如2017年的AlphaZero的模型的计算数量是2012年Alexnet的30万倍。目前,超大型数据中心消耗全球2%的电量。全球最大的芯片设备制造商应用材料公司Applied Materials的首席执行官加里·迪克森(Gary Dickerson)预测称,由于材料、芯片制造和设计方面缺乏重大创新,到2025年,数据中心将消耗全球15%的电量。如此之大的能耗占比也是我们需要引起重视的问题。 5.2关于主要问题的思考和反馈 现在全世界有很多科技巨头将目光放在了通用智能上,也就是要求达到全面性的智能化。通用人工智能虽然不要求它有自我意识,但是可以达到人的思维水平,可以像人一样处理各方面的任务。要达到通用智能,就需要让计算机模仿人类拥有的自学能力,那势必需要对人的大脑的学习机理有更加深入的认识和模仿。所以,目前数据需要大量人工标注的问题是达到通用智能首先需要解决的,然后再进一步让其拥有人类的自学能力以及认知能力,最后还要对大脑如何控制调配各项能力进行深入研究和模拟,从而实现通用智能。 1. 人工智能依赖人工数据标注 深度学习可视为一种自动的特征学习方法[7],其所有特征提取的过程,都是一个没有人工干预的训练过程。这个自主特性,在机器学习领域是革命性的。然而目前的问题是,深度学习很大程度上仍依赖于有监督的数据,这意味着需要借助大量的人工标注,从而导致效率低且成本高。 2006年,加拿大多伦多大学的资深机器学习教授Hinton在Science上发表了一篇关于深度学习的开山之作[8]。在这篇文章中,Hinton给出了两个重要结论。 (1) 具有多个隐层的人工神经网络具备更佳的特征学习能力,多层网络之间,每一层都是以前一层提取的特征作为输入,这种层次化的特征提取过程可以叠加,从而让深度神经网络具备强大的特征提取能力; 可通过逐层初始化方式来克服训练上的困难,而逐层初始化是通过无监督的自主学习完成的。 (2) 虽然深度学习在特征提取方面是自主完成的,但是如何让计算机认识到提取的特征的实际意义,就需要人工进行标注了,这个工程量是巨大的。 因此在数据不足的情况下,如何使用弱监督乃至无监督的方式进行学习,这是引发很多人思考的地方。有人提出了三种新的深度学习范式,即以丰富多源的弱监督信息来辅助学习; 算法自驱动、成本效益较高的自主学习; 无监督领域自适应学习。 首先,很多时候我们可以采用弱监督学习的方式来解决需要大量标注信息的问题。我们获取的数据时常具备多种类型的标签,然而往往存在标签噪声。那么,我们考虑通过学习多个源的弱监督信息,来对标签进行更正。也就是将大量的数据连同带有小量噪声的标签,一起送入深度卷积神经网络,检测其中的标签噪声并进行更正[9]。具体采用卷积神经网络和递归神经网络相组合的方式。比如图像语义分割领域,CNN特征提取用于RNN语句生成图片标注; RNN特征提取用于CNN内容分类。学习过程中将图像输入CNN,得到图像的实体类特征表达,利用语义解析生成树方法,将句子分解成语义树,然后一同输入到RNN网络中,利用图像的语义标注与关联结构树进行训练,从而得到预期的结果[10]。 接着介绍一下自驱动、成本效益较高的学习方式。这类方法受到人类学习模式的一些启发,在学习的初期,利用已有的标注数据进行初始化学习,然后在大量未标注的数据中不断按照人机协同方式进行样本挖掘,以增量地学习模型和适配未标注数据。无标注的数据进行样本挖掘采用的是主动样本挖掘(ASM)框架,用最新的检测器进行数据检测,并将检测结果按照信度排序。对于信度高的检测结果,我们直接将其作为其未标注信息; 而对于少量信度低的检测结果,我们采用主动学习的方式来进行标注。最后,利用这些数据来优化检测器性能。在自我驱动、低成本高效益的学习方式中,课程学习[11]和自步学习[12]是一种有效的思路。这些方法首先从任务中的简单方面学习,来获取简单可靠的知识; 然后逐渐地增加难度,来过渡到学习更复杂、更专业的知识,以完成对复杂事物的认知。 最后一种无监督领域自适应学习方法可以适配不同领域数据间的分布,解决目标任务缺乏数据标注的难题,其包括单数据源领域自适应以及多数据源领域自适应。单数据源领域自适应在应用场景中,存在某一领域的可用数据过少的问题。因此,衍生出了一系列迁移学习[13]的方式,以做到跨领域的自适应。也就是通过将学习到的知识从源域迁移到目标域,来提高算法在目标域数据上的性能。多数据源领域自适应更加复杂,要从多数据源向目标域迁移学习的情况。研究人员提出了一种名为“鸡尾酒”的网络,以解决将知识从多种源域的数据向目标域的数据中迁移的问题[14]。鸡尾酒网络用于学习基于多源域下的域不变特征。在具体数据流中,利用共享特征网络对所有源域以及目标域进行特征建模,然后利用多路对抗域适应技术下的扩展,对抗域适应的共享特征网络对应于生成对抗学习,每个源域分别与目标域进行两两组合对抗学习域不变特征。同时每个源域也分别进行监督学习,训练基于不同源类别下的多个softmax分类器。对于每一个来自目标域的数据,我们首先利用不同源下的softmax分类器给出其多个分类结果。然后,基于每一个类别,我们找到包含该类别的所有源域softmax分类概率,再基于这些源域与目标域的混淆度,对分类概率取加权平均得到每个类别的分数。简而言之就是,越跟目标域相识的源域混淆度会更高,意味着其分类结果更可信从而具有更高的加权权值[1518]。 数据标注可视为模仿人类学习过程中的经验学习,相当于人类从书本中获取已有知识的认知行为[3]。虽然目前我们还需要先人为地帮机器标注定义,让计算机不断地识别这些图片的特征,最终实现计算机自主识别[19]。但是通过如上三种方式改善后的弱监督学习,可以更少依赖人工标注的数据,更能够接近像人类一样的经验学习。现在“谷歌大脑”号称具备一定的自学习能力,该项目的计算机科学家杰夫·迪恩说“在训练的时候,我们从来不会告诉机器说‘这是一只猫’。实际上,是系统自己发明或者领悟了‘猫’的概念。” 2. 脑学科研究的不完善 深度学习是脑科学的一种仿生和类比,还存在的一个问题是脑科学的理论体系本身还远远没有完整构建起来,深度学习的关键就在于建立并模拟人脑进行分析学习的神经网络,所以深度学习目前来看还是残缺的。并且我们最终要达到的通用智能,就是需要一个模拟人类大脑的控制中心,从而让机器实现全方位的智能活动。因此,对脑科学研究成果的多样性解读还必须深入[4]。 现在科学家从各个方面获得了对人脑运行机理进行分析的数据,例如观测神经电活动方法、观测释放的化学物质变化等,并针对性地开发了用于观测这些数据的工具。基于对大脑在特定输入信号刺激情况下的反应及神经传导的观察,人们将逐步揭示大脑的工作原理[20]。用计算机进一步实现模拟大脑工作后,我们应该就可以实现更具有人类思维的机器,可以像人类一样做出一些综合决策。具体一点,比如我们以后的自动驾驶技术就需要通过人工智能根据实际动态情况做出综合的高级决策。以Google的自动驾驶实现为例,其整合了Google街景数据来实现自动驾驶,Google汽车使用视频摄像头、雷达传感器以及激光测距器来了解周围的交通状况,并通过一个详尽的地图(来源于Google街景数据),对前方的道路进行导航。这个系统的特点是整合了传统意义上无关的数据(街景数据),通过对数据的认知(街景数据辅助定位),实现了新的目标(自动驾驶)[21]。 至于后续大脑如何调配控制我们的各项能力,我们仍然需要脑学科的更多研究,才能对大脑进行更多的模拟。并且还需要与信息科学、心理学、认知科学和生物科学等相交融,从而实现通用智能。 3. 各领域数据的封闭 对于数据开放,主要是为了融合多个领域的数据,通过一个规范的共享合作平台,人工智能算法可以由此调用所需领域的数据标注及理解应用。2007年,斯坦福大学教授李飞飞等人开始启动ImageNet项目,该项目主要借助亚马逊的劳务众包平台Mechanical Turk(AMT)来完成图片的分类和标注,以便为机器学习算法提供更好的数据集[22]。截至2010年,ImageNet已有来自167个国家的4万多名工作者提供的14197122张标记过的图片,共分成21841种类别。这样可以让资源效益最大化,但是也需要建立完整的制度体系确保资源的规范化使用。 而为了实现不同领域的数据融合,可以利用数据仓库收集存于不同数据源中的数据,将这些分散的数据集中到一个更大的库中,最终用户从数据仓库中进行查询和数据分析。在数据仓库中,元数据具有重要的地位,元数据就是关于数据的数据,我们用元数据统一管理数据仓库中的数据以及数据挖掘工具,并控制整个数据挖掘流程。为了保证对复杂元数据的有效管理和元数据的一致性,我们设计了一种元数据对象模型,系统通过这种对象模型访问元数据,而不需要直接接触元数据库。在经过良好封装的元数据类中包含各种属性和方法,属性表达了相应的元数据值,而方法定义了对相关元数据的各种操作。元数据的存取、更新和管理通过访问这些属性和方法来实现,保证了整个系统的一致性和可维护性[6]。 4. 能源损耗多大 对于人工智能的数据计算量消耗过多能量的问题,我们可以通过提高硬件效率来改善这个问题。许多的初创企业以及英特尔、AMD等公司,都在开发利用光子学等技术的、节能性大幅提升的半导体,来驱动神经网络和其他的人工智能工具。所以杂志Applied Materials的预测假定是依据现有的条件,随着硬件效率的逐步提高以及清洁能源的开发,相信数据中心的能耗会在我们的可接受范围之内。 历史上各类技术的发展从未像人工智能技术这样具备普遍适用的特征。总的来说,人工智能的终极目标是使机器能够自主学习,从而代替需要人类智能才能完成的复杂活动。目前我们发展到了专用人工智阶段,也就是将人类认知传递给机器,机器通过学习,在某一方面具有自动化专业能力。然而为了让机器达到全面性的智能化,可以像人一样处理各方面的任务,我们将目光放到了通用人工智能的研究上。虽然不少人对此提出了质疑,认为这样具有人类思维的全面性人工智能很可能会推翻人类世界。但通过美国哲学家约翰·希尔勒提出的“中文房间实验”,我们可以认识到,即使通用人工智能能够满足人类的各种需求,但与其拥有自我意识不存在递进关系。因此,通用人工智能可以像人类一样拥有自我学习和经验判断的能力,这也只是无限接近人类,帮助人类更好地解决更多问题,无法完全替代或者控制人类。 5.3科学研究方向与产业发展前景 5.3.1科学研究方向 本节从科学研究方向的角度分析人工智能在不同领域的未来,从8个方向简述可能的发展前景。 首先,我们很看好的就有自动驾驶技术,马斯克曾预言下一代特斯拉汽车将可能做到百分百自动驾驶,按照我们现在的技术水平,自动驾驶技术在不远的未来就能实现。 第二个方面就是农业、工业的智能化,很多发达国家的农场只需要少数的人在办公室操作重型机器,未来食品很可能形成少部分人的垄断行业。而工业方面的自动化已经有很大提高,在智能化方面比如工业质检等方面也很让人看好。 第三个方面,人工智能将成为很多国家的战略选择,在过去战场是由军队人数决定,而未来将会成为人工智能的技术游戏,比如智能化无人机,让无人机有一定的“思考”能力,最终达到一定的独立作战能力。否则只要指令信号传输上有些偏差,或稍受干扰,失败将难以避免[23]。这样的智能化无人机可以更加准确地击中目标且不会危及飞行员性命[24]。我们还可以研发出适合海陆空地理条件的智能士兵机器人,此前就有波士顿研发的机器狗曾被设想用来在极端地理位置运送战备物资,但是由于研发机器狗太过繁杂而失败,但是各国一定会加紧研发各种具有战斗能力且能够应对极端环境的智能机器人[25]。 第四个方面,金融领域。比如会计的计算数据等烦琐的操作都会被人工智能的算法取代。2015年,彭博社进行的一项研究发现,全球每天交易的股票中只有百分之十是由真人和投资者进行交易的,绝大多数人都会利用人工智能取得高于竞争对手的优势。 第五,在医学方面,制约医学影像系统发展的主要原因是高级视觉系统本身的缺陷,即从医学扫描器上获得的图像数据可能是模糊的,从而增加了专家系统的复杂性[26]。人工智能可以通过计算机视觉技术对医疗影像精确定位并进行智能诊断,并且可以通过对海量数据的采集分析加快药物研发进程以及提高健康管理服务水平。 第六方面,娱乐领域。许多国际大片的人类演员十分昂贵,一场投资几亿美元的电影如果将角色通过人工智能变为虚拟人物,那不仅可以更加灵活地操纵角色,还不会受到明星的负面影响。 第七个方面,人机结合。相信在不久的未来,不论人类具有身体疾病抑或是精神性疾病,都可以采用人工智能解决。 第八个方面,智能居家。未来人们的生活场所可能会普遍走向全智能化,不仅生活中的所有事物都是智能互联的,而且大小事宜都会有智能生活管家服务,你的居家场所可以和工作、医护场所等有更高的相通性,从而在家可以做我们目前需要出门做的多数事情。 5.3.2产业发展前景 本节从产业发展情景的角度分析人工智能未来的宏观发展趋势,其中囊括了科学研究层面,有产业应用层面,也有国家战略和政策法规层面。在科学研究层面特别值得关注的趋势是从专用到通用,从人工智能到人机融合、混合,学科交叉借鉴脑科学等。 1. 从专用智能到通用智能 如何实现从专用智能到通用智能的跨越式发展,既是下一代人工智能发展的必然趋势,也是研究与应用领域的挑战问题。通用智能被认为是人工智能皇冠上面的明珠,是全世界科技巨头竞争的焦点。美国军方也开始规划通用智能的研究,他们认为通用人工智能和自主武器,显著优于现在人工智能技术体系发展方向,现有人工智能仅仅是走向通用人工智能的一小步。 2. 从机器智能到人机混合智能 人类智能和人工智能各有所长,可以互补。所以人工智能一个非常重要的发展趋势,是From AI to AI,两个AI含义不一样。人类智能和人工智能不是零和博弈,“人+机器”的组合将是人工智能演进的主流方向,人机共存将是人类社会的新常态。 3. 从“人工+智能”到自主智能系统 人工采集和标注大样本训练数据,是这些年来深度学习取得成功的一个重要基础。比如要让人工智能明白一副图像中哪一块是人、哪一块是草地、哪一块是天空,都要人工标注好,非常费时费力。此外还有人工设计深度神经网络模型、人工设定应用场景、用户需要人工适配智能系统等。所以有人说,目前的人工智能有多少智能,取决于付出多少人工,这话不太精确,但确实指出了问题。下一步发展趋势是怎样以极少人工来获得最大程度的智能。人类看书可学习到知识,机器还做不到,所以一些机构例如谷歌,开始试图创建自动机器学习算法,来降低AI的人工成本。 4. 学科交叉将成为人工智能创新源泉 深度学习知识借鉴了大脑的信息分层与层次化处理原理。所以,人工智能与脑科学交叉融合非常重要。Nature和Scince都有这方面成果报道。例如,Nature发表了一个研究团队开发的一种自主学习的人工突触,它能提高人工神经网络的学习速度。但大脑到底怎么处理外部视觉信息或者听觉信息的,很大程度还是一个黑箱,这就是脑科学面临的挑战。这两个学科的交叉有巨大创新空间。 5. 人工智能产业将蓬勃发展 国际知名咨询公司预测,2016年到2025年人工智能的产业规模将几乎直线上升。国务院《新一代人工智能发展规划》提出,2030年人工智能核心产业规模将超过1万亿,带动相关产业规模超过10万亿。这个产业是蓬勃发展的,前景显然是巨大的。 6. 人工智能的法律法规将更加健全 大家很关注人工智能可能带来的社会问题和相关伦理问题,联合国还专门成立了人工智能和机器人中心这样的监察机构。 7. 人工智能将成为更多国家的战略选择 一些国家已经把人工智能上升为国家战略,包括智利、加拿大、韩国等等,一定会有越来越多的国家做出同样选择。 8. 人工智能教育将会全面普及 教育部专门发布了高校人工智能的行动计划。国务院《新一代人工智能发展规划》也指出,要支持开展形式多样的人工智能科普活动。美国科技委员会在《为人工智能的未来做好准备》中提出全民计算机科学与人工智能教育。 5.4未 来 展 望 人工智能是引领未来的战略性技术。因此,世界主要发达国家都争先恐后地把发展人工智能作为重大战略,用以提升国家竞争力、维护国家安全、重塑发展新优势。人工智能已成为经济发展的新引擎、社会发展的加速器,人工智能技术正在渗透并重构生产、分配、交换、消费等经济活动的各个环节,形成从宏观到微观各领域的智能化新需求、新产品、新技术、新业态,改变人类生活方式甚至社会结构,实现社会生产力的整体跃升。 对我国而言,发展新一代人工智能有利于两股巨大机遇浪潮的交汇,即“工业化、城镇化、绿色化”+“智能化”,从而创造出大量以智力竞争为特点的产业新天地,发展出智能城市、智能制造、智能经济、智能交通、智能科技等等,促进我国经济转型升级,促进“两个百年”目标的实现,也为全世界发展中国家的经济跃升提供新的发展模式。 众所周知,60年前提出的人工智能信息化的基础是计算机。早在1956年,科学家们就首次确立了AI的概念,让机器能像人那样认知、思考和学习。如今,人工智能已显露出走向2.0的大量新特征。以大数据智能、跨媒体智能、人机混合增强智能、自主智能系统等为代表的人工智能2.0关键理论与技术,将全面推动智能城市、智慧医疗、智能制造等产业的发展,未来的世界将发生翻天覆地的变化。 在研究人工智能过程中,发现原有人工智能的目标——“让计算机变得和人一样聪明”已经取得了一些成绩。一些走在前沿的人工智能专家认为应该把人的智能和计算机的智能结合起来,就是把人工的智能和自然的智能结合在一起,最后形成一个更强的智能系统。 过去是人机交互的界面,现在已经实现了人和机器融合一体化的工作方式,包括系统,比如说脑机系统。所以,如果把这两种智慧融合在一起,会创造出更强大的智慧,对此,有专家认为人工智能将在以下五大领域重点突破。 第一个领域主要关注大数据智能,这是建立在大数据基础上的智能,深度神经网络是其中重要的内容之一,还包括其他内容,比如语义网络、知识图谱自动化,还有自我博弈系统。把人工智能1.0和2.0技术混合在一起,会产生新的大数据智能化的各种各样的技术。 第二个领域是跨媒体智能。过去的多媒体技术包括图像处理、声音处理等多种技术,但这些技术都是分开进行的,而人在处理这些情况的时候,是同步进行的,人工智能2.0将会瞄准这个方向进行。 第三个领域叫群体智能。就是用人工智能方法组织很多人和计算机联合去完成一件事情。实际上人工智能1.0已经有这个技术的苗头,叫多智能体系统,但是这个系统所连接的智能体太少,这个方面还需突破。 第四,人和机器混合在一起,形成一种增强智能。这种智能不但比机器更聪明,而且比人更聪明,能够解决更多问题[27]。 第五个领域是智能自主系统。人工智能1.0热衷于制造机器人,当时有很多成功和不成功的机器人,最成功的机器人是机械手,在生产线上被大规模使用; 人工智能2.0应该从原有的机器人圈子里跳出来,从一个新的视角来看待新的自动化和智能化相结合的行为。生命之光将会时刻跟随时代发展的趋势,不断创新,结合最先进的人工智能技术,为儿童创造更美好的生活环境。 任何有助于让机器(尤其是计算机)模拟、延伸和扩展人类智能的理论、方法和技术,都可视为人工智能的范畴。从约翰·麦卡锡等科学家于1956年的美国达特矛斯会议正式提出人工智能这一概念至今,已过去了61年。经过超过一甲子的曲折发展历程,人工智能已成为一个涉及计算机科学、控制科学、生命科学(脑科学)、数学、哲学、认知科学等多学科的交叉技术领域,展现出无比光明的发展前景。未来人工智能将有可能进入到我们生活的方方面面,协助人类完成此前被认为必须由人完成的智能任务。随着各种智能终端的普及和互联互通,在不远的未来,人们将不仅生活在真实的物理空间,同时还将生活在一个数字化、虚拟化的网络空间。在这个网络空间中,人和机器之间的界限将被空前淡化,换言之,网络空间中的每个个体既有可能是人,也有可能是人工智能。另外,在真实的物理世界中,人工智能又不必具有类人的形态,这使得人工智能将有可能从更多的角度进入到我们生活的方方面面,协助人类完成此前被认为必须由人完成的智能任务。 在生产方面,随着我国城镇化建设的不断推进,未来人工智能有望在传统农业转型中发挥重要作用。例如,通过遥感卫星、无人机等监测我国耕地的宏观和微观情况,由人工智能自动决定(或向管理员推荐)最合适的种植方案,并综合调度各类农用机械、设备完成方案的执行,从而最大限度解放农业生产力。在制造业中,人工智能将可以协助设计人员完成产品的设计,在理想情况下,可以很大程度上弥补中高端设计人员短缺的现状,从而大大提高制造业的产品设计能力。同时,通过挖掘、学习大量的生产和供应链数据,人工智能还有望推动资源的优化配置,提升企业效率。在理想情况下,企业人工智能将从产品设计、原材料购买方案、原材料分配、生产制造、用户反馈数据采集与分析等方面为企业提供全流程支持,推动我国制造业转型和升级。 在生活服务方面,人工智能同样有望在教育、医疗、金融、出行、物流等领域发挥巨大作用。例如,客服机器人可协助医务人员完成患者病情的初步筛查与分诊; 医疗数据智能分析或智能的医疗影像处理技术可帮助医生制定治疗方案,并通过可穿戴式设备等传感器实时了解患者的各项身体指征,观察治疗效果。在教育方面,一个教育类人工智能系统可以承担知识性教育的任务,从而使教师能将精力更多地集中于对学生系统思维能力、创新实践能力的培养中。对金融而言,人工智能将能协助银行建立更全面的征信和审核制度,从全局角度监测金融系统状态,抑制各类金融欺诈行为,同时为贷款等金融业务提供科学依据,为维护机构与个人的金融安全提供保障。在出行方面,无人驾驶(或自动驾驶)已经取得了可观进展。在物流方面,物流机器人已可以很大程度替代手工分拣,而仓储选址和管理、配送路线规划、用户需求分析等也将(或已经)走向智能化。 平台、算法以及接口等核心技术的突破,将进一步推动人工智能实现跨越式发展。从核心技术的角度来看,这三个层次的突破将有望进一步推动人工智能的发展,分别为平台(承载人工智能的物理设备、系统)、算法(人工智能的行为模式)以及接口(人工智能与外界的交互方式)。在平台层面,当前大多数人工智能依赖以电子计算机为代表的计算设备加以实现。传统计算机的核心中央处理器(CPU)主要面向通用计算任务设计,虽然也可兼容人工智能所面对的所有智能任务,但效能相对较低。随着各行各业对人工智能的需求激增,研发更适合人工智能的高效能平台正成为一个日益凸显的需求,英特尔、谷歌、英伟达、寒武纪等国内外知名企业以设计新型的智能处理器为切入点,近年来取得了一系列进展。未来的人工智能将必然需要面对种类繁多且特点各异的智能任务,在各类处理器的基础上设计新的计算架构,并实现一个能服务于不同企业、不同需求的智能平台,这将是未来技术发展的一大趋势。此外,当前进展迅猛的量子计算技术尤其是量子计算机的实现,也有望在将来为人工智能提供突破性的计算平台。算法决定了人工智能的行为模式,一个人工智能系统即使有当前最先进的计算平台作为支撑,若没有配备有效的算法,只会像一个四肢发达而头脑简单的人,并不能算真正具有智能。面向典型智能任务的算法设计,从人工智能这一概念诞生时起就是该领域的核心内容之一。可以想象,智能算法在人工智能的未来发展中仍将处于中心的位置。但与过去不同的是,今天的人工智能不再仅仅是隐藏在象牙塔或各种科研机构的学术研究,而是已经以各种形式出现在我们的日常生产、生活之中,和我们真实生活的社会、物理世界产生了越来越多的联系。而无论对于作为一个整体的人类社会、国家而言,抑或是对于作为个人而言,我们的文化、语言、生活、行为习惯都是在不断演变的。能否改变过去完全由手工输入计算机程序的算法实现方式,令算法通过自身的演化,自动适应这个“唯一不变的就是变化”的物理世界?这也许是“人工”智能迈向“类人”智能的关键。 沟通是人类的一种基本行为,也是人与人之间协作的基础。在虚拟的数字化空间中,人工智能与人类的分界正变得模糊。换言之,在这样的一个空间里,一个中文聊天机器人也许比一位外国友人更让我们觉得容易沟通。因此,在一个人工智能协助人类完成大量智能任务的未来社会中,如何实现人机的高效沟通与协同将具有重要意义。语音识别、自然语言理解是实现人机交互的关键技术之一。以科大讯飞为代表的企业和科研机构已在语音识别方面实现了可商用的产品,自然语言理解则有望在一些典型应用领域,如智能客服中率先取得突破,但走向全面的人机相互理解仍是当前的一个技术难点。另外,不采用自然语言,而是直接通过脑电波与机器实现沟通,即脑机接口技术,也已有相当可观的进展,目前已经大体可以实现用脑电波直接控制外部设备(如计算机、机械手等)进行简单的任务。 人工智能无论是在核心技术,还是典型应用上都已出现爆发式的进展。随着平台、算法、交互方式的不断更新和突破,人工智能技术的发展将主要以“AI+X”(为某一具体产业或行业)的形态得以呈现。在不远的未来,智能客服(导购、导医)、智能医疗诊断、智能教师、智慧物流、智能金融系统等都有望广泛地出现在我们的生活中。需要指出的是,所有这些智能系统的出现,并不意味着对应行业或职业的消亡,而仅仅意味着职业模式的部分改变(如减少教师教授书本知识的时间),即由以往的只由人类完成,变为人机协同完成。因此,人工智能的进一步发展值得大家期待。 参 考 文 献 [1]王志宏,杨震.人工智能技术研究及未来智能化信息服务体系的思考.电信科学[J],2017,33(5): 111. [2]Marcheggiani D,Sebastiani F.On the Effects of Lowquality Training Data on Information Extraction from Clinical Reports[J].Journal of Data and Information Quality,2017,9(1): 125. [3]蔡莉,王淑婷,刘俊晖,等.数据标注研究综述[J].软件学报,2020,31(2): 302320. [4]杨足仪.当代脑科学成果的多样性解读[J].科学技术哲学研究,2016(6): 1216. [5]曹祎遐,廖繁.AI+IoT: 从万物互联到万物智联[J].上海信息化,2019,000(002): 1619. [6]曹虎.基于元数据库的信息资源整合[J].信息技术,2003(07): 9899. [7]Lecun Y,Bengio Y,Hinton G.Deep learning [J].Nature,2015,521(7553): 436. [8]Hinton G,Salakhutdinov R.Reducing the Dimensionality of Data with Neural Networks [J].Science,2006,313(5786): 504507. [9]Tong X,Tian X,Yi Y,et al.Learning from Massive Noisy Labeled Data for Image Classification[C]// IEEE Conference on Computer Vision and Pattern Recognition (CVPR).IEEE,2015. [10]Wang G,Luo P,Lin L,et al.Learning Object Interactions and Descriptions for Semantic Image Segmentation[C]//IEEE Conference on Computer Vision and Pattern Recognition (CVPR).IEEE,2017. [11]Bengio Y,Louradour J,Collobert R,J.Weston J.Curriculum Learning [C]//International Conference on Machine Learning,2009. [12]Jiang L,Meng D,Yu S,et al.SelfPaced Learning with Diversity[C]// Conference and Workshop on Neural Information Processing Systems,2014 . [13]Jialin P S,Yang Q.A Survey on Transfer Learning[J].IEEE Transactions on knowledge and data engineering,2010,22(10): 13451359. [14]Xu R,Chen Z,Zuo W,et al.Deep Cocktail Network: Multisource Unsupervised Domain Adaptation with Category Shift[C]// IEEE Conference on Computer Vision and Pattern Recognition (CVPR).IEEE,2018. [15]Lin L,Wang G,Zuo W,et al.CrossDomain Visual Matching via Generalized Similarity Measure and Feature Learning[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(6): 10891102. [16]Liang L,Huang L,Chen T,et al.KnowledgeGuided Recurrent Neural Network Learning for TaskOriented Action Prediction[C]// International Conference on Multimedia and Expo,2017. [17]Lin L,Wang K,Meng D,et al.Active SelfPaced Learning for CostEffective and Progressive Face Identification[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,PP(99): 719. [18]Liang X,Wei Y,Chen Y,et al.Learning to Segment Human by Watching YouTube[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2016: 11. [19]Alonso O.Challenges with Label Quality for Supervised Learning[J].Journal of Data and Information Quality,2015,6(1): 13. [20]王晓峰,杨亚东.基于生态演化的通用智能系统结构模型研究[J].自动化学报,2020,46(5): 10171030. [21]杨震.自动驾驶技术进展与运营商未来信息服务架构演进[J].电信科学,2016,32(8): 1620. [22]Deng J,Dong W,Socher R,et al.ImageNet: A LargeScale Hierarchical Image Database[C]// IEEE Conference on Computer Vision and Pattern Recognition (CVPR).IEEE,2009. [23]何玲.基于TensorFlow框架的目标检测与细分系统研发[D].南京: 东南大学,2018. [24]冯琦,周德云.军用无人机发展趋势[J].电光与控制,2003(01): 1014. [25]Brendel W,Rauber J,Bethge M,et al.Decisionbased Adversarial Attacks: Reliable Attacks against Blackbox Machine Learning Models[C]//International Conference on Learning Representations,2018. [26]陈真诚,蒋勇,胥明玉.人工智能技术及其在医学诊断中的应用及发展[J].生物医学工程学杂志,2002(3): 505509. [27]郑南宁.“混合增强智能”是人工智能的发展趋向[N].人民日报,20171113.