关于人工智能
昨天聆听了清华大学自动化系张长水教授的课,收益不少。
清华大学自动化系教授、博士生导师,智能技术与系统国家重点实验室学术委员会委员,智能技术与系统国家重点实验室副主任。主要从事机器学习、模式识别、人工智能、计算机视觉等领域的教学和科研工作。
对人工智能这个领域的发展脉络有了一个初步的认知,简单总结如下:
(一)人工智能的发展历史。
最早源于 1956年 夏天的学术讨论班,为期2个月,美国的Dartmouth大学 ,10个人,涉足数学、神经心理学、心理学、信息论、计算机科学的学者,旗帜就是 人工智能 。
人工智能最开始的设计理念是通过系统实现算法的自动化,人们最开始想到的是有规则的事物,比如围棋以外的棋类。因为围棋以外的棋类是有一套标准的规则的,因此,通过规则的自动化来实现早期的人工智能。60年代美国打象棋大师被机器战胜。60年代是 人工智能一个火热时期,但是之后70年代就进入了寒冬,80年代随着神经网络的研究,人工智能再次于90年代进入火热发展时期。这个时候的人工智能,人们不再寄希望于通过自动化一套法则来实现,而是以大数据为基础,运用统计学原理来实现,也就是说不再寄希望于严格的因果关系,而是寄托于更多的关联关系。
2010年Geoff Hinton 发表了一篇文章《Reducing the dimentinality of data with Neutrial Networks》,当时市场上正在对 图片识别进行探索,即Race on Image (TOP 5hit rate),每年提升2%属于正常水平,后来微软邀请来了HInton,准确率提升至85%。所以神经网络的思维方式一下子引起了学界的轰动。而我们现在通常的人工智能,也都是基于这一原理开发的统计学意义上的智能化。
(二)人工智能研究什么?
研究问题求解,搜索算法解决问题,或者把很多问题转化为搜索问题求解。
规划:复杂任务、策略和动作
推理:逻辑,推理有效性和正确性
机器学习:数据回归、分类、推荐、再激励学习
计算机视觉:理解图像和视频
语音、声音、语言;语音识别
图像识别、文字识别、OCR、指纹识别 :比如视网膜病变筛查(google)图像识别,机器自动寻找图像中的特征,深度学习。在围棋中,下棋的人往往是凭借直觉下棋,而为何下棋往往是事后反思出来的结果,因此直观是重要的一个应用,把围棋图谱当成一副画像,用模型提取认得直觉特征,从而实现人工智能的围棋。
写诗、作画。
(三)关于人工智能的一些思考
1、未来人工智能真正进入生活是否基于大数据的整合。
提到当下很多人工智能只是单一一个方面的自动化而已,无法实现真正的人工智能。因为每个场景都是诸多要素的集合,并非一个单一要素,而且很多时候会有很多突发状况,这些是人工智能无法实现的。的确和数据当前割裂的现状有一定关系,比如阿里收集的是购物的信息,百度地图收集的是出行信息,信息都是分了行业且不共享的。但是,人工智能解决的是封闭的问题,不是开放性的问题,至少目前如此。人工智能多是基于过往的历史经验和数据,对于人们行为的一种判断或统计,不是真正的预测。当下人工智能发展及其初级,要实现真正的人工智能可能还有很远的陆要走。
2、人工智能本身能否实现从无到有,而不是仅仅基于历史数据的统计。
人工智能当前主要基于对于历史数据的整合和统计,未来是否可能有一种人工智能实现自我的不断学习和进化,正事当下研究的问题之一。
3、未来发展方向。
深度学习、再激励学习、迁移学习、小样本学习、对抗学习、分布式学习、可解释学习、网络结构优化
4、发展阶段问题。
与90年代互联网发展相似,前期出现的都是初级发展的公司,但是却不是现在市场上的主要竞争力,当前市场上这些伟大公司都是后来慢慢出现且深度发展起来的,因此未来有很长远的路要走。换句话说,当下的AI 多集中于同质化的低水平的竞争,因此随着发展,未来会有更大的机会来临。
5、核心问题
出错不可避免,但是出错之后如何缓解损失是AI必须要考虑的问题。任何事物的进步都是不断地试错中实现的,但是试错的代价也是巨大的。因此,AI发展中的一个关键环节就是要考虑清楚如何避免人工智能失灵带来的后果。