“一切历史都是当代史。”
文物,是过去与现在无休止的对话。文物存在的价值不仅仅是文物,更在于其承载的文化传承,而现实情况是,世界遗产却或多或少面临损坏甚至绝灭的困境。
纪录片《我在故宫修文物》展现了文物修复的背后工作,一刀一锉工序复杂,而传统修复方式也难以做到尽善尽美,人工智能等新技术日趋成熟,能否在文明传承的长河中起到新作用?
答案是肯定的。
《你好AI 》
《你好AI》是中国第一部从社会人文角度呈现人工智能(AI)应用的纪录片,由英特尔发起并与优酷、北京极目长天文化传播有限公司合作,通过顶级制作团队以国际化视野展现全球AI应用大趋势。该纪录片于国庆档,从9月2日起在优酷播出,每周一更新一集。
该纪录片从保护世界遗产、拯救濒危动物,到攻克医疗难题、探索无垠宇宙等多个领域展现人工智能正融入现实生活的真实案例,英特尔正是这些代表案例背后的技术提供者和推动者。
在影片的拍摄过程中,英特尔为《你好 AI》的拍摄制作提供了强大的专业支持,例如:人工智能领域的技术指导;丰富的AI应用案例,片中半数以上案例来自英特尔及合作伙伴;通过英特尔全球网络以及庞大的产业资源,邀请重磅嘉宾、协调稀有拍摄资源等。
纪录片第一集命名为“守望者”,真实地呈现文明守望者和英特尔的努力,从实际问题入手,通过推动人工智能应用落地,保护文明。
人工智能将如何守望文明?
长城上的无人机
“文物是不能永生的,也不能再生。”
中国,箭扣。
形如满弓扣箭而得名,箭扣长城是明代万里长城最著名的险段之一,“野长城”之所以“野”,正是因其年久失修,人迹罕至,部分山势极其陡峭,几乎是直上直下,这给保护团队带来了极高的难度。
传统手工测量方式费时费力,而且得来数据不准确。李洪刚团队与武汉大学黄先锋教授进行合作,用无人机把长城进行全角度采集,拍摄到的照片生成3D模型后,人工智能技术将进行自动化缺损检测,对长城进行数字化虚拟修复。
第一步是采集高精度图像。采用英特尔猎鹰8+无人机,对城墙进行长城整体和局部的航拍和精确成像。
第二步是3D建模和损毁部位的人工智能识别。借助最新的英特尔至强服务器,快速分析处理高分辨率影像数据,产生完整的高精度长城影像3D模型,利用人工智能算法在3D模型上识别出需要被修缮的部分,并提供裂缝和塌方等破损的测量数据用于指导物理修复。
第三步是3D模型的人工智能数字化修复。在3D模型损毁识别基础上,利用最新的3D模型对抗生成网络,以及回归卷积网络,对城墙缺损部位进行数字化修复,并据此对实际的长城修缮和维护提供指导和参考数据。
一段700米长城城墙,猎鹰8+无人机采集了上万张高分辨率图像,原始数据超过200GB,处理过程还会产生超过100GB的中间和仿真数据,即便是高性能的计算,处理如此庞大的数据量也极其复杂。
解决方案还涉及多种AI算法,包括视觉特征抽取与索引,相机参数恢复,光束平差(bundle adjustment),稠密匹配,几何模型网格生成,深度神经网络2D及3D模型训练,纹理合成等。
英特尔的方案是,基于Xeon至强可扩展处理器,英特尔固态盘,同时结合OpenMP/MPI并行优化技术,采用针对英特尔CPU优化的英特尔深度神经网络数学核心函数库(MKL-DNN),以及面向英特尔架构优化的深度学习框架Tensorflow等工具,高效地实现长城3D建模和数字化修复,并达到厘米级精度的效果。
色彩渐失的莫高窟
“敦煌是搬不出去的。”
沙尘漫卷的敦煌莫高窟,位于三危山和鸣沙山的交接处,敦煌莫高窟彩塑在中国雕塑艺术和美术史上占有重要地位,但风沙却无时无刻不在侵蚀着壁画。与此同时,参观人员呼出的二氧化碳也加速了壁画的氧化。
莫高窟不是馆藏文物,千百年来伫立在原地,却随时都在减少自己的风采。
1907年莫高窟第一张照片问世,一百多年来,照相技术越来越先进,但敦煌壁画的色彩却越来越模糊。
上世纪90年代初,数字敦煌项目启动,不断丰富的新技术让敦煌壁画、泥塑有了数字化档案。
敦煌研究院的吴健团队为洞窟做数字化采集工作,将每一幅壁画分成若干小份进行拍摄,再输出到电脑上拼接还原成整体壁画,形成与原作完全一致并高度清晰的数字档案。
传统记录方式无法解决形变问题,加之很多洞窟没有摄距,洞窟内的很多障碍物影响了成像效果。
为了与侵蚀洞窟的风沙和生物抢时间, 敦煌研究院与浙江大学计算机系共同研发,将人工智能嵌入照相设备, 它可以在洞窟中,自行移动,自动调节灯光,按下快门的同时,图像信息即时显示在拼图的系统中。除了自动拍照,这套设备中的三维定位系统还可以在后期处理时校正画面的透视与变形。
数字敦煌让莫高窟重现丰富色彩,并且突破地域空间的限制,让千里之外的观众也可以一览敦煌芳华。
一亿分之一的满族语言者
“很多真实具象的东西,会随着声音消失。”
据联合国教科文组织发布的《濒危语言图谱》,全世界有7000种语言,其中一半以上将在本世纪消亡,80~90%将在未来200年灭绝,平均每2个星期就有一种语言消失。
据统计,世界80%的人讲83种主要语言,剩下6000多种语言绝大多数从没有过文字记载,没有字典、书,在任何图书馆或数据库都找不到它们的资料。
一切信息只储存在人们的记忆里,因此尤其脆弱。 语言的死亡通常有两种方式:其一,说这种语言的人消失了;其二,说这种语言的人放弃了自己的母语,转而使用另一种语言。
满族语,就是这样一种即将消失的语言,一亿人中只有一个人会满族语。
科大讯飞研究员邓春雷是一位不会讲满族语的满族人。他的工作是用人工智能的方法对人声进行采集、运算、合成为一个语音库。他希望找到一位会讲满族语的老人,亲耳听到自己民族的语言。
每个人都有独特的声纹,也就是音色特征。人工智能声学模型训练必须基于真实的、有规律的真人朗读音频数据,邓春雷团队提前做好了声调定义、标注方案,找寻满族语的存在。
黑龙江黑河,邓春雷为何奶奶录制了630分钟的样音,这将被用于合成个体语言样本。 人工智能将帮助邓春雷寻找语言中不同尺度的音节、语义之间关联和模式。
经过处理,邓春雷团队得到了2500多条语句数据。能否顺利提取声纹特征、语言规律、语调程式,需要人工智能技术与具有超强算力的服务器协同配合。
英特尔公司全球副总裁兼中国区总裁杨旭表示:“人工智能是全球创新的热点,目前还处于发展的初级阶段。《你好 AI》展示了产业界对AI发展和应用的积极探索,为公众畅想AI的未来带来全新视角。英特尔作为科技公司,不断推动AI技术创新,既要以大视野带动技术突破,更要推动相关技术在各行各业的应用和落地。英特尔长期坚持和产业生态一起,用科技造福社会,实现人人受益。”
人工智能走出象牙塔,不仅在商业场景落地生根,更具社会意义和历史价值的是,新技术作用于人文、社会等非商业场景,这才是时代赋予人工智能等新技术的应有之意。
箭扣长城上空无人机仍盘旋,敦煌莫高窟千年壁画色彩重现,满族语终将消失,却又永远铭记。
人工智能要讲的故事,还很长很长。