明升体育娱乐
当前位置:明升体育娱乐 > 智能科技 > 正文

展望2018:人工智能能够“以假乱真”,“恐怖谷理论”已经终结

12-28 智能科技

编者按:近日,《连线》杂志发布了一系列文章,对2018年科技行业各个领域发展的趋势进行预测。本文是其中一篇,介绍了人工智能技术在文本、图片、视频处理方面的应用以及发展趋势。作者为SANDRA UPSON,文章由36氪编译。

一场革命正在酝酿中,你可以从条纹中知道它的存在。

今年早些时候,加州大学伯克利分校的一组研究人员发布了两组视频。在其中一个视频里(左边),一匹马在栅栏后面小跑。在第另一个视频中(右边),这个马被匹配上了斑马那种黑白相间的条纹。

把一匹普通马变成斑马是一个很好的噱头,但事实并非如此简单。这标志着机器学习算法在改写现实的力量日益强大。例如,其他人也会使用相同的工具,将黑熊变成了熊猫、将苹果变成桔子、将猫变成狗等等。有一位Reddit用户使用不同的机器学习算法来编辑色情视频,将其中主角的面部替换成名人的面部,从而使得像名人真正出演视频一样。在一家名为Lyrebird的创业公司中,机器学习专家正在从一分钟的人声样本中合成令人信服的音频。开发Adobe人工智能平台Sensei的工程师们正在将机器学习技术注入到各种具有突破性的视频、照片和音频编辑工具中。虽然这些项目在立项和意图上有很大的不同,但它们有一个共同之处:它们产生的人工场景和声音,与现实世界的真实画面非常接近。与之前用人工合成的媒体做的实验不同的是,这些图片、视频和声音看起来和听起来都是非常真实的。

这一转变背后的技术将很快推动我们进入新的创意领域,不仅能提升当代艺术家创作的能力,也能将业余爱好者提升到经验丰富的专业人士的水平。以至于我们将需要为创新寻找新的定义了。但这种繁荣也有黑暗的一面。一些人工生成的内容将被用于欺骗,从而引发人们对大量算法假新闻的恐惧。关于一幅图片是否被篡改的老辩论,将会让位于关于各种各样的内容,包括文本。如果你还没有意识到,你会发现自己在想:如果有的话,人类在创作那部电影/电视剧/标题党文章中扮演了什么角色?

一个充斥着人工生成内容的世界是乌托邦的经典案例,同时也是一个反乌托邦的例子。它很混乱,很漂亮,而且已经在这里了。

起初,深度学习生成的内容并不适应现实。谷歌2015年发布的Deep Dreams是利用深度学习来制造迷幻风景和多眼怪物的早期例子。2016年,一款名为Prisma的流行照片编辑应用使用深度学习技术为艺术照片滤镜提供动力,例如将照片变成Mondrian或Munch的风格,以向他们表达敬意。Prisma背后的技术被称为“风格转移”:采用一种图像的风格(如《尖叫》),并将其应用于另一种照片。

现在,驱动风格转移的算法正在变得越来越精确,这标志着“恐怖谷理论”的终结——这种由计算机生成现实,通常会让人类产生一种不安感。与之前的一些粗略的影响形成对比的是,由人工智能驱动的工具已经开始填补“谷底的盆地”。想想康奈尔大学卡Kavita Bala实验室的研究成果吧,深度学习可以将一张照片的风格融入到一个单调乏味的大都市的快照中,让人误以为这个合成的地方是真实存在的。受到人工智能潜能的启发,Bala在这个基础上创立了一个叫Grokstyle的公司。比如说,你很喜欢朋友家沙发上的枕头,或者一本杂志的封面吸引了你的眼球。给Grokstyle的算法提供一个图像,它会在任何外观上显示你喜欢的对象。

“我喜欢这些技术的地方在于它们代表着设计和风格的民主化。”Bala说。“我是一名技术专家——我欣赏美丽和时尚,但却无法创造出值得一看的东西。所以这项工作让我有了机会。让别人也能享受到这一点是一件乐事,这样人们就可以玩得很漂亮了。我们在这些方面没有天赋,并不意味着我们必须生活在一片沉闷的土地上。”

在Adobe,机器学习早在十年前就已经是该公司创意工具的一部分了,但直到最近,人工智能才开始具有变革意义。10月,该公司的人工智能技术公司Sensei的工程师们展示了一款未来的视频编辑工具——Adobe Cloak。该工具可以让用户无缝地从视频中移除一个灯柱——对于资深编辑来说,这是一项非常痛苦的任务。另一项名为“Project Puppetron”的实验,他们将一种艺术风格实时应用到视频中。例如,它可以拍摄一个人的动态视频,让他成为一个爱说话的铜像或手绘的卡通形象。“人们基本上可以在网络摄像头或任何摄像头前进行表演,并实时将其转化为动画,”资深科学家、Adobe研究主管Jon Brandt说。

声明: 该文章由 明升体育娱乐 转载,版权归原作者所有,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权等问题,可联系本站删除