2015年2月,谷歌公司发布了其原本内部使用的人工智能算法 TensorFlow工具——此举彻底改变了世界各地人工智能的研究与开发基调。借用谷歌公司首席执行官的说法,这意味着全球开发者将免费以开放、易用的方式利用 TensorFlow 工具进行创造。人工智能技术将由学术领域正式入驻用户个人笔记本电脑。
关于 TensorFlow
TensorFlow™ 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例如台式计算机中的一个或多个CPU(或GPU),服务器,移动设备等等。TensorFlow 最初由Google大脑小组(隶属于Google机器智能研究机构)的研究员和工程师们开发出来,用于机器学习和深度神经网络方面的研究,但这个系统的通用性使其也可广泛用于其他计算领域。
TensorFlow工具野蛮生长
然而,TensorFlow 的“普及”的力量强大到彻底超出谷歌公司的控制范围。TensorFlow 工具公开发布以来,仅仅两年多时间,尽管仍然由学术界与硅谷主导着软件领域的发展方向,但这种力量平衡正在发生变化,其中的催化剂正是 deepfakes——某匿名的 Reddit 用户。
你看的片儿都是谁的脸?
deepfakes 利用 AI 软件成功实现了将任意面部图像以几乎无缝化方式自动拼接至视频当中。deepfakes 利用深度学习技术能够把任何人的面孔(例如电影明星)放在色情女演员身上。
deepfakes 被披露后又建立了自己的 subreddit,并迅速积累了超过9.1万用户。另一位名为 deepfakeapp 的 Reddit 用户则发布了一款名为 FakeApp 的工具,其允许任何人下载 AI 软件并在正确的硬件上自行使用。截至目前,Reddit 已经禁用了该子社区,并表示其中违反了网站提出了强制性色情控制政策。
根据 FakeApp 发布的用户指南,该软件以 TensorFlow 为基础。谷歌公司的员工利用 TensorFlow 也打造出过类似的解决方案,只是设置与主题略有不同,谷歌用于从零开始训练算法生成图像。此外,用户还可以利用其发挥更为自由的想象空间,例如将尼古拉斯·凯奇放在一大堆其它电影当中。有91000人订阅了deepfakes的子社区,单纯只是为了过把眼瘾。
AI 技术的负面领域应用
虽然 TensorFlow 属于开源项目,但正如潜在的癌症检测算法一样,FakeApp 代表着开源领域的黑暗面。谷歌(以及微软、Amazon乃至Facebook)放弃了对这股巨大技术力量的控制权,且承诺不对相关使用行为作出任何约束。任何人都能够下载 TensorFlow 这个AI 软件,并利用其制作自己的作品。
伪造政治演讲
这意味着从伪造政治演讲(配合现有声音模拟AI)到生成报复性伪造色情内容,人工智能正以人们难以预见的方式发挥着极为严重的负面作用。
由于软件能够在本地计算机上运行,因此大型科技公司只能对这种远离中央服务器的使用行为熟视无睹。“开源代码”决定了企业将无法干涉人们的具体使用方法。AI 由创造性工具转化为潜在的伤害性武器。
而且各大企业也没有动机对此作出改变:自由软件对其来讲是种好事,因为其允许更多人参与到 AI 开发工作中来。目前每一家大型科技企业都在尽可能多地网罗 AI 人才,而涌入这一领域的人员自然越多越好。此外,更多人员的加入还能够带来更多新产品代码以供项目开发,而企业之外的人员可以人中寻找并修复错误,学生则能够在本科与博士课程当中利用该软件进行教学,此外其还将帮助刚刚加入公司的新人们快速上手开发工作。
机器学习“开放”是必然趋势
AT&T 公司先进技术副总裁、前机器学习研究员马辛·吉尔伯特表示,“过去五年当中,机器学习领域确实出现了重大突破,但真正的重大突破并不在于算法,其在本质上与上世纪七十、八十乃至九十年代的算法并无区别。真正的突破在于开源浪潮的普及。开源降低了准入门槛,使得相关技术不再是拥有雄厚财力的IBM、谷歌以及Facebook们的专有物。”
当然,开源软件也使AI开发当中的道德问题变得更为复杂。谷歌公司目前提供的工具并不能创造出天网或者其它超级智能成果,但其仍然有可能造成实际存在的危害。谷歌与微软等也在持续发布开源人工智能框架,并表示人工智能在伦理层面不会造成危害的声明。企业内的在职科学家们已经签署了协议,并成立了专门研究这一主题的研究小组。然而,这些企业不会为下载其自由软件的用户提供任何指导或者授权。TensorFlow网站上展示了软件的运行说明,但却没有提供任何与道德伦理相关、或者要求用户确保数据集不存在偏见的免责声明。
几个月前,在采访微软公司人工智能副总裁哈利·沙姆时,他表示目前还不太清楚该公司要如何引导那些使用开源软件与付费开发者工具的用户创建出符合道德标准的机器学习系统。他表示,“这真的非常困难,我认为目前还不存在简单的解决方案。我们正逐渐意识到,在设计机器学习算法的过程中,我们需要努力找到其中的盲区。”
“自我封闭”不是AI滥用的解决之道
谷歌公司并没有就类似的问题作出回应。
将 AI 软件移出开源阵营同样不是个理想的解决办法。如果选择自我封闭,那将很难了解这些科技企业如何开发自己的人工智能算法。目前的研究成果在 ArXiv 等网站上免费发布,原始代码则在 GitHub 上直接共享,这意味着记者、学者乃至伦理学家都能够寻找其中的潜在缺陷并要求对方作出调整。此外,也有很多人正在利用这些AI工具包进行生产性应用——例如在应用程序当中实现标准图像识别等。
即将大量出现的其它伪造视频将通过Facebook以及Twitte等主流平台与世人见面,并在政治宣传当中找到新的发展空间——这绝不是什么遥不可及的妄想。尽管人工智能研究人员一直希望能够在大型技术企业的职责范围之外为此找到潜在的解决方案,但这样的尝试恐怕无法获得成功——毕竟人工智能工具的民主化进程已经无法阻挡。
由于这类核心技术的开发者无需为自己创造的内容负责,因此很可能落在视频与图像共享平台之上。例如,Gfycat删除了其网站上托管的全部Deepfakes GIF动图。Reddit已经关闭了该子社区。PornHub在采访中表示,其将删除那些经过换脸的色情视频。然而,在主要社交平台范围之外,仍有deepfakes.club这类网站的存在,且很难加以监管。