首页 > 业界 > 为了避免成为代码狗,程序猿开始用AI来训练代码
2016
05-19

为了避免成为代码狗,程序猿开始用AI来训练代码

为了避免成为代码狗,程序猿开始用AI来训练代码 - 同创卓越 - 1

  英文原文:Soon We Won’t Program Computers. We’ll Train Them Like Dogs

  在计算机发明之前,大多数实验心理学家认为,大脑一个不可知的黑盒子。你可以通过响铃、狗分泌唾液来分析一个主体的行为,但思想、记忆、情绪这些东西都是模糊莫测,超出了科学的范围。因此,这些自称行为主义者,局限于自己的研究:刺激和反应,反馈和强化,铃铛和唾液的研究。他们试图放弃了解头脑的内部运作,统治了该领域四十年。

  然后,在上世纪 50 年代中期,一群叛逆的心理学家、语言学家、信息理论家,和早期人工智能研究人员对头脑想出了一个不同的概念。他们认为,人不只是条件反射的集合。他们吸收信息,处理信息,然后对它采取行动。他们有专门的编写、存储和调用记忆系统。他们通过逻辑、形式语法来操作。大脑并不是一个黑盒子,它更像是一个电脑。

  所谓的认知革命开始时规模很小,但随着计算机在心理学实验室在全国范围内普及,它获得更广泛的认可。到 70 年代后期,认知心理学推翻了行为主义,同时出现了谈论精神生活的全新语言。心理学家开始描述思想为程序,老百姓谈到把事实存储在他们的记忆银行,商业领袖开始担忧在现代工作场所心理承受能力和处理能力的极限。

  历史总是不断重演。随着数字革命渗透到我们生活的每一部分,它也渗透到我们的语言,和事情如何运作深刻、基本的理论。科技始终做到这一点。在启蒙时期,牛顿和笛卡尔启发人们把宇宙想象为一个精心制作的时钟。在工业时代,它是带活塞的机器。 (Freud 关于心理动力学的思路,是从蒸汽机的热力学借鉴来的。)现在它是一台电脑。这就是说,当你想想看,一个从根本上赋予自主权的想法。因为如果世界是一台电脑,那么代码可以改变这个世界。

  代码合乎逻辑。代码容易被破解。代码是命运。这些都是生活在数字时代的核心原则(和自我实现的预言)。随着软件吞并了世界,套用风险资本家 Marc Andreessen 的话,我们的周围都是把我们的行动、思想和情绪转化为数据,即代码工程师操纵的原料。我们把生活本身看成是可以被发现、开采、优化、甚至改写的一系列指令。公司利用代码来了解我们最亲密的联系;Facebook 的 CEO 马克·扎克伯格很早之前就提出“人类的关系上有基本的数学定律,支配着人们关心的人和事”。2013 年,Craig Venter 宣布,在对人类基因组解码的十年后,他现在已经开始写代码,允许他创造合成生物。 “现在越来越明显,”他说,“地球上已知的所有活细胞 DNA 都是软件驱动的生物机器。”即使自助文献坚持,你可以黑自己的源代码,重新编程你的爱情生活、你的睡眠习惯、你的开销习惯。

  在这个世界上,写代码的能力已经不只是一个理想的技能,而且是与掌握内幕状态的敲门砖。他们可以访问权力的杠杆。 “如果你控制了代码,那你就控制了世界。”未来学家 Marc Goodman。 (Paul Ford 稍微谨慎:“如果程序员不控制世界,他们将控制主宰世界的人。)

  但是不管你是喜欢还是讨厌这种状况,无论你是精英程序员或数码白痴。机器开始使用一种不同的语言,即使再好的程序员也不能完全理解。

  在过去的几年中,美国硅谷最大的高科技公司都在积极寻求机器学习的计算方法。在传统的编程,电脑遵循工程师写的明确、一步步的指示。有了机器学习,编程人员不再为计算机编码。他们“训练”计算机。比如说,你想教神经网络识别猫,你不用告诉它看胡子、耳朵、皮毛和眼睛。你只需把成千上万猫的照片给它看,最终它会自己分辨。如果把狐狸错认为猫,你不需要重写代码,你只要保持训练。

  这种做法并不新鲜,它已经存在了几十年,最近才变得非常强大,部分归功于深层神经网络的兴起,模仿在大脑神经元的多层连接的广泛分布的计算系统。不管你是否意识到,机器学习的力量遍布我们的在线活动。 Facebook 使用它来决定哪些故事出现在你的新闻头条,谷歌照片用它来识别面孔。机器学习运行着微软的 Skype 翻译,它可以实时将语音转换为不同的语言。自动驾驶汽车使用机器学习来避免意外。即使多年来在人工书写的复杂体系顶端的谷歌搜索引擎,也已经开始依靠这些深层次的神经网络。该公司于今年二月聘请了机器学习专家 John Giannandrea 为搜索的主管,同时它已发起一项重大计划培训工程师学习这些新技术。 “通过建立学习制度,”Giannandrea 告诉外媒记者,“今年秋天,我们不必再编写这些规则。”

  但问题是:有了机器学习,工程师将不知道电脑是如何完成其任务的。神经网络的运作在很大程度上是莫测的。换言之,它是一个黑盒子。随着这些黑盒子在日常数字化任务承担更多的责任,它们不仅会改变我们与技术的关系,它们还会改变我们如何看待自己、看待世界、看待我们在世界的位置。

  如果旧观点的程序员都像神,创作支配计算机系统的法律,那现在他们就像父母或驯狗师。任何父母或狗主人都会告诉你,这是一个更为神秘的关系。

  Andy Rubin 是一个根深蒂固的工匠和程序员。他是 Android 操作系统的联合开发者,Rubin 在硅谷臭名昭著因为他的工作场所和家里都是机器人。他自己为它们编程。 “我很年轻的时候就进入计算机科学,我很爱它,因为我可以消失在计算机的世界里。这是一块干净的白板,一块空白的画布,我可以从头开始创建东西,”他说。 “多年来它给了我一个完全控制的世界。”

  现在,他说,这世界即将结束。Rubin 对机器学习很兴奋,他新公司 Playground Global 的崛起,投资了机器学习的创业公司,并把自己定位为引领智能传播设备,但他同时也有一点伤心。由于机器学习改变了成为工程师的意义。“人们不会直线地写项目,”Rubin 说。 “在神经网络学会之后语音识别,程序员不能进去看它是如何发生的。就像你的大脑。你不能砍掉你的头,来看你在想什么。”当工程师们陷入了深深的神经网络,他们看到的是数学的海洋:一个巨大的,多层的微积分问题不断推导数十亿的数据关系点,产生对世界的猜测。

  人工智能不应该以这种方式工作。直到几年前,主流的 AI 研究人员才假设要创造智能,我们只需要用正确的逻辑来灌输机器。编写足够的规则,最终我们会创造足够复杂的能了解世界的系统。他们在很大程度上忽视,甚至污蔑机器学习。多年来,电脑都没有强大到足以真正证明这两种方法的优劣,所以争论成为一个哲学问题。 “大部分这些争论都是基于对世界怎么组织和大脑是如何工作的固定的信仰,”创造了谷歌的自动驾驶汽车的前斯坦福大学人工智能教授 Sebastian Thrun 说。 “神经网络没有符号或规则,只有数字。这疏远了很多人。”

  一种不可分析的机器语言的意义不只是哲学。在过去的二十年里,学习编程代码一直是就业最可靠的途径。但是,神经联网深度学习机器运行的世界需要不同的员工。分析师已经开始担心人工智能对就业市场的影响,因为机器使老技能无用。程序员可能很快就会失业。

  “我今天上午才说了这些,”当我问他这种转变时,技术大师的 Tim O’Reilly 说。 “我当时指出当所有这些接受 STEM 教育的孩子们长大的时候,编程工作将如何不同。”传统的编码不会完全消失,事实上,O’Reilly 预测,我们在很长一段时间仍然需要编码,但有可能会渐渐少用它。正如量子力学的发现没有消除牛顿物理学,代码将保持一个强大的,可能不完整的工具集来探索这个世界。但是,当涉及到具体职能,机器学习会为我们做大量的工作。

  当然,人类仍然要训练这些系统。但至少现在,这是一个纯净的技能。这项工作既需要对数学的高层次把握和对教学给予和采取的直觉。 “这几乎就像在这些系统以获得最佳的艺术形式,”领导谷歌的 DeepMind AI 团队的 Demis Hassabis 说。 “世界上只有几百人能把这一点做到非常好。”但是,即使是微小的数字已经足以在短短的几年改变技术行业。

  无论这一转变对专业造成何种影响,其对文化的影响将是更大的。如果人编写的软件的上升导致了工程师的崇拜,即人的经验最终可以简化为一系列的理解的指令,和机器学习两个概念在相反方向摇摆。运行宇宙的代码可能违抗人类的分析。例如,目前谷歌,正面临欧洲反垄断调查,指控该公司在其搜索结果施加不当影响。这样的指控将是难以证明的,甚至公司自己的工程师不能说清楚其搜索算法究竟是如何工作的。

  即使是简单的算法可以产生不可预知的突发行为、可以追溯到混沌理论和随机数发生器的洞察力。在过去的几年中,随着网络变得更加紧密相连,其功能越来越复杂,代码似乎已更像一个外星力量,机器变得更加难以捉摸和难以统治。飞机无理由停飞。看似不可预防的崩溃的股市。轮流停电。

  这些力量已经导致技术专家 Danny Hillis 宣报启蒙运动时代的结束,我们对逻辑世纪之久的信仰,确定性和对自然的控制。Hillis 说,我们将转移到他所称的纠缠的时代。 “随着我们的技术和制度的创作变得更加复杂,我们也它们的关系发生了变化,”他在《Journal of Design and Science》写道。 “我们不再是创造的主人,我们已经学会与它们讨价还价,在我们目标的大方向哄骗和引导它们。我们已经建立了自己的丛林,而它有自己的生命。“机器学习的崛起是最新的,也许是这个旅程中最后一步。

  这一切可以是相当可怕的。毕竟,编码是一个普通的人能想象在新兵训练营学习的事情。编码者们至少是人。现在的科技精英更少,而且他们对自己的作品命令已经减弱,并且间接的。已经建设了机器学习的公司发现它是很难治理的。去年夏天,谷歌的照片识别引擎开始把黑人标注为大猩猩,公司火速道歉。

  这一切都意味着一个时代即将到来,我们丧失对自己机器的权力。 “可以想到这样的技术智胜金融市场,比人的研究更先进,比人类领袖更会操纵,其开发的武器,我们甚至无法理解,”Stephen Hawking 写道,伊隆·马斯克和比尔·盖茨等等呼应。 “虽然 AI 的短期影响取决于谁控制它,长期影响取决于它是否能被控制。”

  但不要太害怕。我们只是在学习与一项新技术的交战规则。目前,工程师们正在把深度学习系统变得视觉化。但是,即使我们永远不能完全理解这些新机器是怎么想的,并不意味着我们会在它们面前无能为力。在未来,我们将不会关注它们行为的深层根源;我们将专注于学习行为本身。我们用来训练它的数据都将比代码重要。

  如果这一切似乎有点眼熟,那是因为它看起来很像 20 世纪的行为主义。事实上,培养机器学习算法的过程经常被比作 20 世纪初的伟大行为主义实验。巴甫洛夫触发了他的狗的唾液不是通过对饥饿的深刻理解,只是通过一遍又一遍重复的事件。他一遍又一遍提供数据,直到代码重写它本身。

  从长远来看,Thrun 说,机器学习将有民主化的影响力。和你不需要知道 HTML 就能建立一个网站一样,你最终将不需要博士学位就能接触深度学习的疯狂力量。编程不再会是学习了一系列神秘语言训练程序员的唯一领域。任何曾经教狗翻身的人都可以访问。 “对我来说,这是编程里最酷的东西,”Thrun 说,“因为现在任何人都可以编程。”

  对于很多计算历史,我们已经采取了一个机器是如何工作由内而外的视图。首先,我们写代码,然后机器来表述它。这种世界观暗示可塑性,但它也表明了一种基于规则的决定,从某种意义上说,事情是它们底层指令的产物。机器学习暗示却相反,由外向内的视图不只是确定行为,行为也决定代码。机器是世界的产品。

  最终,我们将体会到手写线性码和机器学习算法进行调整两者的力量。生物学家可能已经开始搞清楚了这一点。基因编辑技术如 CRISPR 给他们传统的软件程序员们对代码的操纵力量。但在遗传学领域的发现表明,遗传物质其实也不是不可变的指令集,而是一个动态组根据其主机的环境和经历调整开关。我们的代码不是从物质世界分开。Venter 可能认为细胞 DNA 是软件驱动的机器,但实验胚胎学家 Steve Cole 提出不同的表述:“一个细胞是把经验变成生物学的机器。”

  而现在,自阿兰·图灵第一次勾画他设计的解决问题的机器 80 年代以后,计算机成为了把经验转化为技术的设备。几十年来,我们寻求可以解释、调整、优化我们对世界体验的秘密代码。但是,我们的机器将无法长期以此方式工作,我们的世界也从来没有这样。我们即将与技术建立更复杂,但最终更有价值的关系。我们会从指挥设备,到培育他们。

 
来自: 雷锋网
最后编辑:
作者:同创卓越
这个作者貌似有点懒,什么都没有留下。

留下一个回复

你的email不会被公开。