「译」思想--作为一种技术

原文

原文:Thought as a Technology采用Creative Commons Attribution 4.0 International License许可协议授权。

译文

当你第一次面对计算机界面时,是否感到敬畏和喜悦?这个奇怪的界面,是否带给你一种接触外星文明的感觉?

有些人在玩富有想象力的视频游戏时也会有类似感受,诸如 Monument Valley,Braid、Portal 这类游戏。对于另一些人来说,当他们第一次理解如何使用电子表格来为公司、行业甚至整个国家构建模型时,也会生发出类似感受。还有一些人在初次使用支持强大想法的编程语言(例如 Haskell 或 Lisp)时,也有这种敬畏和喜悦的感受。

对我而言,第一次经历这种体验发生在使用 MacPaint 程序的时候。

11岁之前,我只用过命令行界面与计算机沟通,例如在 Apple II、IBM PC 和 Commodore 64这些电脑里:

做图形相关的工作很复杂。在Commodore 64 计算机上,我有时会制作游戏,使用方格纸绘制游戏角色中的像素,然后将它们转换为数值以便输入到计算机中。这是个艰苦的精细活儿。

有一天,父母带我去了一家 Apple 经销店。在那儿,我们见到一台叫做 Macintosh 的计算机,它运行着一个叫做 MacPaint 的程序。使用一种叫鼠标的新玩意儿,我可以直接在虚拟画布上绘制草图。我记得当我点击一个区域的时候内心充满了敬畏感,MacPaint 填满了该区域!它知道边界在哪里! MacPaint 还提供了 FatBits,一种放大图案的方法,于是我可以逐像素地进行编辑。最神奇的是:如果我犯了一个错误,我可以通过单击鼠标按钮来撤消错误,将画布恢复到之前的状态。

MacPaint 将我与我的绘图直接联系在一起,就像使用铅笔或颜料。但它也提供了新的工具,可以轻松完成以前难以做到的事情。今天,这些工具已经为大家所熟悉,听起来可能还挺平庸。但对我来说,他们是我顿悟的时刻,改变了绘图对于我的含义。

当然,大多数人可能从未有过类似体验。但我相信很多人都曾对某些界面感到敬畏和欣喜。

在极致情况下,使用这样的界面就是进入到一个包含对象和行为的新世界,它与你之前看到的世界不同。起初新界面里的元素看起来很奇怪。但随着它们变得熟悉,你内化了这个世界里的元素。最终,你变得熟练,发现了强大而惊人的习语以及界面中隐藏的新模式。你开始用界面来思考,学习以前看起来很奇怪的思维模式,但它们逐渐成为你的第二天性。界面开始消失,成为你意识的一部分。在某种程度上,你已经发生了转变。

是什么让界面拥有转变能力?

大多数界面不怎么引人注目。但那些极致例子的存在提出了一个问题:是什么样的特质使界面拥有转变的能力?

要回答这个问题,有必要考虑下另一种转变技术--语言。孩子们在短短几年内就获得了语言能力。值得注意的是关注这样一个过程:一个孩子一开始听到一个不熟悉的单词,接着 Ta 大声说出这个单词,之后逐渐以更复杂的方式使用这个单词。我们对此熟视无睹。但令人震惊的是,孩子们可以将外部现象内化,并将其用作自己思想的载体。

语言是认知技术的一个例子:它是一种由人类设计的、存在于外部的人工制品,它可以内化,并用作认知的基础介质。语言这项技术由许多单独的部分组成 -- 单词和短语, 它们是认知的基本元素。这些认知元素是我们可以用来思考的事物。

语言不是我们用于内化的唯一认知技术。

让我们考虑一下视觉思维。想象你的大脑是一个光栅显示器,能够构思出任何图像,听起来很不错,但这是错误的。事实上,我们的视觉思维基于我们此前已经内化的视觉认知技术。

例如,世界上最知名的艺术教师之一贝蒂·爱德华兹解释说,大多数非艺术家成年人的视觉思维仅限于简单的“符号系统”,这限制了他们所看到的东西以及他们可以在视觉上构思的内容:

成年后才开始学习艺术的学生通常不会真正看到他们眼前的东西 -- 他们不会以绘画所需的方式来感知。 将感知到的眼前事物转化为文字和符号的能力,主要基于童年时期发展的符号系统以及他们对被感知对象的了解。

需要非凡的想象力来构思新的视觉意义形式(例如新的视觉认知技术)。许多著名的艺术家和视觉探索者,他们之所以著名,部分原因在于他们发现了新的视觉意义形式。当其他人接触到这些新的视觉形式时,他们也可以内化这些新的认知技术,从而扩大他们自己的视觉思维范围。

例如,毕加索等立体主义艺术家发展了在一幅画中使用多个视点的技巧。一旦你学会了立体派艺术,它可以让你更清楚地了解所展示的东西的结构:

另一个例子是Doc Edgerton的工作,他是高速摄影的先驱,他的照片揭示了世界上以前未被预料到的结构。如果你研究这样的照片,你就会对日常现象建立起新的心理模型,如此一来你的视觉思维范围便扩大了:

另一类例子来自许多制图师,他们开发了描绘地图的新方法。例如,考虑一下由 Harry Beck 绘制的 1933 年伦敦地铁地图。在 20 世纪 30 年代早期,Beck 注意到官方地铁地图过于复杂,读者无法理解。像大多数地图上常用的那样,他放弃了确切的地理保真度来简化地图。他集中精力展示了车站网络的拓扑结构:

诸如此类的图像既不自然,也不显而易见。没有毕加索,Edgerton,Beck 和许许多多其他先驱者开发出来的认知技术,没有人会拥有这些视觉思维。当然,只有一小部分人真正内化了这些视觉思维方式。但一旦技术被发明,我们大多数人都可以学习它们,并将其用于思考。

让我们回到计算机界面。

与语言、地图类似,计算机界面也是一种认知技术。要掌握它,需要内化界面中的对象和操作; 使它们成为认知元素。一个充满想象力的界面设计师可以发明全新的认知元素:

我相信这就是 MacPaint 令 11 岁的我大为兴奋的原因:它扩大了我的思考范围。在此,它扩大了我所能创造的视觉图像的范围。一般而言,界面拥有转变能力的原因在于它引入了新的认知元素,从而实现新的思维模式。具体而言,这样的界面使得从前难以获得的深刻洞见变得容易获得。甚至,它将使你的探索(或其他形式的创造力)超越所有前人。 艾伦凯曾问道“计算机承载创意的能力究竟如何?”同样地,我们可能会问:“计算机的承载发现的能力究竟如何?”

我们如何发明新的认知元素?

大多数界面是标准元素的重新组合,并没有引入任何新的认知元素。是否有启发式的方法可以用来发明新的认知元素?

作为深入了解这个问题的一种方式,我将首先展示一个原型界面。它是探索一维运动的原型,即粒子在线上的运动。为了避免让读者失望,我得声明这个原型肯定不像 MacPaint 那样具有变革性!它很粗糙,是一个想法的最初草图。但是它说明了两种有用的启发式方法,可以帮助我们发明新的认知元素。

启发式 1:将界面中隐藏的表征具像化

让我们先来看看数学家 William Thurston 提及的以下问题

你如何看待你所理解的数学与你说出的数学之间的巨大差别?你口中所说是你心中所想吗?
我觉得数学家们经常有未说出的想法在指导他们的工作,这些想法可能很难解释,尽管他们可能已经尽力了.
有一次我向 Andy Gleason 提到这个现象; 他立马说,当他教授代数课程时,如果他正在讨论一个群的循环子群,他心中的图像是群元重组成了一种由循环群组织而成的新形式(对群论不了解,这句话由@雨豪帮忙翻译)。
他说我们永远不会对学生这样说。
他的话在我脑海里形成了一幅生动的画面,因为它符合我对群的理解。我想起了我学生时代的长期思想斗争,试图将意义附加 到“群”上,而不仅仅是我在教科书中读到的符号、词汇、定义、定理和论据这堆东西。

我们可以用 Thurston 的话说,数学家通常不使用书中的常规表征来思考数学对象。相反,他们的思考在很大程度上依赖于我们称之为隐藏表征的东西,例如 Thurston 前头提到与群论相关的心理图像。这种隐藏表征比常规表征更容易让他们进行推理,并偶尔为他们提供神奇的洞察力。

这种隐藏表征在许多领域被使用。例如,电气工程师 Gerald Sussman考察了以下关于电路的理解:

我在 MIT 的电路理论课程中教授我的第一个电气工程课程......我发现我们教给学生的东西根本不是学生实际上应该学习的东西。即,专家们对电路时所做的事情......与我们告诉学生们写下来的东西 - 节点方程式完全不同......然后你要以某种方式将这些方程式揉在一起并解决它们,找出发生了什么。你知道,这不是一个真正优秀的工程师所做的。好的工程师做的是[...]

在这一点上,Sussman 进行了长期的非正式分析。这是令人着迷的,不像我在电路课堂中听过的任何东西。我不会在这里引用 Sussman 的分析 ,这些分析需要他的声音和肢体语言,但是你可以在他讲话中的 26 分钟之后看到它,Sussman 总结道:

每个真正的工程师都会这样做。这不是我们教学生的那类东西。

能量表面原型基于 Thurston 和 Sussman 描述的那类隐藏表示。它是我在理论物理学家的工作中,想象一维运动的方式,视觉效果不是我原创的:当我向其他物理学家展示原型时,有几个人告诉我哦,我也想象类似的一维运动。虽然这种理解方式在物理学家中很常见,但他们很少谈论它。例如,它不用于教授一维运动课程。最多,你可以为学生们制作一些辅助性的草图。当然,你不会把这种思维方式摆在台面上,或者期望学生使用它来做作业/考试。

这很奇怪。在我们的公开对话中,缺乏这种思考一维运动的强大方法。原因是传统媒介很难表现它。为此我们构建了一个界面,明确地使能量表面成为我们思考或沟通一维运动的核心。

这样的界面远远超出了我所展示的原型。它将能量表面与传统的一维运动方法相结合,基于代数,微分方程和牛顿定律。因此,它将传统和新颖的认知元素结合起来,并导致一种非常不同的一维运动思维方式。

一维运动是一个重要但专业的科目。其他科目怎么样呢?专家是否使用其他隐藏表征,而人们日常并不用它?当 Gleason 和 Thurston 想到数学中的时,他们想象的是什么?我们可以取出这些心里图像,用它们来启发界面设计吗?Sussman 对电路的思考方式怎么样?也许我们可以采用数学家用来思考高维几何的一些隐藏表征 ,并将它们转化为界面?其他科目又如何?我使用了物理和数学的例子,因为我对此熟悉,但我相信对于其他的复杂科目,专家们都有隐藏表征,它们可以启发界面设计,用于表达这些隐藏表征。

我认为这种表征的良好来源是我称之为最小范例的东西。专家经常拥有一系列具体的例子,他们用这些例子来推理。例如,假设数学家正在研究高维几何或拓扑中的某些问题。他们可能在推理许多空间维度 -- 甚至可能是无限多的维度!然而他们粗糙的工作笔记上可能画着2维和3维的物体草图。这些草图帮助数学家思考更高维度的对象。例如,数学家 Vitali Milman 喜欢用草图显示高维凸包,这些草图显示了一种“尖尖”的物体,如下所示:

这看起来很奇怪,因为凸包是各处都向外凸出的物体,就像凸透镜一样。他们肯定不是尖尖的、有着向内弯曲的曲线。但 Milman 使用这种表征来提醒自己一个关于高维凸包极其重要但并非直观的事实:几乎所有的体积都集中在它们表面附近。在2维或3维中,这个想法更准确地表现为如上所示的尖刺状物体,而不是2维或3维凸包,这就是为什么 Milman 认为它是一种对思想有用的辅助。

专家通常拥有许多这样的最小范例,以及他们可以用来快速推理这些示例的启发式方法。这些启发式方法通常是快速的经验法则,充满了例外和特殊条件,它们没有被严格的证明。它们让专家勾勒出论点的轮廓,弄清楚什么可能是真的,什么可能是假的。简而言之,它们是探索和获取洞察力的有力方式。

这与大多数计算机推理系统中的方法形成对比。例如,通过计算机进行数学学习的大量工作集中在自动化符号计算(例如,Mathematica),或者寻找严格的数学证明(例如,Coq)。在这两种情况下,重点都放在正确的数学推理上。然而,在创造性工作中,提供严格正确的证据仅仅是该过程的最后阶段(也常常是探索者最不感兴趣的部分)。相反,大多数创造过程都依赖于快速探索,更多地依赖于启发式方法和经验法则,而不是严格的证据。我们可以称之为启发式发现的逻辑。发展这样的逻辑对于构建探索性界面至关重要。我已经做了一些初步调查,看看这种逻辑在走向数学探索媒介时会是什么样子。

如果专家经常发展他们自己的表征工具,为什么他们有时不会分享这些表征工具呢?为了回答这个问题,想象你多年来一直在思考一个问题 -- 比如一个群的循环子群(前头 Thurston 的例子)。最终,你会突破现有表征形式的极限。如果你有强烈的动力 -- 也许是出于解决当前研究问题的愿望 -- 你可能会开始发明新的表征形式,获得传统手段所难以提供的洞察力。此时,你实际上充当了自己的界面设计师。但是,你开发出来的新表征可能完全在你的脑海中,因此不受传统静态媒介形式的约束。或者即使基于静态媒介,它们也可能会破坏关于什么是可接受的论点的社会规范。不管是什么原因,他们可能很难使用传统媒介进行沟通。所以他们保持私密,或者只与专家同事进行非正式讨论时使用。

启发式 2:将界面中关于世界的深层原理具像化

在传统的一维运动方法中,能量守恒原理是用代数形式写成的,如:

0.5mv^2 + U(x) = constant

在专家那儿,这是思考系统的有力基础。但是,它有很多局限性。它与运动的联系是隐含的,而不是直接的:我们无法直接看到空间、速度或粒子的轨迹; 我们不直接看到势能。相比之下,能量表面界面使这些事物直接且易于操作; 它直接体现了能量守恒原理。这样就可以毫不费力地提出并回答需要在代数方法中进行大量工作的问题。

不应该混淆的是,这儿不是试图论证可视化是好的,而代数则是不好的。存在一种对可视化的盲目崇拜,为了可视化而可视化。事实上,并没有任何先验的理由证明可视化方法是更为优越的。相反,我们应当了解任何特定方法的益处和缺点。

对此的一个很好的证明是 Sussman 和 Wisdom 的经典力学的结构和解释。本书通过 Lisp 程序介绍了经典力学的思想。本书实现了基于 Lisp 的经典力学界面,并具有许多新的认知元素。因此,它提供了思考经典力学的新方法,但不是视觉界面。

回到能量守恒和能量表面原型,这里有一个有用的启发:任何深层原理都是创造出强大的界面思想的机会。每一个数学定理,每一个重要的科学成果,都是对界面设计者想象力的挑战。我们能找到在界面中表达这些原理的方法吗?新的原理提出了哪些新对象和操作?这些对象和操作之间的惊人先验关系是由原理揭示的吗?我们能否找到生动地揭示这些关系的界面,最好是以研究的现象所特有的方式?通过回答这些问题,我们可以将一个令人惊讶的非直观原理转化为直观和新的理解的源泉。

在界面中将深层原理可视化要求同时掌握问题域相关的学科和界面。这在能量表面原型中可以看出,掌握界面需要理解势能、能量表面和轨迹之间的关系。因此,掌握界面需要了解很多物理知识!

这种现象的另一个例子是 Photoshop,它构建了许多深入的图像处理原理。当你掌握诸如图层、克隆图章和画笔之类的界面元素时,你就可以成为图像处理方面的专家。同样,掌握经典力学的结构和解释界面的人必然会学习很多经典力学。相比之下,Microsoft Word 的界面很少包含关于写作的深层原理,因此不需成为不错的写手的也可以掌握它的界面。这不是对它的批评,而是它反映了这样一个事实: 我们对于如何写出一手好文章,很少有非常强大而准确的想法。

用于抛体运动的界面

让我展示另一个原型界面,来阐述前头两种启发式方法。第二个原型旨在帮助我们探索二维抛体运动。虽然这听起来可能类似于能量表面原型 -- 但后者只是一维的经典力学! 这实际上是一个非常不同的学科,因此,界面非常不同。它也比一维运动的原型更雄心勃勃,因为我将使用它来探索我在构建界面之前不知道如何解决的问题。和以前一样,这是一个粗略的草图。我们来看看:

这个原型使用了我们前头的两个启发式方法。多个轨迹的扇形和抛物位置的波阵面是一些专家熟悉的表示,但大多数物理学生都不知道。这些表示反过来又具体化了力学的基本定理,表达了轨迹可以通过两个特定的点。

抛体原型与能量表面原型非常不同。这可能是令人惊讶的,因为在传统的代数方法中,一维和二维运动看起来相似。但这种相似性是肤浅的和具有误导性的。事实上,非常不同的想法有助于理解两种情况下的运动。例如,轨迹扇形在2维度有所帮助,但在一维上却不太有用,其中粒子仅在线上前后移动。另一方面,在一维上,轨迹完全由能量守恒原理确定。在二维里,这不再是真的,因此原理不太有用。这些差异在传统的代数方法中是模糊的,专家需要花费数年的时间才能将它们内化。

结论

在 20 世纪 60/70 年代,Douglas Engelbart、JCR Licklider、Alan Kay 和其他人发展了计算机作为增强和扩展人类的设备的愿景。这一愿景强烈影响了后来的研究人员和企业家,包括史蒂夫.乔布斯等人,现在已进入到主流媒体。

一个常见的非正式的拓展模型是我们可以称之为认知外包的模型:我们选择一个问题,将其发送到我们的设备,设备解决了这个问题(也许以一种用户不理解的方式), 接着设备发回一个解答:

例如,如果我想知道距离月球的距离,我会将问题发送给 Google,Google会回复一个答案:

或者我可以向谷歌地图询问从我的办公室到伯克利的路线:

许多人明里暗里使用这种认知外包模型来考虑如何增强人的认知。例如,它通常用于新闻报道。我相信,它也是程序员思考增强这件事的常用方法。

在本文里,我们已经看到了一种不同的增强思维的方式。它不只是解决那些用我们已经理解的术语来表达的问题,它的目标是改变我们可以思考的想法:

这项工作面临的一个挑战是结果难以想象。我们可以发明什么新的认知元素?它们将如何影响人类的思维方式?直到他们被发明出来我们才能知道。

作为类比,让我们比较一下今天试图登陆火星 与 过去伟大的航海时代试图探索海洋 这两件事之间的区别。乍看起来,它们似乎是相似的,但是登陆火星是一个特定的具体目标,但 15 至 18 世纪的航海探险者却不知道他们将发现什么。他们驾驶的船只是脆弱的,计划是模糊的,他们希望找到值得冒险的东西。从这个意义上讲,它比今天试图登陆火星更加困难。

智力增强与此类似。技术上有许多有价值的目标。人工智能和延长生命之类的事情是坚实、具体的目标。相比之下,认知的新元素更加难以想象,而且有些含糊不清。根据定义,它们是尚未发明的思维方式。我们不能先验地说出认知的新元素会是什么,或者它们会带来什么。但我们能做的就是提出好问题,并大胆探索。

致谢

感谢 David Albert,Hannah Davis,Chaim Gingold,May-Li Khoe,Hassan Masum,Andy Matuschak,Robert Ochshorn,Caitlin Sikora,Toph Tucker 和 Devon Zuegel 讨论的想法,这篇文章是这些想法的产物。这项工作始于Recurse 中心,并在YC Research完成。

引文

在学术工作中,本文可以如下方式引用:

Michael Nielsen,"Thought as a Technology",可在 http://cognitivemedium.com/tat/index.html(2016 )找到。

背景

缘起:本文源于我试图理解一些伟大的界面设计师的工作,包括 Douglas Engelbart,Alan Kay,Bret Victor 和其他人。一些重要的参考,包括: Engelbart 的增强人类智慧,Kay 和 Goldberg 的个人动态媒体,以及 Victor 的用于思维不可思维之物的媒体

关于在外部世界中发现的内化迹象: 参见 Lev Vygotsky 的着作,特别是"高等心理功能的内化"(Internalization of Higher Psychological Functions),第 4 章,在 Vygotsky 的一些著作的编辑和翻译集中,“社会中的思想”,哈佛大学出版社(1978 年) 。

使用计算机创造新的(微型的)世界:参见 Seymour Papert 的作品,特别是他的书“Mindstorms”(1980)。

关于隐藏表征的再现:这部分是由 Steven Wittens 的作品所启发,尤其是他对傅里叶变换的非凡演绎。当然,启发式方法用于许多其他工作,但 Wittens 的工作以一种特别敏锐和有效的形式表现出来。

关于深层原理的启示:这部分是由 Kasper Peulen 的欧几里德游戏启发的,该游戏使用欧几里德几何的思想构建了一个界面。同样,这种启发式被广泛使用,但 Peulen 的游戏以一种特别好的经过提纯的形式展示它。