EtherCalc

即时协作电子表格

您可在网页上建立电子表格，让许多人同时编辑。

每次更动都会随时反映在所有人的屏幕上。

现在就来试试看吧！

在线试用 »

安装

EtherCalc 是自由软件，可在 GNU/Linux、FreeBSD、Mac OS X 和 Windows 上运行。

请先下载并安装 Node.js，再输入以下指令即可：

npm install ethercalc
./node_modules/ethercalc/bin/ethercalc

想要安装给所有使用者时，也可以使用 sudo 加上 npm install -g 参数来安装：

npm install -g ethercalc
ethercalc

如果本机上有 Redis 服务器正在运行，EtherCalc 会优先使用它来存储资料，以增进性能。

在 Sandstorm 平台的安装指南，请参考这份文件。此外，您也可以使用预先建置好的 Docker 套件。

EtherCalc: The Video - 中文

演示文稿

Slides

系统架构

以下是《开源应用程序架构》SocialCalc 章节的中文译本，全文采用 CC0 条款，属于公众领域。

如果您愿意购买本书，作者的全部版税将捐赠给国际特赦组织。

缘起

电子表格的应用历史，已经超过 30 年了。

第一个电子表格程序 VisiCalc 是由 Dan Bricklin 在 1978 年着手开发，于 1979 年问世。

最初的设计非常直接了当：可以在两个维度上任意扩展的表格，其中每个存储格可以存放文字、数字，以及公式。公式由普通的数学计算操作以及各种内建函数组成，并能使用其他存储格的值作为参数。

电子表格的理念看似简单，但却可应用于各种不同的实务领域：会计、库存清单、建模预测、列表管理... 不同用法有着几乎无限的可能性。这些应用使得 VisiCalc 成为第一款个人电脑领域里的“杀手级程序”。

在随后的几十年里，虽然 Lotus 1-2-3 及 Excel 等后继者提出了各种改进，但核心原理都是相同的；大部分电子表格都以硬盘文件的形式保存，并在打开或编辑时读入内存。

在基于文件的模式下，协作显得异常困难，主要难点体现在：

每位使用者都需要安装特定版本的电子表格编辑器。
电子邮件往来、共享文件夹，或安装一套专用的版本控制系统，都会增加额外的管理成本。
变动追踪功能非常有限；举例来说，Excel 无法对格式和单元格注释内容的变动保留历史记录。
更新模板中的格式或公式后，还需对使用该公式的所有电子表格文件进行更繁琐的手工更新。

好在一种新的协作模式出现了，可以用非常简单的方式解决这些问题。这就是Wiki模式，由 Ward Cunningham 于 1994 年开发，并由维基百科在 21 世纪前期使其广为人知。

与文件模式不同，Wiki模式以保存在服务器上的页面为基础，不需要任何额外的软件即可在浏览器中编辑。这些超文本页面可以直接相互链接，甚至可以包含某个大型页面中的部分内容。预设情况下，所有参与者都可查看并编辑最新版本，并可在服务器上自动保存版本修订的历史纪录。

受到Wiki模式的启发，Dan Bricklin 从 2005 年开始着手开发 wikiCalc。它结合了Wiki系统的易于创建、多人编辑等特性，而仍然保有电子表格系统中常用的视觉格式和计算理念。

WikiCalc

WikiCalc 一问世就带来许多独特的功能，是同时期的电子表格所没有的：

纯文字、HTML，以及Wiki式的文本标记支持。
Wiki文字包含插入链接、图片，以及和从存储格引用值的功能。
公式存储格可以引用放在其他网站的 WikiCalc 网页里的值。
支持输出到静态网页，以及将动态资料内嵌至其他网页。
存储格能使用 CSS 来改变样式。
记录所有编辑操作，以供稽核纪录。
和Wiki系统一样，保留每一个版本，并可以随时回复。

从几个小型电子表格组建一个主电子表格的能力，是 WikiCalc 的一大强项。举例来说，每位销售员可以把营业额放在自己的电子表格页面里；然后销售经理可以综合这些资料到该区的电子表格中，之后销售副总再综合各区域的数字，构成主电子表格。

每次有电子表格更新时，所有综合它的电子表格都会即时反映出这次更新。如果主电子表格的读者想要瞭解更多细节，只需要点击链结，即可查看电子表格后面的电子表格。这项功能让使用者不再需要在多个地方更新数字，从而减少了多余而容易出错的操作，并确保所有信息的视图总在最新状态。

为了即时重新计算的需求，WikiCalc 采用了轻客户端的设计，将所有要显示的信息都放在服务器端。每个电子表格在浏览器上以 <table> 元素呈现；编辑存储格时，浏览器会发送一个 ajaxsetcell 指令到服务器，然后服务器告诉浏览器哪个存储格需要更新。

当然，这项设计依赖于浏览器与服务器之间的快速连接。当网络出现延迟的时候，使用者在更新存储格和看到它的新内容之间，会看到 Loading... 讯息频繁出现；这问题对于需要即时调整、预览公式结果的使用者特别严重。

此外，因为 <table> 元素与电子表格有着相同大小，一个 100x100 电子表格会在 DOM 里创建上万个 <td> 元素，大量消耗浏览器的内存资源，进一步限制页面的大小。

由于这些缺点，虽然 WikiCalc 作为在本地主机运行的独立服务器时尚称实用，但要当作网页内容管理系统的一部分，却超出了它的能力。

在 2006 年，Dan Bricklin 与 Socialtext 团队开始开发 SocialCalc 项目，用 JavaScript 语言对 WikiCalc 原本的 Perl 源代码作出改写，目标是能支持大型电子表格、分布式协作流程，以及与桌面应用程序一样的操作界面。

这里是 SocialCalc 的一些设计目标：

处理十万个存储格的能力。
进行编辑操作时提供快速响应。
客户端的稽核纪录和还原/重作支持。
善用 JavaScript 和 CSS ，提供完整的视觉呈现功能。
用 JavaScript 提升性能，并加强对各种不同浏览器的支持。

经过三年的开发和发布许多次测试版之后，Socialtext 在 2009 年发布 SocialCalc 1.0，成功实现了设计目标。现在，让我们来看看 SocialCalc 的系统架构。

SocialCalc

这是 SocialCalc 在运行过程中的画面：

底下则是它的类型图：

相较于 WikiCalc，服务器的角色已大幅减轻。现在服务器只需要负责响应 HTTP GET 请求，提供整份表格内容的序列化字串即可。浏览器在收到资料后，所有计算、变动追踪，以及使用者的互动都是通过 JavaScript 达成的。

JavaScript 元件在设计上使用了层次式 MVC（模型/视图/控制器）样式，每个类型都只专注于某部分的功能：

Sheet 是资料模型，代表电子表格在内存中的结构。
模型中包含从坐标指向 Cell 对象的字典，每个对象代表一个存储格。空存储格所在的坐标不需要有对应的对象，因此完全不占用内存。

Cell 代表存储格的内容和格式。

下面列出的是一些常见的 Cell 对象属性：

    datatype    t
    datavalue   1Q84
    color       black
    bgcolor     white
    font        italic bold 12pt Ubuntu
    comment     Ichi-Kyu-Hachi-Yon

RenderContext 用于实现视图，需要负责将表格绘制为相应的 DOM 对象。
TableControl 则是主控制器，负责接收鼠标和键盘事件。
在接收到视图事件，例如滚动和调整大小后，就会对相关 RenderContext 对象进行更新。

如果收到应用于电子表格内容的更新事件，则会在电子表格的指令队列中加入新的指令。
SpreadSheetControl 负责绘制顶层界面，包括工具栏、状态栏、对话框，以及颜色选择器。
SpreadSheetViewer 是另一套顶层界面，主要提供只读的互动视图。

我们采用了基于类型的轻量级对象系统，仅使用了简单的组成/委派机制，完全没有使用继承或对象原型。所有符号都位于 SocialCalc.* 命名空间里，以避免命名冲突。

对电子表格的全部更新都需要通过 ScheduleSheetCommands 方法进行，因此需要通过指令字串来代表编辑操作。常用的指令如下：

    set     sheet defaultcolor blue
    set     A width 100
    set     A1 value n 42
    set     A2 text t Hello
    set     A3 formula A1*2
    set     A4 empty
    set     A5 bgcolor green
    merge   A1:B2
    unmerge A1
    erase   A2
    cut     A3
    paste   A4
    copy    A5
    sort    A1:B9 A up B down
    name    define Foo A1:A5
    name    desc   Foo Used in formulas like SUM(Foo)
    name    delete Foo
    startcmdextension UserDefined args

任何想要嵌入 SocialCalc 的应用程序，都可以自行定义额外的指令，只需要将命名的回调函数添加到 SocialCalc.SheetCommandInfo.CmdExtensionCallbacks 对象，即可使用 startcmdextension 指令进行呼叫。

指令的循环运行

为改善响应速度，SocialCalc 会在后台执行全部的重算和 DOM 更新，因此在使用者对多个存储格进行修改时，电子表格引擎会同时在指令队列里处理先前的改动。

在运行指令时，TableEditor 对象会将其 busy 属性设为 true；后续指令则需加入到 deferredCommands 队列，以确保指令能循序执行。事件循环看起来像这样：

如上图所示，Sheet 对象会持续发送 StatusCallback 事件，以提醒使用者当前的指令执行状态。这一过程可以分为下列四个步骤：

执行指令
启动时发送 cmdstart，执行完成后则发送 cmdend。

如果指令间接更改了某存储格的值，则进入重算步骤。

否则，如果指令更改了一个或多个已在屏幕上显示的存储格的视觉外观，则进入绘制步骤。

如果上述情况都不符合（例如在使用copy指令时），则跳到位置计算步骤。
重算（如果需要的话）
启动时发送 calcstart，在检查存储格的依存链时每隔 100ms 发送 calcorder，完成检查时则发送 calccheckdone，并在所有受影响存储格获得重算后的值后发送 calcfinished。

这一步骤之后总是需要执行绘制步骤。
绘制（如果需要的话）
启动时发送 schedrender，如果使用格式化后的存储格更新了 <table> DOM 对象，则发送 renderdone。

这一步骤之后总是需要执行位置计算步骤。
位置计算
启动时发送 schedposcalc，并在更新了滚动条、目前存储格游标，以及 TableEditor 的其他视觉组件后发送 doneposcalc。

因为所有指令在执行后即被保存，因此等于对所有操作都可获得执行纪录。为实现稽核追踪，Sheet.CreateAuditString 方法会传回以换行隔开的字符串，每行内容对应到一个指令的相关记录。

ExecuteSheetCommand 还可为执行的每个指令创建还原指令。举例来说，如果存储格 A1 包含 Foo，而使用者执行了 set A1 text Bar，则还原指令set A1 text Foo 会被推送到 UndoStack 里。如果使用者进行还原操作，则会通过执行还原指令来让 A1 的内容回到原先的值。

电子表格编辑器

接着一起来看看 TableEditor 层。该层可计算 RenderContext 的屏幕显示内容，并通过两个 TableControl 实例来管理水平/垂直卷动轴。

视图层主要由 RenderContext 类型负责。与 WikiCalc 的设计不同的是，我们并非将每个存储格对应到一个 <td> 元素，而是直接创建固定大小的 <table>，使它充分填满浏览器的可视区域，并为其预先填充 <td> 元素。

当使用者通过自定义的滚动条拖动电子表格后，可以动态更新预先绘制的 <td> 元素的 innerHTML。这意味着在很多常见情况下，我们并不需要创建/删除任何 <tr> 或 <td> 元素，因此大幅提升了响应速度。

因为 RenderContext 只绘制可视区域，所以无论电子表格多大，执行性能也不受影响。

TableEditor 还包含一个 CellHandles 对象，可用于处理附加到目前存储格（即ECell）右下角的圆盘形填充/移动/滑动选单指令：

输入框则由两个类型负责管理：InputBox 和 InputEcho。前者主要管理网格上的编辑行，后者主要用于在输入内容时提供及时更新的预览层，并覆盖ECell的内容。

通常，SocialCalc 引擎只有在打开电子表格并进行编辑时，以及将内容保存回服务器时才需要与服务器通信。因此，Sheet.ParseSheetSave 方法可在Sheet 对象中解析存储格式字串，而 Sheet.CreateSheetSave 方法可将 Sheet 对象序列化为存储格式。

通过使用 URL，公式可引用任何远端电子表格中的值。recalc 指令会重新抓取被引用的外部电子电子表格，并使用 Sheet.ParseSheetSave 对其进行解析，然后将其存储在暂存区中，这样使用者即可在不重新抓取内容的情况下，直接引用相同远端表格中其他存储格的内容。

存储格式

存储格式是一种标准的 MIME multipart/mixed 格式，主要由四个 text/plain; charset=UTF-8 部件组成，每部件包含以换行隔开的文字，并用冒号划分资料栏位。这些部件包括：

meta 部件列出其他部件的型别。
sheet 部件列出每个存储格的格式和功能、每个列的宽度（如果不是预设宽度）、表格的预设格式，以及该电子表格中用到的字体、颜色，及边框列表。
可选的 edit 部件可保存 TableEditor 的编辑状态，包括 ECell 的最后一个位置，以及行/列窗格的固定大小。
可选的 audit 部件包含上一次编辑会话中执行过的指令历史记录。

举例来说，下面是一个包含三个存储格的电子表格，A1 作为 ECell，其内容为 1874，A2 中是公式 2^2*43，A3 中的公式 SUM(Foo) 则显示为粗体字，代表命名范围从 Foo 到 A1:A2：

这份电子表格经过序列化后，存储格式会像这样：

    socialcalc:version:1.0
    MIME-Version: 1.0
    Content-Type: multipart/mixed; boundary=SocialCalcSpreadsheetControlSave
    --SocialCalcSpreadsheetControlSave
    Content-type: text/plain; charset=UTF-8

    # SocialCalc Spreadsheet Control Save
    version:1.0
    part:sheet
    part:edit
    part:audit
    --SocialCalcSpreadsheetControlSave
    Content-type: text/plain; charset=UTF-8

    version:1.5
    cell:A1:v:1874
    cell:A2:vtf:n:172:2^2*43
    cell:A3:vtf:n:2046:SUM(Foo):f:1
    sheet:c:1:r:3
    font:1:normal bold * *
    name:FOO::A1\cA2
    --SocialCalcSpreadsheetControlSave
    Content-type: text/plain; charset=UTF-8

    version:1.0
    rowpane:0:1:14
    colpane:0:1:16
    ecell:A1
    --SocialCalcSpreadsheetControlSave
    Content-type: text/plain; charset=UTF-8

    set A1 value n 1874
    set A2 formula 2^2*43
    name define Foo A1:A2
    set A3 formula SUM(Foo)
    --SocialCalcSpreadsheetControlSave--

上述格式在设计上可让人直接读取，并且也很容易通过程序生成。因此，Drupal 项目的 Sheetnode 插件即可使用 PHP 在此格式以及其他流行的电子表格格式，例如 Excel (.xls) 及 OpenDocument (.ods) 之间进行转换。

至此，我们已经简要介绍了 SocialCalc 各个元件和组成方式。接下来，让我们透过两个实际的范例，一起来看看如何扩展 SocialCalc 的功能。

富文本编辑

我们对 SocialCalc 所做的第一项改进，是让文字存储格能够使用Wiki语法，以及直接在表格编辑器中实现的富文本绘制：

在 1.0 版发布之后不久，为了响应用户希望通过统一语法插入图片、链接，以及文字标记的需求，我们帮 SocialCalc 加上了这项功能。由于 Socialtext 提供自己的开源Wiki平台，因此自然会希望能在电子表格中直接使用相同的语法。

为了实现此功能，我们需要将预设的文字存储格格式（即 textvalueformat 属性）设为 text-wiki，并为它提供自定的绘制器。

至于 textvalueformat 属性是什么呢？请见下文。

类型与格式

在 SocialCalc 中，每个存储格都有一个 datatype 及一个 valuetype 属性。包含文字/数字资料的存储格分别对应到文字/数字值类型，而具备 datatype="f" 的公式存储格则可能会生成数字或文字值。

在前一节介绍的绘制步骤中，Sheet 对象会为每个存储格生成 HTML。为此，它会检查每个存储格的 valuetype：如果以 t 开头，则该存储格的textvalueformat 属性会决定如何进行生成。如果以 n 开头，则使用 nontextvalueformat 属性进行判断。

如果该存储格的 textvalueformat 或 nontextvalueformat 属性没有定义，则会通过其 valuetype 属性查询预设格式，如下图所示：

对 text-wiki 值格式的支持，写在 SocialCalc.format_text_for_display 中：

     if (SocialCalc.Callbacks.expand_wiki
         && /^text-wiki/.test(valueformat)
     ) { 
         // do general wiki markup 
         displayvalue = SocialCalc.Callbacks.expand_wiki(
             displayvalue, sheetobj, linkstyle, valueformat
         ); 
     }

此处我们并非将“Wiki文字转 HTML”的转换器嵌入到 format_text_for_display 里，而是在 SocialCalc.Callbacks 里定义一个新的挂钩。这是 SocialCalc 代码里推荐的方法：这种模组化的设计，让应用程序可以支持各种不同Wiki文字的语法。如果应用程序用不到 text-wiki 格式，也可以直接忽略 expand_wiki 挂钩。

绘制Wiki文字

随后，我们使用了 Wikiwyg，这是一个 JavaScript 程序库，可在Wiki文字和 HTML 之间提供双向转换。

我们定义下列 expand_wiki 函数，将存储格的值透过 Wikiwyg 的 Wikitext 解析器和 HTML 产生器转换成 HTML：

     var parser = new Document.Parser.Wikitext(); 
     var emitter = new Document.Emitter.HTML(); 
     SocialCalc.Callbacks.expand_wiki = function(val) { 
         // Convert val from Wikitext to HTML 
         return parser.parse(val, emitter); 
     }

最后一个步骤则需要在电子表格初始化完毕后，将 set sheet defaulttextvalueformat text-wiki 加入命令队列：

     // Assume there's a <div id="tableeditor"/> in DOM 
     var spreadsheet = new SocialCalc.SpreadsheetControl(); 
     spreadsheet.InitializeSpreadsheetControl(
         "tableeditor", 0, 0, 0
     ); 
     spreadsheet.ExecuteCommand(
         'set sheet defaulttextvalueformat text-wiki'
     );

将上述部份搭配起来后，绘制步骤的工作流程将类似这样：

大功告成！改进后的 SocialCalc 能够支持丰富的Wiki标记语法：

    *bold* _italic_ `monospace` {{unformatted}}
    > indented text
    * unordered list
    # ordered list
    "Hyperlink with label"<http://softwaregarden.com/>
    {image: http://www.socialtext.com/images/logo.png}

请尝试在 A1 中输入 *bold* _italic_ `monospace`，随后即可看到绘制后的富文本内容：

即时多人协作

我们接下来研究的一个例子，是在共享的电子表格里进行多人即时协同编辑。

这乍看之下也许有点复杂，但是感谢 SocialCalc 的模组化设计，我们只需让每位使用者将自己的指令传播给其他参与者执行即可。

为了对本地指令与远端指令作出区分，我们为 ScheduleSheetCommands 方法增加了 isRemote 参数：

    SocialCalc.ScheduleSheetCommands =
        function(sheet, cmdstr, saveundo, isRemote) {
            if (SocialCalc.Callbacks.broadcast && !isRemote) {
                SocialCalc.Callbacks.broadcast('execute', {
                    cmdstr: cmdstr,
                    saveundo: saveundo
                });
            }
            // ...original ScheduleSheetCommands code here...
        };

现在只需定义一个合适的 SocialCalc.Callbacks.broadcast 回调函数，即可让所有连入此电子表格的客户端执行相同的指令。

当 SEETA Sugar Labs 于 2009 年在 OLPC 上首次实作这项功能时，broadcast 函数是用 XPCOM 框架写成，并在 OLPC/Sugar 的标准传输层 D-Bus/Telepathy 网络上运行：

这样的运行方式，让 Sugar 网络里的 XO 电脑能对共同的 SocialCalc 电子表格进行协作，但也只能在 Mozilla/XPCOM 浏览器平台与 D-Bus/Telepathy 讯息平台上适用。

跨浏览器传输

为了达成跨浏览器、跨作业系统的目标，我们使用 Web::Hippie 框架，作为 JSON 在 WebSocket 上传输的抽象层。它提供方便的 jQuery 绑定，并且当 WebSocket 不适用时，也能利用 MXHR (multipart XMLHttpRequest) 作为备用传输机制.

对于安装了 Adobe Flash 插件但没有原生 WebSocket 支持的浏览器，我们使用 web_socket.js 项目的 Flash WebSocket 模拟器，这通常比 MXHR 更快也更可靠。

运作流程看上去是这样的:

客户端的 SocialCalc.Callbacks.broadcast 函数定义如下:

    var hpipe = new Hippie.Pipe();

    SocialCalc.Callbacks.broadcast = function(type, data) {
        hpipe.send({ type: type, data: data });
    };

    $(hpipe).bind("message.execute", function (e, d) {
        var ss = SocialCalc.CurrentSpreadsheetControlObject;
        ss.context.sheetobj.ScheduleSheetCommands(
            d.data.cmdstr,
            d.data.saveundo,
            true // isRemote = true
        );
        break;
    });

尽管这已经能顺利运行，我们仍然有两个问题需要解决。

冲突解决

第一个就是为了执行指令而产生的争用状态：如果使用者 A 与 B 同时执行某个影响相同存储格的操作，之后才接收到与对方传播出来的指令，那么双方将会停在不同的状态：

我们可以通过 SocialCalc 内置的还原/重作机制来解决这个问题，如下图所示：

当客户传播出一个指令时，会将指令添加到待办队列。
当客户接收到一个指令时，检查待办队列：
- 如果待办队列为空，则直接执行这项远端指令。
- 如果它符合待办队列里的本地指令，则将它将从队列中移除。
- 否则，检查队列中是否有指令与接收到的指令相冲突：
  - 如果存在冲突指令，则先还原这些指令，并将其标记为稍后重作。
  - 在还原所有的冲突指令之后，将远端指令按正常状态执行。
当从服务器上接收到标记为重做的指令时，客户端将再次执行指令，再从队列中将其移除。

远端游标

尽管争用状态已经得到解决，但“偶尔会覆盖掉其他使用者正在编辑的存储格”这样的不理想情形还是存在。我们可以更进一步，将每位使用者的游标位置传播给其他使用者，让每个人都能看到有哪些存储格正在编辑。

为了实做这一想法，我们为 MoveECellCallback 事件添加了另一个 broadcast 处理程序:

    editor.MoveECellCallback.broadcast = function(e) {
        hpipe.send({
            type: 'ecell',
            data: e.ecell.coord
        });
    };

    $(hpipe).bind("message.ecell", function (e, d) {
        var cr = SocialCalc.coordToCr(d.data);
        var cell = SocialCalc.GetEditorCellElement(
            editor, cr.row, cr.col
        );
        // ...decorate cell with styles specific
        //    to the remote user(s) on it...
    });

在电子表格中标记存储格焦点时，通常会使用带有颜色的边框。但是，该存储格也许已经有自己的 border 属性了。而由于 border 为单一颜色，因此在相同的存储格只能表现一个游标。

因此，在支持 CSS3 的浏览器上，我们使用 box-shadow 功能来表现多个游标:

    /* Two cursors on the same cell */
    box-shadow: inset 0 0 0 4px red, inset 0 0 0 2px green;

如此一来，当四人编辑同一个电子表格时，屏幕看起来会像这样:

开发经验谈

笔者在 2009 年 6 月时加入 SocialCalc 项目团队。经过四个月的密集作业，我们在 10 月 19 日（VisiCalc 的 30 周年纪念日）发表了 SocialCalc 1.0 版。

从 WikiCalc 到 SocialCalc，中间经历了三年的开发。相形之下，最后这四个月只是一段短暂的时间。尽管如此，这段和 Socialtext 同事在 Dan Bricklin 的指导下进行协作的过程，仍使我获益匪浅。在此，笔者想将那段时间学到的经验分享给大家。

愿景清晰的首席设计师非常重要

在《设计的设计（The Design of Design）》一书中，Fred Brooks 认为，在建构复杂系统时，若能专注于清晰连贯的设计概念，而非各自为政的想法，那么沟通成本将会大幅下降。

依 Brooks 的想法，这种连贯式设计概念的构想，最好能由一个人来主导：

概念的完整性是伟大设计中最重要的特性。由于完整的概念只能出自一人或少数人的合作构想，因此明智的管理者会大胆委托才华出众的首席设计师，来承担整个设计任务。

对于 SocialCalc 这个项目来说，让 Tracy Ruggles 担任首席用户体验设计师，是让我们成功实现原初构想的关键。由于 SocialCalc 的底层引擎十分易于扩展，因此各种新功能的想法往往层出不穷；Tracy 透过草图进行原型设计的才能，为我们提供了巨大的帮助，让我们能用最直观的方式呈现出所有的功能。

Wiki确保项目延续

在我加入项目之前，SocialCalc 已有超过两年的设计和开发历史，但我却能在几天之内立刻赶上进度，开始作出贡献。

这是因为“所有信息都在Wiki里”– 从早期的设计草稿到最新的浏览器支持清单，整个流程都详细记载在Wiki页面和 SocialCalc 电子表格里。

通过阅读该项目的相关记录，让我能跳过新成员加入时常见的上手期，快速跟上目前的进度。

这在传统的开源项目比较少见。传统项目中大部分的交流都是在 IRC 和邮件论坛中进行的，而Wiki（如果有使用的话）往往只用来存放相关资源的记录和链结 – 如果有新人加入，要想通过结构混乱的 IRC 纪录和邮件存档追赶进度，无疑会更加困难。

善加运用时区差异

Ruby on Rails 的发明人 David Heinemeier Hansson 在加入 37signals 时，曾这样评价分布式团队的优势：

哥本哈根和芝加哥之间相隔的七个时区，实际上减少了我们受到的打扰，让我们做出更多工作。

在 SocialCalc 的研发过程中，对于台北和帕罗奥图之间相隔的九个时区，我们亦有同感。

通常我们会在一天 24 小时内，完成一次“设计-开发-品管”反馈循环，每个环节用到某个人的八小时。这种非同步式的协作，促使我们运用能自我描述的完整作品（设计草图、代码，以及测试）来沟通，从而大幅增进相互之间的信任。

乐趣最优

笔者在 2006 年于 CONISLI 会议上所作的主题演讲“-OFun：乐趣最优（Optimizing for Fun）”里，将自己领导分布式团队开发 Perl 6 语言的经验，总结为几个重点。其中“随时保持蓝图清晰”、“事后宽恕 > 事前许可”、“打破僵局”、“不求共识，只求创意”，以及“使用代码描述概念”这几项，特别适合小型的分布式团队。

因此，在开发 SocialCalc 时，我们特别重视团队成员间的知识分享，以确保每个人都不会成为主要瓶颈。

另外，当设计过程出现多种备选方案时，我们会主动将每个方案都进行实做，以深入探勘它们的设计空间，并先一步解决可能出现的冲突。如果在此过程里发现有更好的设计，我们也不怕将整个原型打掉重写。

虽然缺乏面对面交流，但这些文化特质帮我们培养相互之间的信任和情谊，并将争议降到最低，让 SocialCalc 的开发成为一件乐事。

通过故事测试推动开发工作

在加入 Socialtext 前，我曾倡导“将测试写进规格里”的方法，这一点在 Perl 6 语言规格中就能看到：我们逐段帮规格加上测试，并持续确保两者之间的同步。

然而 SocialCalc 项目品管团队的成员 Ken Pier 和 Matt Heusser 却让我大开眼界 – 原来这种做法还可以更进一步，将测试提升到“可以执行的规格”这个境界。

在《美妙的测试（Beautiful Testing）》一书第 16 章，“剥开 Socialtext 的玻璃洋葱”里，Matt 用如下方式解释了我们由“故事测试”推动的开发流程：

工作的最基本单元是一系列“故事”，也就是一系列非常轻量级的需求文件。

每个故事只包含对一个功能的简要描述，以及此功能的运作实例，用最直白的文句进行描述。我们称这些实例为“接纳度测试”。

在故事形成初期，设计师会先写出初步的接纳度测试，随后由开发人员和测试人员进行讨论，之后开发人员才开始编写代码。

随后这些故事测试会被转换为“Wiki测试（wikitests）”。这是一种基于表格的语言，脱胎自 Ward Cunningham 的 FIT 框架。用此语言写成的测试存进Wiki系统后，会自动连接到 Test::WWW::Mechanize 和 Test::WWW::Selenium 等测试框架，成为自动测试流程的一环。

用故事测试作为“表达需求”和“验证需求”的共通语言，这种做法的好处一言难尽。它不但大幅节省了沟通成本，也让我们能每个月对系统进行一次改版时，不用担心已经修复的瑕疵会再次出现。

CPAL 开源授权

最后，我们针对 SocialCalc 而设计的开源授权，也令我们受益匪浅。

Socialtext 为了 SocialCalc，设计出通用公共授权（Common Public Attribution License）。CPAL 以 Mozilla 公共授权为基础，并让原作者可以要求在软件的界面上显示自己的标志。CPAL 还加上了“网络使用条款”，让衍生作品在透过网络提供服务时，也授予一般使用者取得源代码的权利。

在获得开放源代码促进会和自由软件基金会的认可后，已经有不少知名网站（例如 Facebook 和 Reddit）选择用 CPAL 方式发布自己的平台源代码，这对我们无疑是莫大的鼓励。

因为 CPAL 属于“较弱型著佐权（weak copyleft）”授权，因此开发人员可以将它整合进任何自由软件或私有软件里，只需要分享出针对 SocialCalc 本身的修改。这让各个社区都可以采用 SocialCalc ，并对其进行改进。

底下是一些以 SocialCalc 为基础的开源项目：

Drupal 的 Sheetnode 项目，及其自行维护的 SocialCalc 分支。
Luke Closs 发起的 OLPC/XOCOM 平台移植版。
SEETA 的 OLPC/Sugar 平台移植版，由 Luke 的版本衍生而来。
SEETA 的 Palm Pre 平台移植版。
Ramu Ramamurthy 的 Scala/Java 电子表格服务器项目。

本章中的范例，包括富文本和协作编辑等功能，都能在 http://github.com/audreyt/ethercalc 下载。WikiCalc 1.0 代码的历史存档，则可由 http://github.com/audreyt/wikicalc 取得。

开源的网页电子表格引擎，有许多有趣的应用可能。如果您能将 SocialCalc 嵌入到您自己的项目中，这绝对是我们喜闻乐见的。

Happy Hacking!

唐凤

性能架构

以下是《开源应用程序性能》EtherCalc 章节的中文译本，全文采用 CC0 条款，属于公众领域。

从 SocialCalc 到 EtherCalc

先前在《开源应用程序架构》一书中，我介绍了 SocialCalc 这个在浏览器中运行的电子表格编辑器，以取代服务器为中心的 WikiCalc 架构。SocialCalc 在浏览器中执行所有的计算，只有在载入和存储电子表格时才会使用服务器。

追求性能是 Socialtext 团队在 2006 年时设计 SocialCalc 的主要目的。重点在于：在 JavaScript 环境下执行客户端计算，尽管在当年的速度仅有服务器端 Perl 计算的十分之一，但仍然胜过 AJAX 来回传输资料造成的网络延迟：

WikiCalc 與 SocialCalc 架構比較

《开源应用程序架构》的最后一段里，我们介绍了如何透过一种简单、类似聊天室的架构，来进行电子表格同步协作：

多人連線版 SocialCalc

然而，当我们开始进行上线测试时，却发现它的性能与扩展性不符实际需求，这也激发我们重写整个系统，以便达到可接受的性能水准。

本章将会讨论 EtherCalc 系统的演进过程。它是 SocialCalc 的后续项目，为电子表格提供多人同步的编辑功能。我们会详述系统架构的沿革，介绍相关的性能分析工具，以及我们创造出哪些新的工具来克服性能上的问题。

设计限制

Socialtext 平台同时具有“防火墙内”及“云端部署”两种选项，这对 EtherCalc 的资源及性能需求增加了独特的限制。本书写作时，Socialtext 在 vSphere 为基础的内部网络主机服务内的最低需求，是双核心处理器和 4GB 的内存容量。典型的 EC2 虚拟主机服务则提供大约两倍的性能，相当于四核心和 7.5GB 的内存容量。

内部网络的部署需求，代表我们不能像多租户的主机模式系统那样，靠扩充硬件来解决问题（例如 DocVerse，后来成为 Google Docs 的一部分）；系统必须能在一个普通的服务器上运行。

相较于内部网络部署，云端主机可以藉由随选扩充，来提供较高的性能，但是浏览器的网络连线通常比较慢，而且断线与重新连线的状况相当频繁。

综上所述，这些形塑 EtherCalc 架构方向的资源所受的限制有：

内存：以事件为基础的服务器，能让我们用较少的内存处理数千个同时发生的网络连线。
处理器：基于 SocialCalc 的原始设计，我们把大部分计算及所有内容绘制移到客户端 JavaScript 运行，以减少服务器的负载。
网络：传送电子表格操作指令而非内容，可降低所需的带宽，并从不稳定的网络连线上恢复。

初步原型

我们首先用 Perl 5 语言撰写了一套 WebSocket 服务器，透过 Socialtext 开发的 Feersum 这个以 libev 为基础的事件引擎提供支持。Feersum 的速度相当快，在一般状况下每秒可处理上万笔请求。

除了 Feersum 以外，我们还使用中间件 PocketIO，接上广受好评的 Socket.io JavaScript 客户端，以相容于尚未支持 WebSocket 的旧版浏览器。

这个初步原型跟聊天室服务器十分相似，每个协作时段就相当于一个聊天室；客户端可以将本地的执行指令及游标动作传送到服务器，然后透过服务器转送给同一个聊天室里的所有客户。

典型的操作流程就像这样：

紀錄重播式的原型伺服器

服务器在纪录每个收到的指令时，都会附上时间戳。如果客户断线后又重新连线，它可以撷取这段时间的积存纪录，然后重新执行那些指令，以达到跟其他人相同的状态。

如同我们在《开源应用程序架构》提到的，这个简单的设计大幅减少了服务器端的处理器与内存需求，并且可以在网络连线失败的状况下，展现出合理的复原能力。

第一个瓶颈

然而，我们在 2011 年 6 月实地测试雏型时，却发现随着协作编辑的执行时段愈长，就会出现愈严重的性能问题。

由于电子表格是长久存在的文件，因此经过数周的编辑，协作时段可能会累积数千笔的修改纪录。

在前述的积存纪录模型下，在新客户端加入协作时段时，势必遇上明显的启动延迟：它得先重新执行数千个指令，才能进行任何修改。

为了减轻这个问题，我们采用了快照机制。每当 100 个指令传送到协作时段后，服务器就会调查在线每个客户的状态，然后将最新收到的快照存储在积存纪录中。新加入的客户端仅需接收这个快照，以及快照存储之后新输入的指令即可。这样一来，它最多只需要重新执行 99 个指令。

加入快照機制的原型伺服器

这个权宜之计解决了新加入客户端的处理器延迟问题，但却带来了网络性能不佳的问题，因为它会每隔一阵子，就耗用每个客户端的上载带宽。若是连线速度缓慢，客户端后续指令的发送时间就会受到延迟。

除此以外，服务器没有办法确认客户端上传的快照是否正确。错误的快照会弄乱所有新加入者的状态，导致它们和其他其他共同编辑者失去一致性。

细心的读者也许会发现，这两个问题的症结，都是因为服务器缺乏执行电子表格指令的能力。如果服务器在接收到每个指令时，可以自行更新内部的电子表格状态，它其实根本不需要维护指令的积存纪录。

浏览器内的 SocialCalc 电子表格引擎，是用 JavaScript 语言写成。我们曾考虑过把它的逻辑转译成 Perl，以在服务器端执行，但是维护两套程序码需要付出极大的成本。我们也尝试在服务器端嵌入 JavaScript 引擎（V8、SpiderMonkey 等），但它们在 Feersum 事件回圈里运作时，会产生许多性能上的问题。

到了 2011 年 8 月，我们终于决定打掉重练，用 Node.js 重写服务器。

移植到 Node.js

由于 Feersum 和 Node.js 都以 libev 事件模型为基础，而且 Pocket.io 的程序接口跟 Socket.io 几乎相同，所以最初的改写十分顺利。

感谢 ZappaJS 框架提供的简洁接口，我们只花了一个下午，用了 80 行程序，就写出了功能相当的服务器。

简单的性能测试显示，Node.js 的处理效率比 Feersum 少了一半左右：在 2011 年的 Core i5 处理器上，Feersum+Tatsumaki 每秒可处理 5000 次请求，而 Node.js+Express 的每秒上限约为 2800 次请求。

由于这还在我们可接受的范围内，不致于影响日常使用，因此我们接受这项缺陷，并且期望它在一段时间后会有所改善。

在初步移植完毕之后，我们便着手将每个编辑阶段的电子表格状态存放在服务器端，以减少客户端的处理器使用，并大幅降低所需的带宽：

將試算表狀態存放於 Node.js 伺服器上

服务器端 SocialCalc

jsdom 是提升作业性能的关键技术，它完整实作了 W3C 文件对象模型，让 Node.js 能在模拟的浏览器环境内，载入写给客户端的 JavaScript 程序库。

利用 jsdom，我们可以在服务器端任意创建 SocialCalc 电子表格，它们会在各自的沙盒里进行计算：

require! <[ vm jsdom ]>
create-spreadsheet = ->
  document = jsdom.jsdom \<html><body/></html>
  sandbox  = vm.createContext window: document.createWindow! <<< {
    setTimeout, clearTimeout, alert: console.log
  }
  vm.runInContext """
    #packed-SocialCalc-js-code
    window.ss = new SocialCalc.SpreadsheetControl
  """ sandbox

每个协作时段都对应到一个沙盒内的 SocialCalc 控制器，即时执行客户端传来的指令。当新客户端加入时，服务器仅需传送电子表格控制器内的最新状态，从而彻底解决积存纪录带来的性能问题。

对测试结果感到满意之后，我们编写了一个以 Redis 为基础的存储引擎，并在 EtherCalc.org 公开测试。在接下来的六个月里，它展现了极佳的扩展性，顺利执行了数百万笔电子表格运作，没有发生任何状况。

2012 年 4 月，我在 OSDC.tw 大会上以 EtherCalc 为主题发表演讲，之后趋势科技公司邀我参加他们的黑客松，将 EtherCalc 改作成可编程序的视觉化引擎，用来即时监视网络流量资料。

为了这个使用案例，我们制作 REST 接口，以便用 GET、PUT 存取电子表格中的个别存储格，并使用 POST 将指令直接发送到电子表格内。在这场黑客松里，崭新的 REST 处理器每秒接收数百笔呼叫，在浏览器中即时更新图像及公式格内容，完全没有发生速度减缓或内存泄漏的状况。

然而在最后展示会上，当我们将流量资料输送到 EtherCalc，开始把公式输入浏览器中的电子表格时，服务器突然当掉，冻结了所有执行中的连线。我们重新执行 Node.js 作业，却只见它耗用 100% 的处理器资源，随即又锁住不动。

吃惊之余，我们换回较早的资料重新执行。它的运作没有问题，也让我们的展示得以完成。但我不禁在想：一开始导致程序当掉的原因究竟是什么？

Node.js 性能分析

要找出 CPU 卡在哪里，就得使用性能分析器。

Perl 初步原型的性能监测方式相当简单明瞭，这大半要归功于优秀的 NYTProf 工具，它能利用详尽的 HTML 报告以及互动式的函数呼叫视觉界面，详细列出每个函数、每个区块、每列、每个操作码的时间信息。除此以外，我们也利用 Perl 内建的 DTrace 支持，针对长时运行的程序，取得函数出入的即时数据。

相形之下，Node.js 的性能分析工具还有很大的进步空间。截至此时，DTrace 仍只能在 illumos 系作业系统的 32 位元模式下运行，因此我们大多得靠 Node Webkit Agent 提供的分析接口，即使它只提供函数层级的数据资料。

典型的运行方式如下：

# "lsc" 是 LiveScript 编译器
# 先载入 WebKit agent 模组，然后执行 app.js:
lsc -r webkit-devtools-agent -er ./app.js
# 另开一个终端机页签，启动分析器：
killall -USR2 node
# 在 WebKit 浏览器里开启下列网址，开始性能分析：
open http://tinyurl.com/node0-8-agent

为了重现沉重的后台负载，我们运用 ab 执行高度并行的 REST API 呼叫程序。为了模拟移动游标、更新公式等浏览器端的运作状况，我们采用了同样以 jsdom 和 Node.js 编写的无显示接口浏览器 Zombie.js。

有趣的是，我们发现瓶颈正是出在 jsdom 本身：

ab -n 10000 /_/1/html # 540rps

从上面的报告中可以看出，RenderSheet 占用 CPU 的时间最多：每当收到指令时，服务器都会用几微秒的时间重新绘制单元格的 innerHTML 属性，以反映指令的执行效果。

因为所有 jsdom 代码都在同一个线程中运行，所以后续的 REST API 呼叫将会卡住，直到上一命令的绘制过程结束为止。在高度并行的情况下，过长的队列触发了潜藏的瑕疵，最终使服务器当掉。

我们在仔细检查了对象使用情况之后，发现绘制结果几乎毫无用处，因为服务器端根本毋需即时显示 HTML 内容。唯一用到绘制结果的是“汇出 HTML”这个 API，但其实我们可以等到实际有人呼叫它时，再利用内存内的电子表格结构，绘制出每个单元格的 innerHTML 属性。

所以，我们移除了 RenderSheet 函数，用 20 行 LiveScript 代码重新实作了汇出 HTML 所需的极少数 DOM 接口，然后再运行了一次性能分析器：

經過更新的效能分析器螢幕截圖（去除 jsdom）

现在好多了！我们将流量提高了 4 倍，将 HTML 汇出速度加快了 20 倍，也顺利解决了死机问题。

多核心扩展

这一轮改进完成后，我们终于觉得没有顾虑，可以将 EtherCalc 整合到 Socialtext 平台里，为Wiki页面和电子表格提供同时编辑的功能。

为了确保实际上线时的响应效率，我们部署了一个反向代理 nginx 服务器，利用它的 limit_req 指令对 API 呼叫的速率设置上限。对于“防火墙内”和“专属远端服务器”这两种情况，执行结果确实都令人满意。

但是，对于中小型企业客户，Socialtext 还有第三种部署方式：“多户共用远端服务器”。在一台大型服务器里，我们同时为超过 35000 家公司提供服务，每家公司平均约有 100 位用户。

在这种多户共用情形里，所有执行 REST API 调用的客户的请求，都会计入每秒的最大请求次数，从而使每位客户的实际限制都严格得多，平均限制约为每秒请求 5 次。上一节中已经指出，这种限制的成因，是由于 Node.js 仅能使用一个 CPU 来执行所有计算操作：

事件伺服器（單處理器）

是否有办法利用大型服务器里那些闲置的 CPU 呢？

对于运行在多核心机器上的其他 Node.js 服务，我们采用了预先分支的 cluster-server 模组，同时运行与 CPU 数量相同的进程：

事件叢集伺服器（多處理器）

尽管 EtherCalc 确实能同时运行在多个服务器上（透过 Redis 作统筹），但在单一服务器的情形下，Socket.io 集群与 RedisStore 的相互作用会使程序逻辑变得非常复杂，难以侦错。

此外，如果集群里的每个进程都在忙着处理 CPU 计算，新来的连线仍然会被卡住。

因此，我们决定不采用固定数量的预先分支进程，而是设法为服务器内的每份电子表格各创建一个线程，从而让每颗 CPU 平均分摊所有的指令执行工作：

事件執行緒伺服器（多處理器）

W3C 定义的 Web Worker 界面，刚好符合这项需求。它原先是为了浏览器环境下，独立运行的后台线程而设计。如此一来，长时间运行的后台任务，便不会影响主线程的响应速度。

因此，我写出了 webworker-threads 这套 Node.js 模组，提供相容于 W3C 标准的跨平台接口。

利用 webworker-threads，可以轻易创建新的 SocialCalc 线程（每份电子表格约需 30kb 内存），并与其进行通信：

{ Worker } = require \webworker-threads
w = new Worker \packed-SocialCalc.js
w.onmessage = (event) -> ...
w.postMessage command

这套解决方案堪称两全其美：在多核环境下，我们可按照实际需求，分配多颗 CPU 供 EtherCalc 使用。在单核环境下，创建线程也仅需耗用极少的资源，即可将计算移到后台执行。

开发经验谈

不像 SocialCalc 项目有精准的规格定义及团队开发流程，EtherCalc 在 2011 年中到 2012 年底的这段时间里，仅是笔者个人的实验计划，用来评估 Node.js 是否足堪正式上线使用。

这样不受限制的自由度，让笔者得以尝试各式各样的语言、函数库、算法及架构。在这里，我希望能向各位分享这 18 个月来的一些开发经验。

限制带来解放

Fred Brooks 在《设计的设计》一书中提到“限制”的重要性：它让设计者可以缩小搜寻空间、帮助专注并加速设计流程。这也包括了自行加诸的限制：

在一个设计任务上加诸人为的限制有个好处，就是设计者日后可以自行放宽这些限制。在理想情况下，这可以引人踏进设计空间中未曾探索过的角落，藉以激发创意。

在 EtherCalc 多次更迭的开发过程里，自行加诸的限制，让项目得以维持核心概念的完整。

举例来说，乍看之下，为三种不同的运行架构（内部网络、互联网、及多用户托管）各自定制一套服务器，似乎是不错的主意。但是，这种“过早的优化”，却会严重干扰核心概念的一致性。

与此相反，我持续专注在如何让 EtherCalc 在处理器、内存及网络同时受限时仍能运作顺畅，毋需顾此失彼。事实上，由于对于内存的需求小于 100MB，就算是像 Raspberry Pi 这样的嵌入式平台，都能轻松地运行 EtherCalc。

这样自我要求的设计，让将 EtherCalc 得以部署在三项资源都受限，而非只限制一项的“平台即服务”环境（例如 DotCloud、Nodejitsu 及 Heroku）下。这让人们可以轻易地架设电子表格服务，进一步促使独立的整合开发者作出更多贡献。

劣即是夯

在 2006 年于芝加哥举办的 YAPC::NA 大会上，笔者受邀对开源社区的未来发表预测，以下是我当时的发言：

虽然我无法证明，但我认为明年 JavaScript 2.0 将会达成自举、编译回 JavaScript 1，并且取代 Ruby，成为各个环境中的明日之星。

我认为 CPAN 与 JSAN 将会整并；JavaScript 会成为所有动态语言的普遍基础。Perl 将可以编译成 JavaScript，在浏览器、服务器及数据库中运行，并共用一套开发工具。

正因为“劣即是夯”的缘故，所以最差劲的语言，注定会成为最棒的。

我当时的看法，随着能以机器码速度执行的新一代 JavaScript 计算引擎出现，在 2009 年成为现实。到了 2012 年时，JavaScript 已成为“编写一次，随处运行”的虚拟机器；其他各式主要语言，包括 Perl，也都能被编译成 JavaScript。

除了客户端的浏览器与服务器端的 Node.js 之外，我们也让 JavaScript 能在 Postgres 数据库内运行，并在这三种运行环境下共用模组。

是什么促成了社区这样快速的成长？回到我开发 EtherCalc 的初期，参加刚具雏形的 NPM 社区的经验，我推估这是因为 JavaScript 并不强加特定的世界观到程序上，而是将自身融入许多不同的用途里。因此，创新者得以专注于创造字汇与用法（例如 jQuery 与 Node.js），从同一个自由的核心出发，淬炼出自己心目中的“优良部份”。

对新加入的开发者来说，只学到语言的一小部份就可以上手开发；资深的开发者则可以挑战既有传统，将它修改演进成为更好的版本。相对于仰赖一群核心团队将语言设计成适合所有预期的用途，JavaScript 的草根开发演进历程呼应了 Richard P. Gabriel 著名的“劣即是夯”概念。

旧语新枝

相对于 Coro::AnyEvent 直接了当的 Perl 语法，Node.js 以回调为基础的程序接口，迫使我们写出层层相叠、难以重复利用的内嵌函数。

在尝试过许多辅助流程控制的程序库之后，我们最后决定改用 LiveScript 这套崭新的程序语言。它的语法深受 Perl 及 Haskell 影响，并且可以直接转译成 JavaScript。

事实上，EtherCalc 历经四种一脉相承的语言：JavaScript、CoffeeScript、Coco 与 LiveScript，每次移植都带来更好的表达力。js2coffee 与 js2ls 这些自动转译工具，也让程序码得以保有向前及向后的兼容性。

由于 LiveScript 直接编译成为 JavaScript，用它写出来的程序可以用原生速度运作，同时也完整支持以函数为范围的性能分析器。

LiveScript 使用新颖的建构方式，像是 backcall 与 cascade，来减少巢状回调。它也让我们得以使用强大的语意工具，来自由组合函数式及对象导向的程序布局。

我对 LiveScript 的第一印象是“像是蕴含在 Perl 6 里的轻量语言，挣扎着想要诞生…” — 透过专注于语法的亲和力，并采用与 JavaScript 相同的语意，这个新语言想达成的目标，确实比 Perl 6 要容易多了。

自由之零

自由软件基金会持续倡导四大类的软件自由。其中最基本的一种，称为“自由之零”，就是“无论为任何目的，都能执行程序的自由”。

在二十世纪，开源软件及私有软件都赋予使用者这种自由。我们太习惯这种自由，以致认为它理所当然，直到“云计算”出现为止。

将资料托管在共享的服务器上，并不是什么新的概念。远端存储服务的历史，几乎跟互联网一样悠久，而在持续进步的传输与加密技术防范资料遗失及窜改下，它们通常也都能顺利运作。

但是到了这个世纪，远端存储逐渐与远端计算及通信挂勾。一旦我们将计算交给远端的服务器，便再也不可能“为任何目的执行程序”了。取而代之的情况，是服务运营者独占了计算的内容，并拥有不受监管而能检视、审查使用者资料的权力。

因此，在“日常倚赖的程序都应该能取得源代码”这个众所周知的理念之外，“只将资料交给我们能信任的服务器进行计算”也是同等重要。为了达成这个目的，我将 EtherCalc 设计成可以轻易安装，因此它永远都能在您自己的电脑上运作。

Socialtext 为了 SocialCalc 电子表格的引擎，特别制定了通用公共授权，让使用者可以向服务运营者要求完整的 JavaScript 源代码，来鼓励服务运营商将他们所做的修改贡献出来。

至于 EtherCalc 这套多人协作服务器，笔者已将它捐入公众领域，让它可以整合进各式内容管理系统里。如此一来，任何人都能轻易为自己的团队架设一套电子表格协作系统。很多人已经这样做了，也非常欢迎您的加入！

（简体中文翻译：李勇强）