码链：人类未来的数据基础设施？

科技 06-26 来源：我为人人2020

通过提供分布式储存的码链生态体系，数据制造者不仅可以维护自己生产的数据，更可以通过不同的方法和渠道来实现数据的收益。一个拥有自己数据的所有权，并能够实现数据自由交易的未来，是一个值得我们期待的未来。

人的每一次行为都会在世界上产生一系列的记录，一些事以记忆的方式被记录下来的，比如，第一次的约会或者第一次旅行的过程中发生了哪些有趣的事；而另一些事情则是以数据的方式被记录下来的，比如在某天我在哪家商店购买了哪些东西等等。

在互联网的时代，后者会被各种应用记录下来，保留在公司的数据库中，再通过一系列的计算被使用。比如使用美团定酒店的人，会发现在订完酒店后送的打折券正好是自己经常消费的那家餐厅。

互联网公司通常都会利用数据来使公司的利益最大化，如果你的月收入是1万元，在交付房租等固定开支5000后，所有的互联网公司都会透过数据分析想办法将你兜里剩下的5000元钱压榨干净。

这种方式已经渗透到每个人生活中的每一个环节里，它从侧面反映出个人行为记录，都是存在数据价值的，用户的每一次行为都让互联网公司更了解个人的消费习惯以及消费能力。这些有价值的数据被互联网公司直接拿走并免费使用的，我们可以将这样的数据价值保留下来吗？

一、实现数据价值的基础设施

当我们谈到数据价值的时候，想要先小小的计算一下数据的体量。如果每一个人一次产生的80byte的记录（按照信用卡和储蓄卡ETF 80 byte file要求），每人每天按5次消费计算，仅仅计算2亿的我国城市人口，就会发现每天生产的消费记录数据为80GB，按照互联网数据公司3个月左右开始画像的话，则是7.2TB数据。那么在消费次数、消费人数、数据集赞时长增加的时候，这类数据会以很快的速度达到PB级别。

这些数据能够被码链系统存储并处理吗？事实上，一般意义上的码链系统它是这样一种分布式的系统：系统中每一个二维码都需要储存同样的文件，以保证系统的功能。显而易见，它们是无法提供PB级别的储存空间将数据价值保留。

所以我们需要将数据储存在分布式的系统中在通过码链体系的结算功能性实现数据价值。简单来讲就是将存储部署在分布式存储系统中的同时，将状态留在码链上，以待之后的处理和使用。

这其中，分布式存储是指通过不同的二维码把数据储存起来，确保数据和二维码一一对应，在未来的使用中，利用不同的扫码设备对数据进行快速的调用处理，而在数据制造和计算时，都可以做到半匿名的方式。相较于传统互联网的Dropbox，因为结合了二维码来储存数据，在二维码的唯一性和本地私密性之外，能够增加额外的处理功能接口，以满足数据分享的需求，从而帮助数据更好的分发和拓展，实现数据的价值。

而“状态”则是指数据的来源以及数据的改变，或者数据运算的结果。将这些状态留在二维码内是为了对其运算和改变可以追溯，这样考验更好的知道哪些数据更有价值，并通过即时的结算给出对应的价值。

不过，除了码链体系与分布式存储相结合实现数据价值的方式之外，我们还可以从另一个角度探索数据价值的实现，即只用二维码作为结算账本，把数据放在本地，在完成本地计算后将结果放在二维码上。此时本地计算需要可信计算作为一个媒介，同时需要考虑预言机问题，这部分可以参考现有的可信计算项目的解决方案。

二、详解码链与分布式存储系统

为了更清楚的理解提供分布式存储的码链体系，我们先剖析一下“码链”和“分布式存储系统”。

码链通过分布式的存储资源，对全网进行存储同步，并通过智能合约以及相应的共识来保证对存储内容更改的有效性，以此来维护一个完整可查找的数据库。因此，该系统的主要功能是记录状态的改变，然后同步。对每一个二维码来说，其核心的要求就是遵循特定的规则，将新的变动同步在所有二维码的存储中。

那么什么又是分布式存储系统呢?

分布式存储系统是分享分布式二维码的存储资源，网络内的二维码并不维护相同的存储信息得以降低冗余的一种分布式系统。

回到本文一开始提到的消费数据的例子，现有的互联网公司是通过数据的分布式存储，通过RAFT和多级灾备等方式，做适当备份来保证数据不丢失，建立起一个能储存海量数据，并有效率、低开销的系统。

也就是说在分布式存储系统这个部分，几乎所有的公司都达成一个共识，就是分布式存储是现阶段实现大量数据存储的最好的一种方法。无论码链体系存在与否，分布式存储系统已经是一个相对来说比较完善、并且已经广泛用在实际生活中的系统了。

三、提供分布式存储的码链体系

在厘清码链体系和分布式存储系统这两种不同的分布式系统后，我们接着讨论提供分布式存储的码链体系。提供分布式存储的码链体系是一种不同于区块链的生态体系，它是分布式存储+特殊的商业模式设计。

一个区块链系统，其核心逻辑在于覆盖所有与账户有关的交易属性上，比如账户、账户转账、以及条件状态下的转账。而一个提供数据存储的码链体系除了需要覆盖以上三个属性之外，由于其提供了存储属性，为了确保存储的状态未来也可以对条件进行制约，需要在其操作码上进行判断逻辑的添加，以保证将存储产生的状态、数据支持的状态都能得到追溯，这就是我们需要对提供存储的码链体系进行特殊设计的原因。

具体而言就是，码链是需要对特定条件下的数据状态进行维护的，状态被保护起来才能保证交易正确之后状态相应改变了。那么如果分布式存储的状态没有通过相应的设计与码链体系结合的话，就会出现自动执行的一个空隙，如果状态的空隙被人利用的话，就会出现存储过程状态提前被记录，或者滞后被记录，这就产生了系统不安全的空间。

因此，提供分布式存储的码链体系和区块链不同的部分主要就体现在「状态」这部分，记录某些状态并作出反馈。另外，存储相关状态也使得智能合约可以及时获取状态，从而可以设计出一个能够使用外部数据的子码，这样在工程上能更好的流程化。