对近期FUD事件有感：如何客观理性解读数据？

来自：

自FTX暴雷事件之后，我发现大家对链上数据敏感起来了，诸如项目方链上地址资金异动（要跑路？），大户资产流入交易所（砸盘出货？），机构地址资金异动（要暴雷？）等被当成BreakNews来FUD。但链上数据只能反映客观链上动态，并不能100%匹配链下人为动机。此Thread科普下标记Labels的技术逻辑。

先贴几个FUD事实：

1)Dragonfly转入Binance PERP要出货，高点买，低点卖被解读为机构被割韭菜，但事实没有人能证明Dragonfly的买单价同步于二级市场；

2)Amber co-founder TTK接收公司5000ETH，被指中饱私囊，但其实地址标签可能存在错误。类似的消息，每天有很多，链上数据真能佐证FUD的事实吗？

事实上链上数据的每一次 Transfer Event是客观存在的，但涉及到交易所地址标签，大户个人标签，机构地址标签等链下Entity标签却未必100%精确。因为地址标签都是链下属性，交易所等真实的地址标签并没有完全披露。要完全挖掘需要用算法推演，线下证实等社会化工程，只能接近事实，但难真正划等号。

先来说Address lables，现在各大浏览器和数据服务平台，基于UTXO特性的Common Spending 和One-Time-Change等技术原理来追溯，搜集了数以亿级的Entity地址标签。此外，交易所地址、矿池地址、Mixer洗钱地址、博彩赌博地址等都有不同的业务特性，可区别建模甄别，比如，矿工地址收款没有input来源

何为Common Spending：简单来说，如果一笔 (BTC) 交易同时有多个输入地址，那么就可以认定这些输入地址是由同一个Entity控制。我们可以通过提取交易所用户的充值种子地址不断辐射，通过上下层追溯挖掘更多的关联新地址，再根据地址之间的互动，归类冷、热等钱包，进而囤积越来越多的labels。

无论如何这些标签都是第三方通过技术手段推算而来，如果交易所高频率更换种子地址，或者有意用混币mixer手段遮掩地址，这样已有的地址标签也会失效。Common Spending推论地址标签的准确性取决于Entity的种子地址数和其更换频率，可以反侦察。只是因为交易所也要在各地搞合规，没必要这样做。

而且交易所的业务场景很复杂，单纯看链上数据很难揣测背后意图：

1）交易所冷热钱包大额转账，可能是钱包归集整理；

2）交易所Entity之间大额互转，可能只是大户提币；

3）交易所地址资金流入未知地址，可能是提币也可能是同一主体钱包整理；这些动态可辅佐分析，但推论跑路、砸盘等人为原因不够严谨。

其实，安全和数据公司一开始搜集地址标签的本意，主要为了服务AML资产追踪业务，在黑客洗钱时能够第一时间协助警察，进行技术取证，让赃款能被有效封堵。由于黑客大都会采用干净的新地址，且黑客洗钱需要依赖CEX的交易深度，链上数据异动在资产追踪业务场景下的预警意义才最大。

现在很多链上Alert机器人每天都会发送各类大额转账和涉及Entity的转账交易，大家能及时捕捉并响应，是会避开一些风险。但不排除个别数据被错误或扩大解读，这带来的市场Fomo和挤兑影响，也会真实波及每个人的资产。 如何客观理性解读数据，对数据预警公司、媒体、以及FUD中的每个人都是挑战。