什么是数字指纹？

A数字指纹它是由网络、浏览器、设备和行为信号组合而成的集合，无需依赖Cookie即可唯一标识在线用户或会话。其工作方式为被动式：您访问的任何网站均可收集这些信号，并在不同访问或账户之间建立关联。最终形成一个持久标识符，即使在隐私浏览、删除Cookie或使用VPN的情况下，该标识符依然有效。

数字指纹是如何构建的

指纹是多种特征的组合，而非单一信号。浏览器在正常渲染网页时会暴露数十种属性：用户代理字符串、已安装字体、Canvas 像素输出、WebGL 渲染器、音频处理行为、屏幕分辨率、时区等。每种属性都会缩小潜在用户群的范围；这些属性综合起来，便能锁定特定设备。

研究证实了这种组合的有效性。一项2024年的研究（《评估网络指纹识别风险》，WWW 2024，arXiv 2403.15607（2024）对多个语料库进行了综述，发现唯一性比率在33.6%（Gomez-Boix，约200万个样本）到89.4%（Laperdrix等人，约11.8万个样本）不等，而埃克尔斯利（Eckersley）早先的研究在约47万个样本中得出的该数值为83.6%。这一差异表明，研究方法和语料库构成对测得的唯一性影响极大。同一项2024年的研究基于数十万个网站上的数千万次真实Chrome会话，证实即使浏览器增加了随机化机制，组合的Web API信号仍具有足够的信息熵来识别用户，（《评估网络指纹识别风险》，WWW 2024，arXiv 2403.15607, 2024）。

IP地址也是指纹的一部分。机器人检测系统会将浏览器信号与IP的ASN、地理位置及信誉度进行交叉比对。如果真实的浏览器特征与数据中心IP之间存在不匹配，这本身就是一种检测信号。

使用场景

欺诈检测。 银行和电子商务平台会通过设备指纹识别技术来检测凭证填充、账户劫持和支付欺诈。当已知账户出现新的设备指纹时，系统会触发额外的验证步骤。

广告展示次数上限。 广告商通过将广告展示与设备指纹而非Cookie挂钩，从而在跨浏览器及Cookie删除后，对每位用户的广告展示次数设置上限。

网络数据收集。 自动化客户端必须呈现一致且合理的指纹，以避免因被识别为机器人而遭到封禁。所有信号（包括 IP 地址、浏览器版本、canvas 哈希值和 TLS 指纹）都必须保持一致。使用来自设备接入网络的住宅 IP，可确保网络层与真实消费者设备呈现的情况相符，从而降低 IP 地址本身触发不匹配标记的风险。

身份验证。 反欺诈和合规产品将指纹识别与活体检测相结合，从而在多次交互过程中将会话与经过验证的用户建立关联。

常见问题解答

浏览器指纹识别是数字指纹的一个组成部分。完整的数字指纹还包括网络层（IP地址、ASN、地理位置）、设备级信号（屏幕尺寸、硬件并发能力）以及行为信号（打字节奏、鼠标移动）。浏览器指纹识别仅涵盖浏览器渲染和 JavaScript API 所暴露的信号。

私密浏览会清除Cookie，但不会改变硬件或浏览器API信号。VPN会更改IP地址，但不会影响canvas、字体和WebGL的输出。大多数指纹识别系统会综合利用多种信号，因此仅靠其中任何一种措施都不足以避免被检测到。

指纹识别依赖于浏览器在正常页面渲染过程中默认暴露的信号：用户代理标头、画布输出、WebGL 功能、音频行为等。无需显示权限提示。某些隐私法律将指纹识别视为个人数据处理，但具体执法情况因司法管辖区而异。

语料库的规模和构成是主要因素。规模较小且同质性较高的样本，其独特性比率高于包含大量相同移动设备的大型、多样化语料库。2024年WWW研究证实，在测量指纹熵时，方法论比底层技术更为重要（《评估网络指纹识别风险》，arXiv 2403.15607, 2024）。