数据屏蔽:定义、类型以及如何实现

数据屏蔽
图片来源:canva.com

每年,数据泄露都会暴露数百万人的敏感数据,导致众多企业损失数百万美元。 2023 年迄今为止,数据泄露的平均成本为 4.24 万美元。 在所有被泄露的数据类型中,个人身份信息 (PII) 的成本最高。 因此,数据安全已成为许多企业面临的重大问题。 因此,数据脱敏已成为许多公司保护敏感数据的关键工具。 在本文中,我们将讨论动态和 salesforce 数据脱敏技术和工具。

什么是数据脱敏 (DM)?

数据脱敏也称为数据混淆,是一种用于创建组织数据的虚假但真实副本的技术。 目的是保护敏感数据,同时在不需要真实数据时(例如在用户培训、销售演示或软件测试中)提供功能替代。

数据混淆过程会改变数据值,同时保持相同的格式。 目标是开发一个无法解码或逆向工程的版本。 字符改组、单词或字符替换以及加密都是更改数据的方法。

数据屏蔽的类型

许多数据屏蔽类型通常用于保护敏感数据。

#1. 静止的

静态数据混淆技术可能会帮助您创建数据库的干净副本。 该方法会修改所有敏感数据,直到可以共享数据库的安全副本。 通常,该过程需要生成生产数据库的备份副本,将其加载到单独的环境中,删除任何不需要的数据,然后在其处于停滞状态时进行数据混淆。 然后可以将屏蔽的副本传送到所需的位置。

#2. 确定性

它需要将两组数据映射为相同类型的数据,以便一个值始终被另一个值替换。 例如,名称“John Smith”在任何出现的数据库中始终会被替换为“Jim Jameson”。 这种方法在许多情况下都很有用,但本质上不太安全。

#3。 即时

在将数据保存到磁盘之前,屏蔽数据从生产系统传输到测试或开发系统的过程。 经常部署软件的组织无法生成源数据库的备份副本并将其隐藏——他们需要一种方法将数据从生产环境持续馈送到各种测试环境。

#4。 动态的

数据永远不会保存在开发/测试环境中的辅助数据存储中,类似于即时屏蔽。 相反,它直接从生产系统流式传输,并由开发/测试环境中的另一个系统摄取。

数据屏蔽技术

以下是用于保护数据集中的敏感数据的几种常见数据脱敏技术。

#1. 数据假名化

允许您用笔名或别名替换原始数据集,例如姓名或电子邮件地址。 这个过程是可逆的——它会去识别数据,同时在必要时允许最终重新识别。

#2. 数据匿名化

一种对将个人与屏蔽数据联系起来的标识符进行编码的方法。 目的是保护用户的私人行为,同时保持屏蔽数据的可信度。

#3。 查找替换

可以使用附加查找表来屏蔽生产数据库,该查找表为原始敏感数据提供替代值。 这使您能够在测试环境中使用真实数据,同时保护原始数据。

#4。 加密

由于查找表很容易被黑客攻击,因此最好对数据进行加密,以便只能通过密码进行访问。 您应该将此与其他数据屏蔽技术结合起来,因为数据在加密时不可读,但在解码时可见。

#5。 密文

如果 QA 或开发不需要敏感数据,则可以在开发和测试设置中将其替换为通用值。 在这种情况下,不存在与原始数据具有相似属性的实际数据。

#6。 平均

如果您希望以平均值或聚合的形式反映敏感数据,而不是单独反映敏感数据,则可以将表中的所有数字替换为平均值。 例如,如果表包含员工工资,您可以通过将其全部替换为平均工资来隐藏个人工资,因此总体列反映了合并工资的真实总值。

#7. 洗牌

如果您需要在屏蔽值时保持唯一性,请对数据进行打乱,以便保留真实值,但将其分配给各个元素。 实际工资将在工资表示例中呈现,但不知道谁的工资发给了哪个员工。 此策略最适合较大的数据集。

#8。 日期切换

如果相关数据包含您想要保密的日期,您可以将策略应用于每个数据字段以掩盖真实日期。 例如,您可以将所有活动合约的日期向后移动 100 天。 这种策略的缺点是,由于相同的策略适用于一个领域中的所有值,因此损害一个值就意味着损害所有值。

动态数据屏蔽

动态数据脱敏 (DDM) 是数据库管理系统中使用的一种安全机制,用于防止对敏感数据进行未经授权的访问。 它使数据库管理员能够通过向非特权用户屏蔽敏感数据来防止敏感数据泄露,同时仍然授予他们访问所需数据的权限。

DDM 实时工作,在从数据库中搜索或检索数据时,用虚构或混淆的数据替换敏感数据。 这可确保敏感数据永远不会暴露给非特权用户或程序,同时仍授予授权用户访问其所需信息的权限。

DDM 可用于以多种方式屏蔽数据,包括屏蔽完整值、部分值或信息格式。 例如,可以通过用星号 (*) 替换除最后四位数字之外的所有数字来隐藏信用卡号,而可以通过用星号替换前五位数字来隐藏社会安全号码。

DDM 在多个用户或应用程序需要敏感数据访问的环境中尤其有用,例如医疗保健或金融系统。 它可以防止敏感数据暴露给未经授权的个人或应用程序,从而帮助企业遵守 GDPR 或 HIPAA 等数据隐私规则。

数据屏蔽工具

数据屏蔽工具是防止未经授权使用复杂信息的安全工具。 此外,数据屏蔽工具用虚假数据替换复杂数据。 它们可用于最终用户输入数据的应用程序开发或测试过程的任何部分。

在本节中,我们探讨了几种有助于避免数据滥用的工具。 这些是小型、大型和中型企业最流行和广泛使用的数据脱敏工具。

最佳数据屏蔽工具列表

下面列出了市场上最常见的数据脱敏工具。 下表比较了市场上最好的数据脱敏软件。

#1. K2View 数据脱敏

K2View 保护整个公司静态、使用和传输的敏感数据。 该技术将数据独特地组织到业务实体中,同时确保引用完整性并提供多种屏蔽功能。

#2. IRI 场盾

IRI 是一家总部位于美国的独立软件供应商,创建于 1978 年,以其 CoSort 快速数据转换、FieldShield/DarkShield/CellShield 数据混淆以及 RowGen 测试数据生成和管理解决方案而闻名。 此外,IRI 在大型数据管理平台 Voracity 中捆绑并整合了数据发现、集成、迁移、治理和分析。

#3。 DATPROF – 简化的测试数据

DATPROF 提供了一种屏蔽和生成数据库测试数据的智能方法。 它包含一种专利算法,可以快速轻松地对数据库进行子集化。

该软件具有易于使用的界面,可以处理复杂的数据链接。 它提供了一种极其聪明的方法来暂时绕过所有触发器和限制,使其成为市场上性能最佳的工具。

#4。 IRI 暗盾

IRI DarkShield 将同时查找大量“暗数据”来源中的敏感数据并对其进行去识别化处理。 使用 Eclipse 的 DarkShield GUI 来识别、检测和屏蔽“隐藏”在自由格式文本和 C/BLOB DB 列、复杂的 JSON、XML、EDI 和 Web/应用程序日志文件、Microsoft 和 PDF 文档中的个人身份信息 (PII) 、图片、NoSQL DB 集合等等。

#5。 准确的数据发现和屏蔽

Accutive 的数据发现和数据屏蔽解决方案 (ADM) 允许您识别和隐藏重要的敏感数据,同时保证跨多个来源保留数据属性和字段。

数据发现根据预先配置的、可配置的合规性标准或用户定义的搜索词有效地识别敏感数据集。 您可以将数据发现结果合并到数据混淆配置中,也可以创建自己的数据混淆配置。

#6。 Oracle 数据屏蔽和子集化

Oracle Data Masking 和 Subsetting 通过提高安全性、加快提交速度和降低 IT 成本来帮助数据库客户。

通过删除冗余数据和文件,它有助于消除测试数据、开发和其他操作的重复。 该工具建议绘制数据并采用屏蔽描述。 它生成编码的 HIPAA、PCI DSS 和 PII 指南。

Salesforce 数据屏蔽

Salesforce 数据屏蔽是一种安全工具,可使用虚假或混淆的数据来隐藏或替换 Salesforce 组织中的敏感数据。 它是一种动态数据屏蔽 (DDM),可在从 Salesforce 组织实时搜索或检索敏感数据时屏蔽敏感数据。

管理员可以使用 Salesforce Data Masking 指定哪些字段或对象包含敏感数据,然后将屏蔽规则应用于这些字段或对象。 屏蔽规则可以配置为屏蔽完整值、部分值或值格式。

Salesforce 数据脱敏可用于限制敏感数据向未经授权的个人或应用程序的暴露,从而遵守 GDPR、CCPA 和 HIPAA 等数据隐私标准。 它还可以帮助公司保护敏感数据免受内部危险,例如无意或故意的数据泄露。

Salesforce 数据屏蔽是为 Salesforce 组织提供的高级附加功能。 它可以使用 Salesforce Shield 平台进行定制,该平台添加了安全功能,包括事件监控、加密和合规性报告。

总体而言,对于需要保护 Salesforce 组织中敏感数据同时遵守数据隐私规则的企业来说,Salesforce Data Masking 是一个有用的解决方案。

数据脱敏最佳实践

#1. 确定项目范围

公司必须了解必须保护哪些信息、谁有权访问这些信息、哪些应用程序使用这些数据以及数据位于生产和非生产领域的何处,以便正确执行数据混淆。 虽然这在纸面上似乎是一个简单的过程,但由于操作和各种业务线的复杂性,它可能需要大量工作,并且必须设计为项目的单独阶段。

#2. 保持引用完整性

引用完整性要求源自业务应用程序的每种“类型”信息都使用相同的算法进行屏蔽。
在整个企业中使用单一的数据混淆解决方案在大型企业中是不可行的。 由于预算/业务要求、各种 IT 管理程序或不同的安全/监管要求,每个业务线可能需要开发自己的数据混淆。

#3。 保护数据脱敏算法

解决如何保护数据生成算法以及用于混淆数据的替代数据集或字典至关重要。 由于只有授权用户才能访问实际数据,因此必须极其谨慎地对待这些算法。 发现正在采用哪些重复屏蔽策略的人可以对大块敏感信息进行逆向工程。

屏蔽的概念是什么?

屏蔽是隐藏或伪装信息的行为,以保护敏感数据免遭不必要的访问或暴露。 屏蔽可用于多种数据类型,包括个人身份信息 (PII)、信用卡号和财务信息。

数据脱敏和加密有什么区别?

数据混淆和加密都用于保护敏感数据,但它们服务于不同的目标并以不同的方式运行。

数据混淆和加密之间的主要区别在于,屏蔽除屏蔽本身之外不提供进一步的安全性,但加密通过使未经授权的用户无法读取数据来提供高级别的安全性。

数据脱敏和数据隐藏有什么区别?

数据屏蔽和数据隐藏是保护敏感数据的两种方法,其工作方式各不相同。

数据脱敏和数据隐藏之间的主要区别在于,脱敏允许授权用户访问数据,而隐藏则禁止所有用户获取敏感数据。 当授权用户需要访问敏感数据时(例如在开发或测试环境中),通常会使用数据混淆,而数据隐藏则用于向所有用户屏蔽敏感数据(例如在生产环境中)。

什么是两种数据屏蔽方法?

有多种数据混淆方法可用于保护敏感数据,但其中最突出的两种是替换和改组。

  • 代换。
  • 洗牌

替换和混洗都可用于保护各种场景​​中的敏感数据,包括数据库管理、应用程序开发和数据分析。

如何在 SQL 中屏蔽数据?

根据组织的需求和使用数据的上下文,有多种方法可以在 SQL 中屏蔽数据。 以下是一些常见的 SQL 数据混淆方法:

  • 使用替换命令
  • 使用 SUBSTRING 函数
  • 使用自定义函数

如何屏蔽 Excel 中的数据?

在 Excel 中屏蔽数据的方法有很多种,具体取决于组织的需求和数据使用的环境。 以下是一些常见的 Excel 数据混淆方法:

  • 使用独特的数字格式
  • 使用 SUBSTITUTE 功能
  • 使用随机数生成器

为什么需要数据脱敏?

需要数据混淆来保护敏感数据免遭不必要的访问或暴露,同时允许授权用户获取他们所需的信息。 例如,个人身份信息 (PII)、财务数据和医疗记录可能成为攻击者或恶意内部人员的有利可图的目标,他们可能会利用这些数据进行身份盗窃、欺诈或其他有害目的。

总结

数据脱敏已发展成为全球企业用来遵守隐私要求的技术支柱。 尽管数据混淆已经实践多年,但结构化和非结构化数据的庞大数量以及不断变化的监管环境已经加剧了企业规模数据混淆的复杂性。

事实证明,目前的数据混淆供应商的产品还不够。 另一方面,一种新的基于实体的技术正在为一些世界顶级企业的数据混淆制定规范。

参考资料

发表评论

您的电邮地址不会被公开。 必填带 *

你也许也喜欢