DATA MASKING: Definição, Tipos e Como Implementar

Mascaramento de dados
Crédito da foto: canva.com

Todos os anos, violações de dados expõem milhões de dados confidenciais de pessoas, fazendo com que várias empresas percam milhões. O custo médio de uma violação de dados até agora em 2023 é de US$ 4.24 milhões. Entre todos os tipos de dados violados, as informações de identificação pessoal (PII) são as mais caras. Como resultado, a segurança dos dados tornou-se uma questão importante para muitas empresas. Como resultado, o mascaramento de dados tornou-se uma ferramenta crítica para muitas empresas protegerem seus dados confidenciais. Neste artigo, discutiremos sobre as técnicas e ferramentas de mascaramento de dados dinâmicos e da força de vendas.

O que é Mascaramento de Dados (DM)?

O mascaramento de dados, também conhecido como ofuscação de dados, é uma técnica para criar uma réplica falsa, mas realista, dos dados da sua organização. O objetivo é proteger dados confidenciais e, ao mesmo tempo, oferecer uma substituição funcional quando dados reais não são necessários, como no treinamento de usuários, demonstrações de vendas ou testes de software.

Os processos de ofuscação de dados alteram os valores dos dados, mantendo o mesmo formato. O objetivo é desenvolver uma versão que não possa ser decodificada ou submetida a engenharia reversa. Embaralhamento de caracteres, substituição de palavras ou caracteres e criptografia são métodos para alterar os dados.

Tipos de mascaramento de dados

Vários tipos de mascaramento de dados são usados ​​rotineiramente para proteger dados confidenciais.

#1. Estático

As técnicas de ofuscação de dados estáticos podem ajudá-lo a criar uma réplica limpa do banco de dados. O método modifica todos os dados confidenciais até que uma cópia segura do banco de dados possa ser compartilhada. Normalmente, o processo envolve a produção de uma cópia de backup de um banco de dados de produção, carregando-o em um ambiente separado, removendo todos os dados desnecessários e, em seguida, a ofuscação de dados enquanto está em estase. A cópia mascarada pode então ser entregue no local desejado.

#2. determinístico

Isso envolve o mapeamento de dois conjuntos de dados com o mesmo tipo de dados, de modo que um valor seja sempre substituído por outro valor. Por exemplo, o nome “John Smith” é sempre substituído por “Jim Jameson” em qualquer banco de dados onde apareça. Essa abordagem é útil em muitas situações, mas é intrinsecamente menos segura.

#3. No vôo

Mascare os dados à medida que são transportados dos sistemas de produção para os sistemas de teste ou desenvolvimento antes de salvar os dados no disco. As organizações que frequentemente implantam software não podem gerar uma cópia de backup do banco de dados de origem e ocultá-la — elas exigem um método para alimentar dados continuamente da produção para vários ambientes de teste.

#4. Dinâmico

Os dados nunca são mantidos em um armazenamento de dados secundário no ambiente de desenvolvimento/teste, semelhante ao mascaramento instantâneo. Em vez disso, é transmitido diretamente do sistema de produção e ingerido por outro sistema no ambiente de desenvolvimento/teste.

Técnicas de mascaramento de dados

Aqui estão várias técnicas comuns de mascaramento de dados para proteger dados confidenciais em seus conjuntos de dados.

#1. Pseudonimização de dados

Permite substituir um conjunto de dados original, como um nome ou endereço de e-mail, por um pseudônimo ou alias. Este procedimento é reversível - ele desidentifica os dados enquanto ainda permite uma eventual reidentificação, se necessário.

#2. anonimização de dados

Um método para codificar identificadores que vinculam indivíduos a dados mascarados. O objetivo é proteger o comportamento privado dos usuários, mantendo a credibilidade dos dados mascarados.

#3. Substituição de pesquisa

Um banco de dados de produção pode ser mascarado usando uma tabela de pesquisa adicional que fornece valores alternativos aos dados confidenciais originais. Isso permite que você use dados realistas em um ambiente de teste enquanto protege o original.

#4. Criptografia

Como as tabelas de pesquisa são facilmente invadidas, é melhor criptografar os dados para que possam ser acessados ​​apenas com uma senha. Você deve combinar isso com outras técnicas de mascaramento de dados porque os dados são ilegíveis quando criptografados, mas visíveis quando decodificados.

#5. Redação

Se os dados confidenciais não forem necessários para controle de qualidade ou desenvolvimento, eles poderão ser substituídos por valores genéricos nas configurações de desenvolvimento e teste. Não há dados realistas com propriedades semelhantes ao original neste cenário.

#6. Média

Você pode substituir todos os números na tabela pelo valor médio se desejar refletir dados confidenciais em termos de médias ou agregados, mas não individualmente. Por exemplo, se a tabela contiver salários de funcionários, você poderá ocultar os salários individuais substituindo-os todos pelo salário médio, de modo que a coluna geral reflita o valor total real do pagamento combinado.

#7. Embaralhar

Se você precisar preservar a exclusividade ao mascarar valores, embaralhe os dados de forma que os valores verdadeiros permaneçam, mas sejam atribuídos a vários elementos. Os salários reais serão apresentados no exemplo de tabela de salários, mas não será conhecido de quem é o salário de qual funcionário. Essa estratégia funciona melhor com conjuntos de dados maiores.

#8. Mudança de data

Se os dados em questão contiverem datas que você deseja manter privadas, você pode aplicar políticas a cada campo de dados para mascarar a data verdadeira. Você pode, por exemplo, retroceder 100 dias as datas de todos os contratos ativos. A desvantagem dessa estratégia é que, como a mesma política se aplica a todos os valores em um campo, comprometer um valor significa comprometer todos os valores.

Mascaramento Dinâmico de Dados

O Dynamic Data Masking (DDM) é um mecanismo de segurança usado em sistemas de gerenciamento de banco de dados para impedir o acesso não autorizado a dados confidenciais. Ele permite que os gerentes de banco de dados evitem a exposição de dados confidenciais, mascarando dados confidenciais de usuários não privilegiados e, ao mesmo tempo, concedendo-lhes acesso aos dados de que precisam.

O DDM funciona em tempo real substituindo dados confidenciais por dados fictícios ou ofuscados à medida que os dados são pesquisados ​​ou recuperados do banco de dados. Isso garante que os dados confidenciais nunca sejam expostos a usuários ou programas não privilegiados, ao mesmo tempo em que concede aos usuários autorizados acesso às informações de que precisam.

O DDM pode ser usado para mascarar dados de várias maneiras, incluindo mascarar o valor total, uma parte do valor ou o formato das informações. Um número de cartão de crédito, por exemplo, pode ser ocultado substituindo todos os últimos quatro dígitos por asteriscos (*), enquanto um número de seguro social pode ser ocultado substituindo os cinco primeiros dígitos por asteriscos.

O DDM é especialmente benéfico em contextos em que vários usuários ou aplicativos exigem acesso a dados confidenciais, como sistemas de saúde ou financeiros. Ele pode ajudar as empresas a cumprir as regras de privacidade de dados, como GDPR ou HIPAA, evitando a exposição de dados confidenciais a indivíduos ou aplicativos não autorizados.

Ferramentas de Mascaramento de Dados

Ferramentas de mascaramento de dados são ferramentas de segurança que impedem o uso não autorizado de informações complicadas. Além disso, as ferramentas de mascaramento de dados substituem dados complexos por dados falsos. Eles podem ser usados ​​em qualquer parte do desenvolvimento do aplicativo ou do processo de teste em que o usuário final insere dados.

Nesta seção, exploramos várias ferramentas que ajudarão a evitar o uso indevido de dados. Essas são as ferramentas de mascaramento de dados mais populares e amplamente usadas para pequenas, grandes e médias empresas.

Lista das melhores ferramentas de mascaramento de dados

As ferramentas de mascaramento de dados mais comuns disponíveis no mercado estão listadas abaixo. A tabela a seguir compara o melhor software de mascaramento de dados do mercado.

#1. Mascaramento de dados do K2View

O K2View protege dados confidenciais em repouso, em uso e em trânsito por toda a empresa. A tecnologia organiza dados exclusivamente em entidades de negócios, garantindo integridade referencial e fornece vários recursos de mascaramento.

#2. IRI FieldShield

A IRI é uma fornecedora de software independente com sede nos EUA que foi criada em 1978 e é mais conhecida por sua transformação rápida de dados CoSort, FieldShield/DarkShield/CellShield Data Obfuscation e soluções de gerenciamento e geração de dados de teste RowGen. Além disso, o IRI agrupa e consolida a descoberta, integração, migração, governança e análise de dados no Voracity, uma grande plataforma de gerenciamento de dados.

#3. DATPROF – Dados de teste simplificados

O DATPROF oferece um método inteligente de mascaramento e produção de dados para teste de banco de dados. Ele contém um algoritmo patenteado para criar subconjuntos do banco de dados de forma rápida e fácil.

Com uma interface fácil de usar, o software pode lidar com ligações de dados complexas. Ele oferece um método extremamente inteligente para contornar temporariamente todos os gatilhos e limites, tornando-o a ferramenta de melhor desempenho do mercado.

#4. IRI Escudo Escuro

O IRI DarkShield encontrará e desidentificará simultaneamente dados confidenciais em várias fontes de “dados escuros”. Use a GUI DarkShield do Eclipse para identificar, detectar e mascarar informações de identificação pessoal (PII) “ocultas” em texto de formato livre e colunas C/BLOB DB, JSON complicado, XML, EDI e arquivos de log da web/aplicativos, documentos Microsoft e PDF , imagens, coleções de banco de dados NoSQL e assim por diante.

#5. Descoberta e mascaramento de dados precisos

A solução de descoberta de dados e máscara de dados da Accutive, ou ADM, permite que você identifique e oculte seus dados vitais e confidenciais, garantindo que os atributos e campos de dados sejam preservados em muitas fontes.

O Data Discovery identifica conjuntos de dados confidenciais com eficiência com base em critérios de conformidade pré-configurados e configuráveis ​​ou em termos de pesquisa definidos pelo usuário. Você pode incorporar suas descobertas de descoberta de dados em sua configuração de ofuscação de dados ou criar sua própria.

#6. Mascaramento e subconfiguração de dados Oracle

O Oracle Data Masking and Subsetting ajuda os clientes de banco de dados melhorando a segurança, acelerando o envio e reduzindo os custos de TI.

Ao excluir dados e arquivos redundantes, ele ajuda na remoção de duplicação para testar dados, desenvolvimento e outras operações. Esta ferramenta recomenda plotagem de dados e emprega uma descrição de mascaramento. Ele gera diretrizes HIPAA, PCI DSS e PII codificadas.

Mascaramento de dados do Salesforce

O Salesforce Data Masking é uma ferramenta de segurança que obscurece ou substitui dados confidenciais em uma organização Salesforce por dados falsos ou ofuscados. É um tipo de mascaramento dinâmico de dados (DDM) que mascara dados confidenciais quando são pesquisados ​​ou recuperados da organização Salesforce em tempo real.

Os administradores podem usar o Salesforce Data Masking para designar quais campos ou objetos contêm dados confidenciais e aplicar regras de mascaramento a esses campos ou objetos. As regras de mascaramento podem ser configuradas para mascarar o valor completo, uma parte do valor ou o formato do valor.

O Salesforce Data Masking pode ser usado para cumprir os padrões de privacidade de dados, como GDPR, CCPA e HIPAA, limitando a exposição de dados confidenciais a indivíduos ou aplicativos não autorizados. Ele também pode ajudar as empresas a proteger dados confidenciais de perigos internos, como vazamentos de dados não intencionais ou propositais.

O Salesforce Data Masking é uma funcionalidade complementar premium oferecida para organizações Salesforce. Ele pode ser personalizado com a plataforma Salesforce Shield, que adiciona recursos de segurança, incluindo monitoramento de eventos, criptografia e relatórios de conformidade.

No geral, o Salesforce Data Masking é uma solução útil para empresas que precisam proteger dados confidenciais em suas organizações Salesforce e, ao mesmo tempo, cumprir as regras de privacidade de dados.

Práticas recomendadas de mascaramento de dados

#1. Estabeleça o escopo do projeto

As empresas devem entender quais informações devem ser protegidas, quem tem acesso a elas, quais aplicativos usam os dados e onde eles residem, tanto em domínios de produção quanto de não produção, para realizar a ofuscação de dados adequadamente. Embora possa parecer um processo simples no papel, devido à complexidade das operações e várias linhas de negócios, pode exigir um trabalho significativo e deve ser concebido como uma etapa separada do projeto.

#2. Manter a integridade referencial

A integridade referencial exige que cada “tipo” de informação proveniente de um aplicativo de negócios seja mascarado com o mesmo algoritmo.
Uma única solução de ofuscação de dados utilizada em toda a empresa não é viável em grandes empresas. Devido a requisitos de orçamento/negócios, vários procedimentos de administração de TI ou diferentes requisitos de segurança/regulamentação, cada linha de negócios pode ser obrigada a desenvolver sua própria ofuscação de dados.

#3. Proteger algoritmos de mascaramento de dados

É vital abordar como proteger os algoritmos de geração de dados, bem como conjuntos de dados alternativos ou dicionários usados ​​para ofuscar os dados. Como apenas usuários autorizados devem ter acesso aos dados reais, esses algoritmos devem ser tratados com extremo cuidado. Alguém que descobre quais estratégias recorrentes de mascaramento estão sendo empregadas pode fazer engenharia reversa de grandes blocos de informações confidenciais.

Qual é o conceito de mascaramento?

Mascarar é o ato de ocultar ou disfarçar informações para proteger dados confidenciais contra acesso ou exposição indesejada. O mascaramento pode ser usado em vários tipos de dados, incluindo informações de identificação pessoal (PII), números de cartão de crédito e informações financeiras.

Qual é a diferença entre mascaramento de dados e criptografia?

Tanto a ofuscação de dados quanto a criptografia são usadas para proteger dados confidenciais, mas atendem a objetivos diferentes e operam de maneiras diferentes.

A principal distinção entre ofuscação de dados e criptografia é que o mascaramento não oferece mais segurança além do próprio mascaramento, mas a criptografia fornece um alto nível de segurança ao tornar os dados ilegíveis para usuários não autorizados.

Qual é a diferença entre mascaramento de dados e ocultação de dados?

O mascaramento e a ocultação de dados são duas abordagens para proteger dados confidenciais que funcionam de maneiras distintas.

A principal distinção entre mascaramento de dados e ocultação de dados é que o mascaramento permite que usuários autorizados acessem os dados, enquanto a ocultação proíbe todos os usuários de obter dados confidenciais. A ofuscação de dados geralmente é usada quando usuários autorizados exigem acesso a dados confidenciais, como em ambientes de desenvolvimento ou teste, enquanto a ocultação de dados é usada para proteger dados confidenciais de todos os usuários, como em ambientes de produção.

O que são dois métodos de mascaramento de dados?

Existem vários métodos de ofuscação de dados disponíveis para proteger dados confidenciais, mas dois dos mais proeminentes são substituição e embaralhamento.

  • Substituição.
  • Baralhar

A substituição e o embaralhamento podem ser usados ​​para proteger dados confidenciais em vários cenários, incluindo gerenciamento de banco de dados, desenvolvimento de aplicativos e análise de dados.

Como você mascara dados em SQL?

Dependendo das necessidades da organização e do contexto em que os dados são usados, existem várias maneiras de mascarar os dados no SQL. Aqui estão alguns métodos comuns de ofuscação de dados SQL:

  • Usando o comando SUBSTITUIR
  • Fazendo uso da função SUBSTRING
  • Fazendo uso de funções personalizadas

Como faço para mascarar dados no Excel?

Existem várias maneiras de mascarar dados no Excel, dependendo das necessidades da organização e do ambiente em que os dados são usados. Aqui estão alguns métodos comuns de ofuscação de dados do Excel:

  • Usando formatos de número exclusivos
  • Usando a função SUBSTITUTE
  • Fazendo uso de geradores de números aleatórios

Por que o mascaramento de dados é necessário?

O ofuscamento de dados é necessário para proteger dados confidenciais contra acesso ou exposição indesejados, permitindo que usuários autorizados obtenham as informações de que precisam. Informações de identificação pessoal (PII), dados financeiros e registros médicos, por exemplo, podem ser alvos lucrativos para invasores ou pessoas mal-intencionadas que podem usar os dados para roubo de identidade, fraude ou outros objetivos prejudiciais.

Conclusão

O mascaramento de dados evoluiu para um pilar da tecnologia que as corporações em todo o mundo utilizam para cumprir os requisitos de privacidade. Embora a ofuscação de dados seja praticada há muitos anos, o grande volume de dados — estruturados e não estruturados —, bem como o ambiente regulatório em constante mudança, aumentaram a complexidade da ofuscação de dados na escala corporativa.

As ofertas atuais dos fornecedores de ofuscação de dados estão se mostrando insuficientes. Por outro lado, uma nova técnica baseada em entidade está estabelecendo a norma para ofuscação de dados em algumas das principais empresas do mundo.

Referências

Deixe um comentário

O seu endereço de e-mail não será publicado. Os campos obrigatórios são marcados com *

Você pode gostar