Azure SQL Database – Data Discovery & Classification

“SQL Data Discovery & Classification is currently at an early phase, and the eco-system around it is expected to grow as we continue releasing new capabilities”

Gostaria de começar esse post com a frase acima que peguei de um comentário no post que anunciou esse recurso!

Atualmente esse recurso está em preview, porém já podemos saber que é apenas o início de algo maior que esta por vir.

Aqui na Europa o GDPR está fazendo com que empresas se adaptem ao novo modelo e esse recurso pode ajudar com o primeiro passo!

Eu tenho utilizado outros métodos para classificar meus dados (ferramentas de mercado e até mesmo uma ferramenta desenvolvida internamente) e posso dizer que para a primeira versão desse recurso tem me agradado.

É possível se beneficiar desse recurso em qualquer service tier quando estiver utilizando o Azure SQL Database, ou seja, mesmo que você tem um database com pouca utilização você pode utilizar esse recurso.

Para usar Data Discovery & Classification é bastante simples:

  • Acesse seu database através do portal Azure
  • Navegue até Data Discovery & Classification (preview) e uma blade aparecera com um overview
    • Caso seja a primeira vez que você acessa esse recurso, verá os gráficos vazios

Depois que você classificar seus dados essa uma possível visualização dizendo como seus dados estão classificados ou “categorizados”.

Nesse momento existem dois tipos de distribuição:

  • Information type: para simplificar o entendimento seria o que está sendo armazenado nesse dado. É informação pessoal como ID, nome ou data de nascimento ou é um dado contendo informações bancarias como credencias de acesso ou cartão de credito.
  • Label: podemos dizer que é o nível de segurança que esses dados devem ser tratados. Por exemplo: Highly confidencial – GDPR seria o nível segurança elevado onde poucas pessoas deveriam ter acesso a essa informação ou Public seria nível segurança baixo onde todos podem acessar a informação.

Obs.: Isso é apenas uma classificação e não impõe nenhum tipo de restrição de acesso! Para restringir acesso ou ofuscar os dados existem outros recursos como Dinamic Data Masking e Row-level security.

Ao acessar a classificação pela primeira vez a Microsoft recomenda para você algumas colunas para classificar.

Isso realmente é um bom começo e com certeza ira te ajudar. Porem eu compartilho da opinião de algumas pessoas como Thomas LaRock que nesse post fala sobre esse recurso, onde existem limitações nessa versão – e é assim mesmo como foi anunciado que esse recurso está em constante mudança.

O algoritmo de classificação precisa ser melhorado em alguns aspectos:

  • Apenas funciona para nomes em inglês
  • Problemas com case-sensitive collations

O que me deixou satisfeito com o algoritmo foi que no meu caso mais de 75% das colunas sugeridas faziam total sentido!

Você pode aceitar as recomendações, edita-las, ou pode classificar manualmente outras colunas.

  1. Clique em Add classification
  2. Escolha o schema e a tabela
  3. Escolha a coluna
  4. Defina o “tipo de informação” o e “rótulo de sensibilidade”

Repita esse processo para cada coluna que você deseja classificar.

Uma vez que tenha terminado de classificar as colunas, você terá uma visão parecida com a primeira imagem e podendo agora exportar seu relatório para Excel que hoje é o único método possível.

Minha primeira tentativa resultou em uma visualização não agradável. Eu estava utilizando o Office 2013 e os gráficos não estão disponíveis (não funcionam). 

Depois de atualizar para o Office 2016 tudo funcionou normalmente.

Essa funcionalidade esta disponivel para on-premise a partir do SSMS 17.5!

Podemos esperar melhorias para o próximo semestre e deixo dois links de feedbacks sobre esse recurso

https://feedback.azure.com/forums/217321-sql-database/suggestions/33772411-scripting-capabilities-to-do-ms-sql-discovery-and

https://feedback.azure.com/forums/217321-sql-database/suggestions/33870379-data-discovery-and-classification-information-ty

Referência:

https://blogs.technet.microsoft.com/dataplatforminsider/2018/02/20/whats-new-in-ssms-17-5-data-discovery-and-classification/

https://docs.microsoft.com/en-us/azure/sql-database/sql-database-data-discovery-and-classification

https://docs.microsoft.com/en-us/azure/security/how-to-discover-classify-personal-data-azure

 

This is Tiago Balabuch's website, and this is a bit of copy about him. He is enthusiast, fascinated, passionate, fanatic by SQL Server and in the off-hours a Data Engineer who loves what he does and he is traveling in the cloud and surfing on the wave of the moment called Azure! Originally from Brazil and with encouragement from family and friends, Tiago moved to Europe in 2017 where lives in Ireland. In addition to being a data engineer, he is also active speaker in the SQL PASS events and keeps up to date on the key technologies and technical certifications. Tiago hold these certification MCT, MCSE - Data Management and Analystics, MCSA - SQL Server 2016/2014/2012. Simply psychedelic and manic he is just one more freak who likes SQL Server and its new features ...

Responda