A Apple, conhecida por sua forte postura em privacidade, enfrenta um desafio interessante: como melhorar sua tecnologia de Inteligência Artificial (IA) sem comprometer os dados dos usuários? A resposta, aparentemente, é uma combinação inteligente de dados sintéticos e privacidade diferencial. Vamos explorar isso!
Dados Sintéticos vs. Dados Reais
Muitas empresas de tecnologia treinam suas IAs usando dados reais dos usuários, incluindo conversas e e-mails. A Apple, porém, adota uma abordagem diferente. Em vez de depender exclusivamente de dados reais, ela utiliza dados sintéticos.
Dados sintéticos são criados por um modelo de linguagem grande (LLM) da própria Apple. Esses dados imitam a essência dos dados reais, como um e-mail sobre um determinado assunto, sem serem dados reais de um usuário.
Privacidade Diferencial: A Chave da Apple
Apesar da eficácia dos dados sintéticos, eles não conseguem replicar completamente a riqueza e nuances da linguagem humana. Por isso, a Apple adiciona a “privacidade diferencial” à equação.
Essa técnica combina dados sintéticos e reais de forma inteligente. A Apple cria embeddings (representações matemáticas) dos e-mails sintéticos. Usuários que optam por compartilhar dados analíticos em seus dispositivos geram seus próprios embeddings para amostras de seus e-mails.
O dispositivo compara os embeddings sintéticos com os reais. Ele indica para a Apple quais embeddings sintéticos são mais parecidos com os seus e-mails reais, sem compartilhar o conteúdo dos e-mails ou qualquer informação pessoal identificável. A Apple, então, usa essa informação para aprimorar seus modelos de IA.
Como a Apple Protege sua Privacidade?
A Apple garante a privacidade por meio de alguns mecanismos importantes. Primeiro, o compartilhamento de dados analíticos é desativado por padrão. Os usuários precisam optar explicitamente por participar.
Segundo, os dados dos e-mails nunca deixam o dispositivo do usuário e não são compartilhados diretamente com a Apple. O dispositivo apenas envia um sinal indicando a similaridade entre os embeddings, sem revelar IP, conta Apple ou outros dados pessoais.
A Apple já usa a privacidade diferencial em recursos como o Genmoji, criando emojis personalizados com base em descrições de usuários, sem vincular as descrições a indivíduos específicos.
O Futuro da Privacidade na IA da Apple
A empresa planeja expandir o uso da privacidade diferencial para outros recursos de IA, incluindo o Image Playground, Image Wand, criação de Memórias, ferramentas de escrita e inteligência visual. Isso demonstra o compromisso da Apple em melhorar suas tecnologias de IA sem comprometer a privacidade dos seus usuários.
Em resumo, a Apple demonstra inovação ao combinar dados sintéticos com privacidade diferencial, permitindo o aprimoramento de sua IA sem o sacrifício crucial da privacidade dos usuários. Esse é um exemplo de como tecnologia e segurança podem andar de mãos dadas.
Compartilhe suas experiências com a privacidade em dispositivos Apple!
Fonte: ZDNet