10 perguntas mais frequentes sobre entrevistas com cientistas de dados

O campo da ciência de dados está em constante evolução, abrangendo vários setores e exigindo um amplo conjunto de habilidades que inclui matemática, estatística, programação e marketing. Como tal, tornar-se cientista de dados requer uma impressionante mistura de habilidade técnica, criatividade e comunicação.

As descrições de cargos para cientistas de dados podem variar bastante, embora todos estejam buscando candidatos com uma longa lista das habilidades mais desejáveis, como pensamento crítico, resolução de problemas, análise de dados, inteligência emocional, atenção aos detalhes e trabalho em equipe. Isso significa que as perguntas da entrevista para os cientistas de dados podem abranger vários tópicos diferentes e variam de perguntas típicas de habilidades pessoais a discussões extremamente técnicas.

As entrevistas em ciência de dados exigem muita preparação. Esteja você recém-saído de uma escola superior de ciência da computação ou pretendendo mudar para uma empresa ou setor diferente, reserve um tempo para analisar os principais conceitos de seu trabalho. Assim como você sabe dirigir, mas pode ter problemas para recitar regras específicas da estrada, pode ficar preso em uma entrevista tentando articular como funciona um algoritmo específico.

Para ajudar você a se preparar, compilamos 10 das perguntas mais comuns sobre entrevistas com cientistas de dados. Desde as primeiras exibições até as entrevistas no local e no segundo e terceiro estágio, você encontrará uma ampla variedade de exames, como habilidades técnicas, habilidades de comunicação e estilo de trabalho.

1. 'Conte-nos mais sobre o projeto mais recente em seu portfólio.'

Os cientistas de dados estão sendo procurados em diversos setores, mas as empresas geralmente procuram alguém com habilidades muito específicas e uma boa cultura. Um portfólio on-line detalhado exibindo o tipo de trabalho de que você é capaz, bem como uma forte presença nas mídias sociais e uma marca pessoal, ajuda você a se destacar de outros candidatos e a conectá-lo a gerentes e recrutadores de contratação para trabalhos em que você está perfeitamente adequado para.

Esteja preparado em qualquer entrevista de ciência de dados para falar extensivamente sobre todos os elementos do seu currículo, portfólio ou site. Adapte sua resposta a um projeto para se adequar ao seu público. Se for uma triagem inicial ou um painel com participantes de vários departamentos, seu foco deve estar nas maneiras pelas quais seu trabalho criou resultados positivos para o cliente e seus negócios.

Quando você chega à parte do processo de entrevista em que se encontra com outro cientista de dados, engenheiro, analista ou outra pessoa técnica, é necessária uma descrição mais detalhada dos dados e processos envolvidos no seu trabalho.

2. 'Por que você quer trabalhar para esta empresa?'

Mesmo que você tenha sido contatado diretamente por meio de seu portfólio on-line ou perfil do LinkedIn e convidado a entrevistar para uma posição aberta, a empresa ainda desejará saber por que você aceitou e por que acha que será uma boa opção para o trabalho.

Além de aprimorar suas habilidades técnicas, sua preparação para a entrevista deve incluir pesquisas sobre os negócios aos quais você está se candidatando. As informações sobre o setor, a missão, a equipe, exatamente o que fazem e o desempenho delas ajudarão você a criar uma resposta especificamente adaptada a essa pergunta.

Aborde como o seu conjunto de habilidades os ajudará a atingir seus objetivos. Encontre uma maneira de expressar paixão por um ou mais aspectos do seu cargo, incluindo a missão, filosofia, inovação ou linha de produtos da empresa. Se esse é o seu emprego dos sonhos, pode valer a pena montar um projeto de ciência de dados antes da entrevista que resolva um problema para eles - como apelar para novas entregas demográficas ou agendadas com mais eficiência.

3. 'Nomeie os cientistas de dados que você mais admira e explique o porquê.'

Embora essa seja uma pergunta muito pessoal que tecnicamente não tenha uma resposta correta, as respostas que você selecionar são muito importantes. Sua pesquisa sobre a empresa e as do painel de entrevistas podem ajudá-lo a causar uma boa primeira impressão somente com essa pergunta.

Conhecer as pessoas que são proeminentes no campo, bem como as que estão atualmente agitando, mostrará aos entrevistadores que você é conhecedor e apaixonado pela indústria. É útil discutir cientistas de dados que são valorizados na área específica da sua carreira, como finanças, medicina ou mercado de ações.

Esta questão é mais do que apenas uma lista impressionante de nomes. A parte "por que" da equação também mostrará aos seus potenciais empregadores o que você valoriza em seu campo e como abordará seu trabalho. Se sua pesquisa mostrou que a empresa valoriza a inovação, a integridade ou mesmo um determinado método estatístico, esta é uma ótima oportunidade para que eles saibam que você compartilha os mesmos valores.

4. 'Como você explicaria um mecanismo de recomendação a alguém do departamento de Marketing?'

Uma das qualidades importantes que diferenciam os cientistas de dados de outros gênios técnicos é a capacidade de converter, exibir e explicar dados de uma maneira que pessoas não técnicas possam entender. Isso faz com que uma consulta como essa seja uma das perguntas mais importantes sobre entrevistas com cientistas de dados que você encontrará. Os entrevistadores querem ver como você pode comunicar conceitos como modelagem de dados, árvores de decisão e regressão linear para qualquer público.

Nesse caso específico, você deve primeiro explicar em termos simples como funciona um mecanismo de recomendação, com exemplos de filtragem baseada em conteúdo e filtragem colaborativa. Em seguida, você discutirá como trabalhar com o departamento de marketing para combinar suas habilidades de atrair clientes com o poder do algoritmo que usa dados coletados para ajudar a identificar o que os consumidores desejam.

5. 'Quais são as diferenças entre aprendizado supervisionado e não supervisionado?'

Você pode começar resumindo que a principal diferença entre esses dois é que o aprendizado supervisionado possui dados de treinamento dos quais o algoritmo pode aprender e fornecer respostas. O aprendizado não supervisionado requer agrupar as coisas por semelhanças, anomalias comuns e outros processos de busca de padrões, e não por dados concretos e rápidos.

O entrevistador deseja que você entre em mais detalhes, por isso é importante listar as diferenças específicas e poder falar sobre os vários algoritmos usados.

Aprendizado supervisionado

  • usa dados conhecidos e rotulados como entrada
  • possui um mecanismo de feedback
  • usado para previsão
  • seus algoritmos comuns incluem árvore de decisão, regressão logística, regressão linear, máquina de vetores de suporte e floresta aleatória

Aprendizagem não supervisionada

  • usa dados não rotulados como entrada
  • não possui mecanismo de feedback
  • usado para análise
  • seus algoritmos comuns incluem cluster K-means, cluster hierárquico, auto-codificadores e regras de associação

Você deseja ter alguns exemplos, genéricos ou de um projeto específico em que trabalhou, para ilustrar as diferenças entre esses dois tipos de aprendizado de máquina e em quais instâncias cada um pode ser usado. Por exemplo, o aprendizado não supervisionado pode ser usado ao lançar um novo produto em que a demografia do cliente para a qual ele pode recorrer é desconhecida.

Se inscrever

Inscreva-se na nossa newsletter para obter mais conteúdos incríveis e ganhe 20% de desconto no nosso teste de carreira!

Se inscrever

6. 'Como você evita o viés de seleção?'

Essa pergunta pode assumir várias formas em uma entrevista de ciência de dados. Você pode ser solicitado a definir o viés de seleção, como evitá-lo ou dar um exemplo específico de como ele desempenhou um papel em um projeto em que você trabalhou.

A principal questão com o viés de seleção é que as conclusões foram tiradas de uma amostra não aleatória. Obviamente, a solução mais fácil é sempre selecionar uma amostra aleatória de uma população claramente definida. Você precisará explicar por que isso nem sempre é possível.

Esteja ciente de que, como o viés de seleção pode ser intencional - com a seleção de sujeitos ou a eliminação de dados intencionalmente feita para provar uma teoria ou projeção preconcebida -, isso pode ser uma maneira indireta de o painel de contratação fazer uma dessas perguntas difíceis sobre ética e integridade no trabalho. .

Em última análise, você deseja enfatizar como o viés de seleção é mais frequentemente um caso de dados não intencionais ou inevitáveis. Certifique-se de elaborar algumas das áreas em que o viés de seleção pode ocorrer, incluindo amostragem, intervalo de tempo, dados e atrito. Depois, dê alguns exemplos de como técnicas de alavancagem, como reamostragem e reforço, podem ajudá-lo a solucionar amostras não aleatórias.

Se você estiver na parte de uma entrevista quando estiver conversando com representantes de departamentos menos técnicos, use um exemplo facilmente digerível que ilustra claramente o viés de seleção. O cientista de dados Eric Hollingsworth faz referência a uma lição aprendida com o surto de gripe aviária de 2011, onde 'apenas indivíduos muito doentes foram contados' em uma amostra estatística de 'casos confirmados'. Os 80% resultantes relataram uma taxa de mortalidade, tão terrível devido ao viés de seleção, criou um medo generalizado considerável.

7. 'Como os valores extremos podem ser tratados?'

Essa é uma pergunta de entrevista comum para os cientistas de dados, pois revela como você usa os dados fornecidos, os métodos usados ​​para processar esses dados e se você está disposto a dedicar tempo para avaliar cada parte desses dados.

Primeiro, você quer falar sobre o que constitui um erro externo, como números que existem muito fora do cluster de dados em um gráfico, como 2 a 3 desvios padrão da média e assim por diante. O próximo passo para lidar com discrepantes é avaliar por que eles aconteceram.

Uma pequena quantidade de valores discrepantes que podem ser atribuídos a um simples erro humano ou de máquina é facilmente eliminada. Observe, no entanto, que mesmo um único erro externo pode ser um ponto de dados chave e não um problema, pois pode indicar o sucesso de uma única tática de marketing, novo ingrediente de medicamentos ou linha de produtos.

Em seguida, você explicará como lidar com um grande número de discrepantes, o que exige soluções mais complexas. Por exemplo, pode ser necessário alterar o modelo que você está usando, normalizar os dados para a média ou usar um algoritmo de floresta aleatório. Mais uma vez, tente usar um caso da vida real da sua experiência como cientista de dados para explicar as táticas corretas.

8. 'Por que a limpeza de dados é importante?'

A coleta e a limpeza de dados são uma parte dominante do seu trabalho como cientista de dados, ocupando até 80% do seu tempo. Qualquer que seja o setor ao qual você esteja se inscrevendo, as perguntas da entrevista sempre incluirão uma sobre por que a limpeza de dados é importante. Os entrevistadores também perguntam sobre suas técnicas e programas de limpeza preferidos.

Você deve enfatizar como os dados limpos são necessários para tirar as conclusões corretas, mas não se trata apenas dos números. Explique como o início com dados completos, precisos, válidos e uniformes afeta diretamente seus negócios. Os principais benefícios a serem discutidos incluem:

  • melhor tomada de decisão sobre os objetivos da empresa
  • aquisição e redirecionamento mais rápidos de clientes anteriores
  • economia de tempo e recursos devido à eliminação de dados imprecisos ou duplicados
  • produtividade melhorada
  • moral da equipe melhorada graças a resultados eficientes e precisos repetidos

9. 'Qual é o objetivo dos testes A / B?'

Perguntas sobre o teste A / B durante sua entrevista para uma posição de cientista de dados podem começar com uma referência mais genérica ao uso do design experimental para responder a uma única pergunta sobre o comportamento ou as preferências do usuário. O objetivo de testar uma variável de design de site, aplicativo ou boletim informativo é simplesmente avaliar se uma alteração aumentará as taxas de juros, engajamento e conversão.

Uma maneira de se diferenciar ao responder a esses tipos de perguntas da entrevista é discutir como outros cientistas de dados podem tirar conclusões erradas dos testes A / B. As possíveis armadilhas incluem:

  • não coletando dados suficientes por um período de tempo suficientemente longo
  • testando muitas variáveis ​​de uma só vez
  • não contabilizando fatores externos que podem afetar o tráfego durante o período de teste
  • ignorando pequenos ganhos que podem aumentar com o tempo e combinar com outras mudanças positivas para aumentar a receita
  • falta de interpretações gerais, como ganhos ou perdas financeiras líquidas em relação às taxas de conversão

Além de apontar esses problemas, você precisará expressar como os resolveria - ou, melhor ainda, como já os evitou em seus projetos anteriores de ciência de dados.

10. 'Você tem 48 horas para resolver esse desafio de codificação.'

O desafio da codificação pode ser uma maneira inicial de rastrear possíveis cientistas de dados ou pode ser um segundo passo no processo de entrevista depois que você supera o primeiro obstáculo com um recrutador ou gerente de contratação. Pode ser um teste no local que leva de 30 minutos a 2 horas, no qual você codificará em um quadro branco ou em um teclado à vista do entrevistador. Muitas vezes, você pode escolher uma linguagem, mas esteja preparado para codificar em SQL ou Python.

Algumas empresas atribuem tarefas mais longas, com prazos de até uma semana. Os desafios do quadro branco podem exigir a escrita de consultas SQL bastante simples, mas testes mais longos são, é claro, mais complexos. Normalmente, você recebe dados e é solicitado a fazer previsões específicas usando esses dados, além de mostrar seu trabalho. Por exemplo, um sujeito recente da entrevista de um cientista de dados recebeu dados do Airbnb e pediu para prever os preços das casas com base nos recursos da acomodação.

Os entrevistadores vão querer discutir suas escolhas com você, as suposições que você fez, os recursos que escolheu, por que você usou determinados algoritmos e muito mais. Freqüentemente, a resposta que você chega é menos importante que seu processo, criatividade, legibilidade do código e design.

Pode ser uma experiência de entrevista estressante, então prepare-se criando e completando desafios de codificação prática com amigos ou colegas no campo da ciência de dados. Você também pode visitar sites como Leetcode e SQLZOO para exercícios de codificação. As entrevistas simuladas reais que envolvem problemas algorítmicos e de design de sistemas estão disponíveis gratuitamente no Interviewing.io.

Como você pode ver, as perguntas da entrevista para os cientistas de dados podem ser difíceis, e o processo geral pode ser demorado e cansativo. Uma das dicas mais importantes da entrevista é permanecer positivo, mesmo se você sentir que uma parte do processo de entrevista foi mal. Muitas vezes somos mais duros consigo mesmos do que os outros, e você ainda pode conseguir o emprego, apesar de não ter todas as respostas tão perfeitas quanto gostaria.

Se você perder a oportunidade, peça feedback e use-o para melhorar sua próxima experiência de entrevista. Afinal, muitos cientistas de dados bem estabelecidos foram rejeitados em várias posições e continuaram a ter sucesso nos trabalhos que, em última análise, eram os mais adequados!

Quais perguntas e desafios de codificação você encontrou ao tentar conseguir um emprego em ciência de dados? Participe da discussão nos comentários abaixo e ajude seus colegas cientistas de dados a se prepararem para a próxima entrevista!

Deixe O Seu Comentário

Please enter your comment!
Please enter your name here