Pontos importantes para carreira Cientista de Dados

Ser um Cientista de Dados por estar estudando disciplinas de estatística, matemática ou computação e já estar atuando em alguma área correlata, ou por ter interesse e ter iniciado um processo de seleção para alguma vaga de Cientista de Dados, é importante prestar atenção para não cair em algumas armadilhas que identificam “falsos” cientistas de dados.

Outro ponto importante e uma verdadeira armadilha para quem contrata, é não fazer do seu cientista de dados um desenvolvedor ou um resolvedor de problemas. Difícil desafio.

Diante disso, seguem alguns pontos importantes para reflexão:

• Não entender se quer contratar um cientista ou um desenvolvedor – Em muitos casos, os empregadores querem contratar essencialmente um desenvolvedor ou um codificador, mas que também seja um cientista – em suma, um unicórnio. Muitas vezes até por falta de conhecimento dos contratantes isso acontece, ou porque a empresa não tem a necessidade real de um cientista de dados.

Minha dica neste caso: DEIXE CLARO O QUE VOCÊ DESEJA. Se quiser tentar convencer quem está contratando, você pode ser capaz de convencê-los que é bom em ambas as tarefas, enfatizando sua perspicácia em negócios, com base em histórias de sucesso verificáveis com fatos concretos e fáceis de quantificar com algumas métricas de performance.

• Candidatar-se ao emprego errado – Caso você se candidate a uma posição de codificador, sendo um cientista, seja muito claro antecipadamente sobre quem você é. Isso vai poupar muito tempo para todo mundo, inclusive você mesmo.

• Ignorar questões de negócios durante a entrevista – E, em vez disso, focar exclusivamente em código, tecnologia, ou teoria. Não adianta falar somente de código, fale de negócios, e como cientista qual é (são) sua (s) linha (s) de estudo de defesa.

• Oferecer respostas artificiais às perguntas, destinadas a seduzir o entrevistador, dizendo exatamente o que ele espera ouvir.

• Falta de menção a histórias de sucesso, juntamente com métricas que medem o sucesso em questão (como redução de custos em 30%, aumento da retenção de 20%).

• Não saber sobre ferramentas, técnicas, plataformas ou linguagens de programação que seus subordinados (se você for contratado), estarão usando. Pelo menos você deve ter uma ideia geral sobre eles: por exemplo, ser capaz de responder quais são as diferenças entre “Python” e “R” mesmo se você nunca usou essas linguagens. É uma boa ideia pedir ao RH informações sobre quem serão seus entrevistadores, e fazer alguma pesquisa sobre seus antecedentes, utilizando LinkedIn. Até mesmo se conectar com eles na rede.

• Não saber as tendências em sua indústria – Você não responder a perguntas como “como você acha que deep learning irá evoluir ao longo dos próximos 5 anos” ou “é a Internet das coisas ou a AI que veio para ficar?”.

• Não diferenciar-se dos outros candidatos ou não mencionar seus pontos fortes (por exemplo: um geek que entende os termos de negócio; um analista que se esforça para completar todos os projetos antes do tempo; um cara que adora automatizar suas tarefas sempre que possível para poupar tempo e para lidar com maiores cargas de trabalho; alguém que trabalha muito bem em equipe e que sabe quem delegar e até mesmo inspirar e gerar energia positiva para os colegas; ou alguém que é um autodidata e aprendeu Python e R tudo por si mesmo; um cara que desenvolve aplicativos populares durante seu tempo livre; um autor respeitado com o seu próprio blog e artigos; experiência com enormes conjuntos de dados, como terabytes; ou um analista que adora otimizar processos e pode fornecer exemplos).

• Não conseguir dizer muito sobre a velocidade (complexidade computacional) de vários algoritmos, oferecendo soluções lentas/ineficientes, quando solicitado a resolver um problema, não sabendo onde as complexidades e gargalos estão em plataformas modernas.

• Acreditar que o dado é rei – Não ser capaz de imaginar possíveis fontes de tendências e variâncias. Não ter nenhuma experiência em trabalhar com dados desorganizados. Não saber como os dados são produzidos e como as métricas são identificadas. Só poder falar sobre dados estáticos.

• Não ser capaz de dizer os prós e contras de plataformas de dois produtos populares, arquiteturas, linguagens de programação ou algoritmos. Você precisa ler a literatura para se familiarizar com isso. Por exemplo: R contra Python; as 8 piores técnicas preditivas; 10 tipos de regressões, qual escolher; ou Hadoop contra Spark.

Por fim, compartilho um estudo feito em 2015 pela Analytics Week & Business Over Broadway com mais de 490 profissionais de dados, onde foram solicitados a informar sua proficiência em 25 elementos numa escala de 0 (não conheço) a 100 (sou expert), chegou à distribuição de áreas de conhecimento abaixo:

data_science_skill

 

Valeu pela leitura moçada!
Enjoy!

Anúncios

Sobre Fernando Luis Parreiras

Bacharel em Desenho Industrial e Bacharel em Administração de empresas. Possui Pós Graduação em Gestão de Projetos e Inovação, MBA Executivo e Mestre na área de Tecnologia. Formações pela UEMG (Universidade do Estado de Minas Gerais), Newton Paiva, BI International, Stanford University e Penn State. Mais de 18 anos de experiência atuante no mercado de Tecnologia, Projetos e Inovação. Praticante e disciplinado em um estilo de vida saudável e esportista com formação como faixa-preta em JIU-JITSU e TAE KWON DO.
Esse post foi publicado em Computação cognitiva, Inovação, Motivação, Pessoal, Profissional e marcado , , , , . Guardar link permanente.

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.