Nos últimos 3 anos tenho me dedicado e totalmente envolvido em um projeto do qual hoje é uma empresa denominada ROBBYSON, uma plataforma tecnológica com foco em gestão de pessoas utilizando práticas de gamificação e muita ciência de dados.
Durante a definição do time técnico um dos fatores interessantes e que ilustram a mudança de mercado foi a criação de uma liderança técnica focada em CIÊNCIA DE DADOS. Geralmente criávamos, em projetos de tecnologia, equipes com foco em Banco de Dados e BI (Business Intelligence), mesmo ciência de dados não sendo um tema tão atual relativamente a sua criação.
Bem, diante deste cenário, tenho recebido muitas solicitações de “aconselhamento” no linkedin sobre o que fazer para ser um cientista de dados. Enfim, talvez eu possa colaborar analisando negócio e também avaliando os profissionais que atualmente tenho na equipe.
Basta ser curioso? Basta entender de tecnologia? Basta entender de números? Basta ser desenvolvedor? Basta ser estatístico? Enfim, quantos “bastas”cabem nesta profissão que está em seu auge de crescimento e atualmente temos quase 50% das pessoas que entram para estudar tecnologia optam por ciência de dados.
Existem diversas definições válidas para o termo “ciência de dados”. Gosto particularmente de uma que diz que a ciência de dados é a arte de construir modelos a partir das “coisas que sabemos que conhecemos” (“known knowns”, em Inglês) que, quando aplicados, funcionam para as “coisas que não sabemos que não conhecemos” (ou “unkown unknowns”). Parece loucura e você precisará, assim como eu, ler este trecho várias vezes para entender.
Antes de mais nada é preciso registrar que o cientista de dados é, em sua essência, um CIENTISTA. Por isso, tem que possuir todos os atributos de um cientista tradicional – como curiosidade natural, resiliência, persistência, habilidade e principalmente de lidar com fracasso. Tecnicamente falando, é preciso aliar estas qualidades e características a ferramentas e conhecimentos de dados e estatística.
As características básicas que compõem um bom cientista de dados podem ser vistas na imagem a seguir:
Diante daqueles “bastas” citados acima, digo que um cientista de dados não basta ser bom em tecnologia ou cálculos matemáticos. Tentei recolher aqui algumas características importantes cruzando conhecimentos acadêmicos e principalmente a aplicação no mundo corporativo real.
- Habilidades avançadas – Um estudo de salários de cientista de dados descobriu que 88% deles têm pelo menos um mestrado e 46% possuem Ph.D. Os campos de formação variam de matemática até estatística, ciência da computação a engenharia, ou até mesmo economia e pesquisa operacional. Mas o fato é que, sem possuir a formação em um grau avançado, é incrivelmente raro alguém ter as habilidades técnicas necessárias para ser um cientista de dados.
- Formação é estritamente acadêmica – Pessoas que tenham estudos avançados e que só tenham experiência no mundo acadêmico devem trabalhar no desenvolvimento de sua perspicácia em negócios. Os melhores cientistas de dados são capazes de relacionar dados puros com aplicações de negócios no mundo real.
- Excel é a sua ferramenta de análise primária – Se o Excel é a sua caixa de ferramentas, você pode estar trabalhando com dados, mas não é um cientista de dados. Você provavelmente já sabia disso. Por outro lado, sabendo como usar Hadoop, Python – e não apenas AWS – não garante que você seja a pessoa certa para o trabalho, mas que pode criar com essas ferramentas exemplos de experiências com dados não estruturados.
- Acrescentar itens importantes aos dados – Para mim, a qualidade mais importante de um cientista de dados é a capacidade de agregar valor aos dados por meio da análise e interpretação. Qualquer pessoa pode apresentar os fatos que os dados fornecem. Um bom cientista de dados, porém, será capaz de apresentar esses fatos com interpretação e visualização que ajudará os executivos e cientistas (que não são de dados) na organização a captarem o sentido deles e tomarem decisões importantes.
- Ser criativo – Pode ser apenas o estereótipo do cientista ou estatístico, mas as pessoas não tendem a ver um cientista de dados como criativo. No entanto, a criatividade é uma característica-chave para um bom cientista de dados, porque em suma ele é um contador de histórias. Dados são inúteis sem contexto, e faz parte do trabalho do cientista de dados fornecer contexto e mostrar como os dados podem ajudar a resolver problemas complexos.
Bem, em breve escrevo mais sobre este profissional foda!
Enjoy!
Deixe um comentário