preloader

Glossário da Ciência de Dados – Parte 2

Nesta última semana de trabalho no time de ciência de dados aqui da Enter Tech Edu, em conversas com alguns cientistas de dados e membros do time de TIC sobre o acesso ao MySQL para processar dados de geolocalização dos alunos, buscou-se entender quais métodos pedagógicos são os mais adequados para cada um deles através do nosso big data.

Pareceu grego? É por isso que hoje escrevemos o segundo artigo do nosso Glossário da Ciência de Dados. Nesta série, a cada artigo buscamos explicar um pouco do que está por trás das sopas de letrinhas utilizadas na tecnologia e na ciência de dados.

Na primeira edição do Glossário falamos sobre 4 termos muito importantes: Data Science, ETL, Text Mining e Análise descritiva. Dá uma conferida pra não perder nenhum termo!😉

Agora, vamos entender mais sobre os termos trazidos no primeiro parágrafo!

Cientista de dados

Primeiramente, vamos conhecer mais sobre o profissional por trás da magia da ciência de dados. Como o nome diz, ele trabalha com o lado científico do Data Science e usa seus conhecimentos em ciência, pesquisa, estatística, probabilidade, programação, visualização de dados, entre várias outras habilidades técnicas e também comportamentais, para definir a base científica utilizada nos processos relacionados à dados em uma organização/projeto.

Como cada caso tem necessidades diferentes, existem vários perfis distintos de cientistas de dados. Quem sabe no próximo glossário podemos falar sobre o engenheiro de dados, que não é igual ao cientista. Bateu a curiosidade? Então acompanhe as nossas redes que em breve falaremos sobre esse assunto 😀

MySQL + Ciência de Dados: uma combinação famosa!

Este é um sistema para gerenciamento de banco de dados. Podemos dizer que ele é o banco de dados em si. Existem vários tipos diferentes de bancos para vários propósitos e objetivos diferentes, cada um com seus prós e contras. O MySQL é um dos mais populares, se não o mais popular. Além disso, existem outros bancos que são baseados no MySQL (podemos dizer que são filhos dele) e também são muito populares dado o imenso poder dessa ferramenta!

Big Data

Em uma tradução livre: big = grande e; data = dados. E é literalmente isso! Uma grande concentração de dados que processamos através de algoritmos inteligentes e sistemas de análise. Quanto maior o big data, maiores os desafios para manter seus dados organizados, protegidos e acessíveis. Ao mesmo tempo, quanto mais concentrados e organizados os dados estão, mais simples é o processo de busca por informações específicas contidas nele.

Geolocalização na ciência de dados

Utilizamos este termo em várias áreas para fazer referência à informações geográficas de pessoas, coisas, países, etc. No Brasil, vemos esses dados serem normalmente utilizados para saber quais são os estados ou cidades com maiores notas em alguma área do conhecimento, em provas e até em educação de forma geral. Mas na ciência de dados, geralmente utiliza-se muito mais do que o endereço por extenso.

Com o endereço do objeto pesquisado, podemos delimitar seu ponto de latitude e longitude, que são números que podem definir com grande precisão a localização geográfica de qualquer coisa na superfície terrestre. Dessa forma, pode-se aferir concentrações em locais específicos, além de observar se o local dos objetos estudados possui algum padrão diferente de outros locais item a item, entre várias outras possibilidades.

LEIA TAMBÉM: Análise de dados na avaliação da aprendizagem

Está gostando de aprender mais sobre as terminologias utilizadas no mundo da tecnologia, e principalmente da Ciência de Dados?

Existem muitos termos que ainda serão explorados por aqui. Então fica ligado porque na parte 3 do Glossário da Ciência de Dados vamos explorar muitos outros temas da área. 😉

inscreva-se na nossa newsletter!

    PT