Questão: 3158062

     Ano: 2024

Banca: 

Órgão: 

Prova:    

A Ciência de Dados é uma área multidisciplinar, que engloba conceitos de Matemática, Estatística e Computação. Sobre os fundamentos da Ciência de Dados, assinale a alternativa que contém a afirmação correta.

3158062 B

Essa opção está correta, pois corresponde à realidade da Ciência de Dados, na qual a obtenção de dados pode ocorrer por meio de diversas fontes e tecnologias avançadas, como sensores, aplicativos, dispositivos IoT, entre outros. A variedade dessas fontes é fundamental para garantir a abrangência e a profundidade das análises que a Ciência de Dados pode proporcionar.

Questão: 3158064

     Ano: 2024

Banca: 

Órgão: 

Prova:    

Uma das etapas fundamentais da Ciência de Dados é o tratamento dos dados, que podem com frequência apresentar incorreções, pela maneira como foram adquiridos em suas fontes. O tratamento de dados é, então, essencial para aprimorar a sua qualidade e corrigir possíveis desvios. Dessa maneira, relacione os principais problemas que podem ser solucionados pelo tratamento de dados com as suas respectivas definições. 1. Enviesamento 2. Ruídos 3. Inconsistência 4. Redundância ( ) Ocorre quando existem alguns desvios dos valores verdadeiros, em geral por imprecisões existentes nos dispositivos que realizam a coleta dos dados. ( ) Ocorre quando dados repetem informações já presentes no conjunto obtido. ( ) Ocorre quando os dados não reproduzem bem a situação a ser analisada e produzem um modelo frequentemente preconceituoso. ( ) Ocorre quando atributos de dados são preenchidos de maneira incorreta, seja por engano ou com intenções fraudulentas, por exemplo. Assinale a opção que indica a relação correta na ordem apresentada.

3158064 B

Enviesamento: Diz respeito a um desvio sistemático nos dados que pode resultar em interpretações equivocadas ou tendenciosas. Esse problema ocorre frequentemente quando os modelos utilizados não representam com precisão a realidade analisada.

Ruídos: Correspondem a variações ou distorções indesejadas nos dados, afetando sua precisão. Normalmente, esses desvios surgem devido a erros no processo de coleta.

Inconsistência: Manifesta-se quando há divergências nos dados, como informações registradas de forma incorreta ou até mesmo fraudulenta.

Redundância: Refere-se à repetição desnecessária de informações dentro do conjunto de dados, o que pode aumentar seu volume sem contribuir com novos insights ou valor agregado.

Questão: 3167193

     Ano: 2025

Banca: 

Órgão: 

Prova:    

No que se refere à ciência de dados, julgue o item seguinte. Em aprendizado supervisionado, o algoritmo random forest utiliza múltiplas árvores de decisão para melhorar a precisão das previsões e reduzir o risco de overfitting.

3167193 A

O Random Forest é um algoritmo de aprendizado de máquina baseado em múltiplas árvores de decisão para realizar previsões. Cada uma dessas árvores é construída utilizando um subconjunto dos dados de treinamento, e suas previsões individuais são combinadas para gerar uma previsão final. Esse processo é conhecido como método de ensemble, contribuindo para aumentar a precisão dos resultados e minimizar o risco de overfitting.

O overfitting ocorre quando um modelo se ajusta excessivamente aos dados de treinamento, captando ruídos ao invés de padrões significativos, o que compromete sua capacidade de generalização para novos dados. Ao integrar previsões de várias árvores, o Random Forest consegue gerar modelos mais robustos e generalizáveis.

×
×

Carrinho

This site is registered on Toolset.com as a development site.