목록2024/04/05 (1)
브래의 슬기로운 코딩 생활
빅데이터 6주차 정리 - 데이터 전처리
데이터 전처리 결측값의 개념 결측값(missing value)은 데이터를 수집하고 저장하는 과정에서 저장할 값을 얻지 못하는 경우 발생 통계조사 응답자가 어떤 문항에 대해 응답을 안했다고 하면, 그 문항의 데이터값은결측값이 됨 데이터셋에 결측값이 섞여 있으면, 데이터 분석 시 여러 가지 문제를 야기 - 결측값의 처리 1: 결측값을 제거하거나 제외하고, 데이터를 분석 - 결측값의 처리 2: 결측값을 추정하여 적당한 값으로 치환한 후, 데이터를 분석 특이값의 개념 특이값(outlier) : 정상적이라고 생각되는 데이터의 분포 범위 밖에 위치하는 값들을 말하며, ‘이상치’라고도 부름 특이값은 입력 오류에 의해 발생하기도 하고, 일반인의 몸무게 자료에 씨름선수의 몸무게가 합쳐진 경우처럼 실제로 특이한 값일 수도..
3-1/빅데이터
2024. 4. 5. 22:24