데이터분리1 혼자 공부하는 머신러닝 + 딥러닝 - Ch2 Ch2에서는 지도학습을 공부하고 데이터 전처리의 필요성에 대해 공부합니다. 지도학습은 훈련데이터와 정답데이터를 통해 학습하는 머신러닝 방법입니다. 반면 비지도학습은 따로 정답이 없고 입력데이터만을 사용해 학습합니다. 지도학습에 필요한 훈련데이터를 만드는 방법은 두가지가 있습니다. 1. 충분한 양의 데이터가 있는 경우 훈련데이터를 따로 마련한다. 2. 한정된 양의 데이터로 훈련하는 경우 입력 데이터의 일부를 훈련데이터와 테스트데이터로 나눈다. 데이터를 분리할 때는 적절히 섞어서 편향이 없게끔 해줘야 합니다. 예를 들어 Ch1에서 도미와 빙어 데이터를 합쳤었는데 만약 훈련데이터는 전부 도미만 있고 테스트데이터에는 빙어만 있다면 0%의 효율을 내게 되겠죠. 사이킷런의 train_test_split() 함수는 .. 2023. 1. 7. 이전 1 다음