본문 바로가기

개발 이야기

머신러닝/딥러닝에 관하여

728x90

머신러닝은 기계학습 즉, 기계를 학습 시키는 방법과 관련된 모든 것을 총칭하여 이르는 단어입니다.

머신러닝에서 대표적인 학습 방법의 큰 부류로는 지도학습, 비지도학습, 강화학습이 있습니다. 대표적인 머신으로는 인공신경망, 서포트벡터머신, 결정트리, 베이지안망 등이 있습니다.

 

딥러닝은 위에서 언급한 머신 중 인공신경망(특히, 은닉층을 2층 이상 쌓아 딥)을 머신으로 사용하는 경우입니다. (즉, 머신러닝 분야에서 딥한 인공신경망을 학습 시키는 방법과 연관된 것으로만 제한됨)

 

따라서 딥러닝은 비지도학습에 속하지 않습니다. 오히려 딥러닝은 머신러닝에 속하기에 지도학습, 비지도학습, 강화학습 방법으로 모두 학습이 가능합니다. 지도학습 방법으로는 분류, 회귀가 있겠고, 비지도학습 방법으로 신경망을 학습시키는 것으로는 Autoencoder, GAN 등이 있겠습니다. 강화학습은 알파고나 알파스타 등에 사용된 방법이 있겠군요.

 

머신러닝 중에서 이미지, 텍스트, 음성 등의 비정형 데이터(Unstructured Data)는 딥러닝 위주로  연구되고 있고요, 정형 데이터(Structured Data)인 테이블 형태의 데이터(Tabular Data)는 트리기반 방법 위주로 연구되고 있습니다. 

 

어떤 데이터를 앞으로 다루고 싶으냐에 따라서 선택하면 될 듯 합니다만... 최근 학계의 연구 트렌드는 GPT3를 들어보셨겠지만 텍스트 분야에 집중하고 있는 것 같습니다.