AI(Artificial Intelligence)에 대해 많은 관심이 있는 가운데 손쉽게 접근하기 위한 개발언어로 파이썬이 각광을 받고 있습니다.
더불어 파이썬에는 통계와 관련된 다양한 패키지를 선보이고 있으며 지속적인 패치들이 발견되고 있기도 합니다.
그래서 머신러닝에 대해 기본적으로 이해하고 맛보기로 경험해 볼 수 있도록 제 스스로 공부하면서 필요한 핵심들을 글로 올려서 공유하려고 합니다.
머신러닝의 분류
일반적으로 머신러닝은 지도학습(Supervised Learning)과 비지도학습(Un-supervised Learning), 강화학습(Reinforcement Learning)으로 구분됩니다. 지도학습의 대표적인 머신러닝은 분류(Classification)와 회귀(Regression)으로 나눌 수 있습니다.
지도학습
- 분류
- 회귀
- 추천시스템
- 시각/음성 감지/인지
- 텍스트 분석, NLP(Natural Language Programming)
비지도학습
- 클러스터링
- 차원 축소
- 강화학습
파이썬 머신러닝 생태계를 구성하는 주요 패키지
- 머신러닝 패키지: 사이킷런(Scikit-Learn)은 데이터마이닝 기반의 머신러닝으로 활용
- 행렬/선형대수/통계 패키지: 넘파이(NumPy), 사이파이(SciPy)
- 데이터 핸들링: 판다스는 2차원 데이터 처리에 특화
- 시각화: 맷플롯립(MatplotLib)는 복잡한 API 구성으로 시본(Seaborn)은 맷플롯립 래핑 API
소프트웨어 설치
윈도우10 64비트 환경에서 설치를 진행합니다.(2021년 8월 11일 현재)
설치가 완료되면 아래 그림과 같습니다.
설치가 완료되면 아래의 C++ 옵션을 추가해 주세요.
정상적으로 Anaconda와 Microsoft Visual Studio Build Tools가 설치되면 파이썬 머신러닝을 위한 환경 구성을 완료한 것입니다.
다음 장에는 파이썬 머신러닝 생태계를 구성하는 주요 요소인 넘파이와 판다스에 대해 좀 더 상세히 알아보도록 하겠습니다.
댓글 없음:
댓글 쓰기