본문 바로가기

머신러닝/혼공머신6

[혼공머신] chapter 6. 군집 알고리즘 혼자 공부하는 머신러닝 + 딥러닝의 Chapter 6을 공부하면서 정리한 내용을 기반으로 작성하였다. 06-1. 군집 알고리즘 타깃데이터 즉, 미리 정한 정답은 없지만, 종류대로 모으고 분류할 수 있을까? 예를 들어, 고객들의 데이터를 그때 그때 받아서 같은 종류끼리 모아두는 것을 생각한다. → 비지도 학습 >> 이해해보자 (타깃데이터 즉 종류를 아는 상황을 가정) 사과, 바나나, 파인애플 사진을 분류해보고 싶다. 평균과의 오차값이 최대한 적은 샘플들을 모으면 된다. |픽셀값 - 해당 위치의 평균 픽셀값|의 합을 픽셀 개수로 나눠 평균을 구한다. 샘플 300개 있으므로, (1)의 값(각 샘플에 대한 평균값)이 300개 존재이다 여기서 오름차순으로 최초 100개 즉 작은 값 100개를 고른다 이 100개 .. 2023. 1. 31.
[혼공머신] chapter 5. 결정트리 혼자 공부하는 머신러닝 + 딥러닝의 Chapter 5를 공부하면서 정리한 내용을 기반으로 작성하였다. 05-1. 결정트리 0. 결정트리 특징 이전 챕터에서 배운 로지스틱 함수는 이해하고 설명하기 어렵다. process의 flow chart를 그리는 듯이 쉽게 설명해 주는 모델이 있을까? 바로 결정트리 (Decision Tree) 모델이다. 다음과 같이 분류문제를 적용할 수도 있고, DecisionTreeRegressor를 이용해 회귀문제를 이용할 수 있다. 특성의 scale이 결정트리에 영향을 미치지 않기 때문에, 표준화 전처리(input_data - mean /std)를 할 필요 없다! 결정트리는 앙상블 학습 알고리즘(신경망과 함께 높은 성능을 냄)의 기반이 된다 from sklearn.tree imp.. 2023. 1. 16.
[혼공머신] chapter 3. 회귀 - k최근접, 릿지/라쏘 혼자 공부하는 머신러닝 + 딥러닝의 Chapter 3을 공부하면서 정리한 내용을 기반으로 작성하였다. 03-1. k-최근접 이웃 회귀 - 회귀문제 다루는 법을 맛보는 장이다. 분류와 회귀 머신러닝 알고리즘은 지도학습 알고리즘과 비지도학습 알고리즘으로 나뉜다고 Chapter 02에서 배웠다. 여기서 지도 학습 알고리즘은 크게 분류와 회귀(regression)로 나뉜다. 분류는 샘플을 클래스 중 하나로 분류하는 것이고, 회귀는 분류하는 것이 아니라 임의의 숫자를 예측하는 것이다. 회귀는 정해진 클래스가 없고 임의의 수치를 출력한다. 분류 - 샘플을 클래스 중 하나로 분류하는 것 회귀 - 분류하는 것이 아니라 임의의 숫자를 예측하는 것 - 회귀는 정해진 클래스가 없고 임의의 수치를 출력한다. cf ) 회귀 알.. 2022. 12. 1.
[혼공머신] chapter 2. k-최근접 이웃 알고리즘 - 실습 혼자 공부하는 머신러닝 + 딥러닝의 Chapter 2를 공부하면서 정리한 내용을 기반으로 작성하였다. 이번 장에서는 책 순서와 달리, 개념과 실습을 구분해서 정리하였다. fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0, 9.8, 10.5, 10.6, 11.0, 11.2, 11.3, 11.8, 11.8, 12.0, 12.2, 12.4, 13.0, 14.3, 1.. 2022. 11. 24.
[혼공머신] chapter 2. k-최근접 이웃 알고리즘 - 데이터전처리 혼자 공부하는 머신러닝 + 딥러닝의 Chapter 2를 공부하면서 정리한 내용을 기반으로 작성하였다. 이번 장에서는 책 순서와 달리, 개념과 실습을 구분해서 정리하였다. 02-1. 훈련 세트와 테스트 세트 지도학습과 비지도 학습 머신러닝 알고리즘은 supervised learning(지도 학습)과 unsupervised learning(비지도 학습)으로 나눌 수 있다. 추가적으로 강화학습으로도 함께 분류될 수 있다 지도 학습 1. 훈련 데이터가 필요하다 여기서 훈련 데이터란 입력(특성, 데이터), 타깃(정답)을 포함한다 2. 타깃(정답)이 있기 때문에 알고리즘은 정답을 맞히는 것을 학습한다 비지도 학습 1. 타깃(정답) 없이 입력 데이터만 사용한다. → 입력 데이터만 있을 대 비지도 학습 알고리즘을 사용.. 2022. 11. 24.
[혼공머신] chapter 1. 머신러닝이란? 혼자 공부하는 머신러닝 + 딥러닝의 Chapter 1을 공부하면서 정리한 내용을 기반으로 작성하였다. 01-1. 인공지능과 머신러닝, 딥러닝 인공지능 인공지능(artificial intelligence)는 사람처럼 학습/추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술이다. 인공지능의 역사는 80년 정도이다. 인공지능 태동기 1950년 앨런 튜링이 튜링 테스트를 발표한다. 튜링테스트(Turing Test)는 인공지능이 사람과 같은 지능을 가졌는지 테스트 하는 것이다. 이후, 1956년 다크머스 AI 컨퍼런스에서는 인공지능의 전망이 굉장히 긍정적으로 보여졌다. 인공지능 황금기 1957년 프랑크 로젠블라트가 로지스틱 희귀의 초기 버전으로 볼 수 있는 퍼셉트론(Perceptron)을 발표했다. 1959.. 2022. 11. 17.