Python 103

14. 파이토치로 구현한 선형회귀

1. 단항 선형 회귀한 개의 입력이 들어가서 한 개의 출력이 나오는 구조import torch # 오픈 소스 기계 학습 라이브러리 모듈import torch.nn as nn # nn 이란? 인경신경망을 구현하기 위한 도구와 모듈제공import torch.optim as optim # optim 이란 다양한 최적화 알고리즘 구현import matplotlib.pyplot as plt# 파이썬 코드를 재실행해도 같은 결과가 나올 수 있도록 랜덤시드를 설정torch.manual_seed(2024)# 실수형태로 저장X_train = torch.FloatTensor([[1],[2],[3]])y_train = torch.FloatTensor([[2],[4],[6]])print(X_train, X_train.shap..

Python/딥러닝 2024.06.18

2024-06-18. 13. 파이토치

1. 파이토치(Pytorch)* Python을 기반으로 한 오픈 소스 기계 학습 라이브러리* 텐서플로우(Tensorflow)와 함께 머신러닝, 딥러닝에서 가장 널리 사용되는 프레임워크* 초기에는 Torch라는 이름으로 Lua언어 기반으로 만들어졌으나, 파이썬 기반으로 변경한 것이 Pytorch*  뉴욕대학교와 페이스북이 공동으로 개발하였고, 현재 가장 대중적이고 널리 사용됨int32)주요 특징동적 계산 그래프 (Dynamic Computation Graphs):파이토치는 동적 계산 그래프를 사용하여 계산을 수행합니다. 이는 연산 그래프를 실행 중에 변경할 수 있음을 의미하며, 복잡한 모델을 구현하거나 디버깅하기 쉽게 합니다.자동 미분 (Automatic Differentiation):파이토치의 autog..

Python/딥러닝 2024.06.18

2024-06-17 12. K-평균 군집화 (KMeans) | Marketing

1. Clusters* 유사한 특성을 가진 개체들의 집합* 고객 분류, 유전자 분석, 이미지 분할 import               import matplotlib.pyplot as plt        import numpy as np        import pandas as pd        import seaborn as sns        from sklearn.datasets import make_blobs   make_blobs 함수 : 가상 데이터를 생성               X, y = make_blobs(n_samples=100, centers=3, random_state=2024) n_samples=100은 100개의 샘플 데이터를 생성centers=3은 3개의 중심(클러스터)을..

Python/머신러닝 2024.06.17

2024-06-17 11. 다양한 모델 적용 | Air Quality UCI

1. Air Quality UCI 데이터셋  작업파일    import               import numpy as np        import pandas as pd        import seaborn as sns        import matplotlib.pyplot as plt  데이터 불러오기             air_df = pd.read_csv('/content/drive/MyDrive/1. KDT/6. 머신러닝 딥러닝/데이터/AirQualityUCI.csv')      air_df   정보보기             air_df.info()    필요없는 열 삭제                air_df.drop(['Unnamed: 15','Unnam..

Python/머신러닝 2024.06.17

2024-06-13 10. lightGBM | Credit

1.  Credit 데이터셋  작업파일    import               import numpy as np        import pandas as pd        import seaborn as sns        import matplotlib.pyplot as plt    데이터 불러오기              credit_df = pd.read_csv('/content/drive/MyDrive/1. KDT/6. 머신러닝 딥러닝/데이터/credit.csv')        credit_df  정보보기               credit_df.info()  필요없는 데이터 지우기                 credit_df.drop(['ID', 'Customer..

Python/머신러닝 2024.06.13

2024-06-12 9. 랜덤 포레스트 (Random Forest) | Hotel

1. Hotel 데이터셋   파일 가져오기         hotel_df = pd.read_csv('/content/drive/MyDrive/1. KDT/6. 머신러닝 딥러닝/데이터/hotel.csv')      hotel_df    정보보기          hotel_df.info()   * hotel: 호텔 종류* is_canceled: 취소 여부* lead_time: 예약 시점으로부터 체크인 될 때까지의 기간(얼마나 미리 예약했는지)* arrival_date_year: 예약 연도* arrival_date_month: 예약 월* arrival_date_week_number: 예약 주* arrival_date_day_of_month: 예약 일* stays_in_weekend_n..

Python/머신러닝 2024.06.12

2024-06-12 8. 서포트 벡터 머신

1.손글씨 데이터셋 살펴보기from sklearn.datasets import load_digitsdigits = load_digits()# digits  digits.keys()data = digits['data']data.shape # 1797개 데이터와 64의 필드target = digits['target']target.shape  # 정답 데이터 target import matplotlib.pyplot as plt_, axes = plt.subplots(2, 5, figsize=(14,8))for i, ax in enumerate(axes.flatten()):  ax.imshow(data[i].reshape((8, 8)), cmap='gray') # 1열로 되어있는 64 필드를 8*8로 바꿔라 #..

Python/머신러닝 2024.06.12

2024-06-12 7. 로지스틱 회귀

1.hr 데이터셋 import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as plthr_df = pd.read_csv('/content/drive/MyDrive/KDT/6. 머신러닝과 딥러닝/Data/hr.csv')hr_df.head()hr_df.info()데이터 설명employee_id: 임의의 직원 아이디department: 부서region: 지역education: 학력gender: 성별recruitment_channel: 채용 방법no_of_trainings: 트레이닝 받은 횟수age: 나이previous_year_rating: 이전 년도 고과 점수length_of_service: 근..

Python/머신러닝 2024.06.12

2024-06-11 6. 의사결정나무

bike 데이터셋 살펴보기import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltbike_df = pd.read_csv('/content/drive/MyDrive/KDT/6. 머신러닝과 딥러닝/Data/bike.csv')bike_dfbike_df.info() 각 필드 설명datetime: 날짜count: 대여 개수holiday: 휴일workingday: 근무일temp: 기온feels_like: 체감온도temp_min: 최저온도temp_max: 최고온도pressure: 기압humidity: 습도wind_speed: 풍속wind_deg: 풍향rain_1h: 1시간당 내리는 비의 양sn..

Python/머신러닝 2024.06.11

2024-06-11 5.선형회귀

Rent 데이터셋 import numpy as npimport pandas as pdimport seaborn as sns# rent.csv 파일rent_df = pd.read_csv( '/content/drive/MyDrive/KDT/6. 머신러닝과 딥러닝/Data/rent.csv')rent_dfrent_df.info() rent_df.info() 결과의 부가설명Posted On: 매물 등록 날짜BHK: bed, hall, kitchen 개수Rent: 렌트비Size: 집 크기Floor: 총 층수 중 몇 층인지Area Type: 공용공간을 포함하는지, 집의 면적만 포함하는지Area Locality: 지역City: 도시Furnishing Status: 가구 옵션 여부Tenant Pre..

Python/머신러닝 2024.06.11