본문 바로가기

전체 글175

AICE Associate 6월 후기 어려웠다. 문제도 잘 기억안남.(다중분류문제) ㅇ import pandas as pd ㅇ 데이터로드 데이터셋 크기 확인 변수 = pd.read_csv('xxxx.csv') 변수.shape ㅇ 시각화 barplot ㅇ Label Encoding ㅇ PCA, cumsum함수 써서 누적기여율 구하기 pca.explained_variance_ratio_ https://techblog-history-younghunjo1.tistory.com/134 ㅇ 머신러닝 XGBoost, Randomforestㅇ 머신러닝 confusion matrix구하고 히트맵으로 시각화, classification_report 출력 ㅇ to_categorical 함수로 y_train, y_test 원핫인코.. 2024. 6. 27.
AICE Associate 참고 링크 https://datawithu.tistory.com/34 2024. 6. 26.
AICE Associate 후기 (가져옴) 가공해야할 데이터 확인하고 그 중에 타겟 변수를 확인​문제 1 라이브러리 Importimport seaborn as sns​문제 2 라이브러리 Importimport pandas as pd​문제 3 데이터 프레임 생성 - 데이터 모델링을 위해 준비된 데이터 파일을 변수에 할당df = read_csv(or json, xml...)(/X0000.csv)​문제 4 특정 컬럼에 대한 일변량 그래프 확인 - barplot​문제 5 특정 컬럼에 대한 일변량 그래프 확인 - boxplot​문제 6 이상치 확인 및 이상치 삭제​문제 7 결측치 행 확인 및 결측치 삭제 (isnull.sum)​문제 8 불필요 컬럼 삭제 (drop)​문제 9 원-핫 인코딩 or 라벨 인코딩 (le = labelencoder())​주어진 데.. 2024. 6. 25.
AICE Associate - 샘플문제 풀이 1. scikit-learn 패키지는 머신러닝 교육을 위한 최고의 파이썬 패키지입니다.Scikit-learn을 별칭(alias) 나로 임포트 하는 코드를 작성하고 실행하시오.import sklearn as sk 2. Pandas를 사용할 수 있도록 별칭을 pd로 해서 불러오세요.import pandas as pd 3. Pandas함수로 2개 데이터 파일을 읽고 합쳐서 1개의 데이터프레임 df에 할당하는 코드를 작성하세요.df_a = pd.read_json(‘A0007IT.json’)df_b = pd.read_csv(‘signal.csv’)df = pd.merge(df_a,df_b,on=’RID’,how=’inner’) 4. Seaborn활용 Address1에 대해 countplot그래프로 만드는 코드와 .. 2024. 6. 24.