본문 바로가기

분류 전체보기55

이진 분류(Binary Classification) 모델 주요 평가 지표 결과 범주가 두 종류인 데이터를 분류하는 것을 이진 분류라 한다. 예시로는 생존/사망, 양성/음성, 합격/불합격, 정상 거래/사기 거래 등등이 있다. 이러한 이진 분류 모델의 성능을 평가하는 여러 지표가 있는데 그 중 대표적인 것을 간단히 요약한다. 1. 양성, 음성, 참, 거짓 분류된 데이터는 실제 값과 예측이 일치하는지 여부에 따라 실제 양성(label = 1)인 데이터를 양성으로 분류 -> 참 양성(True Positive) 실제 음성(label = 0)인 데이터를 양성으로 분류 -> 거짓 양성(False Positive) 실제 양성인 데이터를 음성으로 분류 -> 거짓 음성(False Negative) 실제 음성인 데이터를 음성으로 분류 -> 참 음성(True Negative) 네 종류로 분류한다... 2022. 11. 17.
백준 9020번 : 골드바흐의 추측 (Python) 출처 : https://www.acmicpc.net/problem/9020 t = int(input()) sol = [] # 에라토스테네스의 체로 n 이하 소수로 이루어진 리스트 생성 for i in range(t) : n = int(input()) check = [True] * (n+1) check[0] = check[1] = False root_n = int(n**(1/2)) for i in range(2, root_n+1) : if check[i] == True : for j in range(i*2, n+1, i) : check[j] = False prime = [] for i in range(2, n+1) : if check[i] == True : prime.append(i) # 소수 리스트를 두.. 2022. 11. 15.
조건에 맞는 데이터에 값 대입 조건에 맞는 데이터에 값 대입¶ 데이터프레임에서 특정 조건을 만족하는 데이터를 조건색인으로 검색해 값을 대입하는 경우 In [1]: import pandas as pd import numpy as np In [4]: # 데이터프레임 생성 x = pd.DataFrame({'no':[30, 30, 32, 33, 34], 'name':['James', 'Min', 'Kevin', 'Liz', 'Anne']}) x Out[4]: no name 0 30 James 1 30 Min 2 32 Kevin 3 33 Liz 4 34 Anne In [3]: # no가 30인 데이터의 name을 aa로 변경 x.loc[x['no'] == 30, 'name'] = 'aa' x Out[3]: no name 0 30 aa 1 30.. 2022. 11. 11.
transform 메소드로 결측치에 그룹별 평균값 대입하기 transform 메소드로 결측치에 그룹별 평균값 대입하기¶ 1. df.transform(함수)¶ 칼럼/로우 혹은 데이터프레임 전체에 해당 함수를 적용한 결과 값을 원본과 같은 형태의 시리즈 혹은 데이터프레임으로 반환한다. In [1]: import pandas as pd import numpy as np In [7]: df = pd.DataFrame(np.arange(1, 21).reshape(4,5), columns=list('abcde')) df Out[7]: a b c d e 0 1 2 3 4 5 1 6 7 8 9 10 2 11 12 13 14 15 3 16 17 18 19 20 In [8]: # 컬럼에만 적용하면 같은 형태의 시리즈 반환 df['e'].transform(np.sqrt) Out[8.. 2022. 11. 9.