본문 바로가기

CODING/Python18

[Python/모듈] 폴더 내 사용한 패키지 간략 추출하기 / 파이썬 패키지 간략하게 뽑기 / pipreqs 프로젝트 별로 사용하는 모듈의 종류와 버젼을 관리해야할 때가 있는데 보통 서버가 폐쇄망이라 .whl 파일을 옮겨서 패키지를 다운받아야한다던지 상황이 발생할 수 있다 이럴 때 프로젝트 폴더 내에서 사용한 모듈들만 추출할 수 있는 모듈이 있는 데 그건 바로 pipreqs ** 앞에 !가 달려있는 이유는 쥬피터 노트북에서 실행했기 때문이고 터미널에서 실행하실 때는 !만 제거하면 됩니다! [설치 방법] !pip install pipreqs 터미널을 열고 위 코드를 작성하면 금방 다운로드가 완료된다! [사용방법] !pipreqs [원하는 폴더 절대 경로 / 상대경로] *윈도우에서는 인코딩 방식때문에 오류가 나기도 하는데 그럴 때는 아래와 같이 옵션을 추가해주면 된다. !pipreqs --encoding=utf-8.. 2023. 7. 25.
Pandas 2.0 : 더욱 빨라진 pandas / 결측치 처리 형 변환 없이! (1) !pip download pandas==2.0.3 1. 데이터 로드 속도 및 메모리 줄이기 약 850KB 짜리 데이터 Load 속도 줄이기 engine 로 Load속도 높이고, 로 Load속도 높이고, dtype_backend 로 메모리 줄이기 import pandas as pd %timeit df = pd.read_csv("Data/Ford Motor Company.csv") # 6.49 ms ± 215 µs per loop (mean ± std. dev. of 7 runs, 100 loops each) %timeit df_arrow = pd.read_csv("Data/Ford Motor Company.csv", engine='pyarrow', dtype_backend='pyarrow') # 2.83 .. 2023. 7. 3.
[Python] Dictionary에 key값이 없을 때 .get() / .setdefault()로 예외처리 딕셔너리에서 값을 찾을 때 특정 Key가 있는지 없는지 확인하기 위해 아래와 같은 코드를 이용하곤 한다. data = {'이름': '홍길동', '나이': 14} if '주소' in data: print(data['주소']) else: print("존재하지 않습니다!") Or data = {'이름': '홍길동', '나이': 14} try: print(data['주소']) except: print("존재하지 않습니다!") 이렇게 코드를 작성하다보면 코드가 엄청 길어지기 때문에 가독성이 떨어질 가능성이 높아진다. 이 때 있는지 없는지 단순히 확인하고 싶을 때 아래와 같이 사용할 수 있다. 1. .get(찾는 key값, 없으면 return 값) 함수 사용 : 값 저장 X get함수를 사용하면 data['이름'].. 2023. 5. 12.
[Python] 함수 실행 시간 구하기 / 데코레이터(@)를 사용한 함수 수행 시간 구하기 [ 사용 방법 ]1. 데코레이터 만들기 → 2. 함수 작성 전에 @데코레이터 → 3. 함수 실행 1. 데코레이터 만들기 import time #시간 측정을 위한 모듈 import # 함수 실행시간 데코레이터로 만들기 def logging_time(func): def wrapper(*args, **kwargs): start_time = time.time() # 시작 시간 result = func(*args, **kwargs) # 함수 실행 end_time = time.time() # 끝난 시간 print("[{}] 완료 : {:.1f} sec".format(func.__name__, end_time - start_time)) return result # 함수의 output return wrapper 2. .. 2023. 5. 12.
[Python/graphs] plotly.express 에서 그래프 크기 조절하기/plotly figure size 조절 매개변수 width, height로 조절 가능 px.scatter(data, x = 'average_montly_hours', y = 'satisfaction_level', width=800, height=400) [OUTPUT] px.box(data, x = 'number_project', y = 'satisfaction_level', width=400, height=400) 2023. 5. 11.
[Python/pandas] 판다스 지수표현 없애기 /판다스 소수점 출력 조절하기 / 데이터 프레임 소수점 출력 형식 바꾸기 데이터 형태가 아래와 같다고 했을 때 지수 표현인 'TIME'열에 있는 'e-07'를 소수점 형태로 보고 비교하고 싶을 때가 있는데 [ORIGINAL] # 판다스 소수점 조절하기 pd.options.display.float_format = '{:.5f}'.format 판다스의 options에 display에 있는 float_format 부분을 바꿔주면 된다. '{:.5f}'.format으로 하면 소수점 5번째짜리의 형태로 출력하게된다. [OUTPUT] 다시 지수 형태로 바꿔주고 싶으면 아래의 코드를 사용하면 된다. pd.reset_option('display.float_format') 2023. 5. 10.