본문 바로가기

CODING78

[Paper Review/2018] 신용등급예측 / Mining Emotions of the Public from Social Media forEnhancing Coporate Credit Rating 해당 논문은 2018년 발표된 논문으로 현재와 시간차가 있다. 기존에는 재무지표만으로 기업의 신용등급을 평가하였으나, 이 논문에서는 소셜미디어에서 기업에 대한 감정 분석한 결과를 추가하여 실험을 진행하였다. 소셜 미디어와 뉴스 콘텐츠는 주식 수익률과 위험에 영향을 미치며, 그것이 기업 신용 품질에 영향을 미치기 때문에 해당 논문에서 트위터에서 해당 기업에 대한 언급이 포함되어 있는 글에서 8가지 기본 감정에 대해 분석하여 독립변수로 함께 사용하였다. 1. 데이터를 수집 (분기별 재무지표 + 기업 언급한 트위터 게시물) 2. 트위터 게시물 감성분석 3. 해당 데이터를 토대로 Random Forest 사용 감정 분석을 할 때 사용한 기분은 LDA에서 파생된 ELDA인데 이것은 문서의 집합으로부터 어떤 감정이.. 2023. 9. 12.
[Python/모듈] 폴더 내 사용한 패키지 간략 추출하기 / 파이썬 패키지 간략하게 뽑기 / pipreqs 프로젝트 별로 사용하는 모듈의 종류와 버젼을 관리해야할 때가 있는데 보통 서버가 폐쇄망이라 .whl 파일을 옮겨서 패키지를 다운받아야한다던지 상황이 발생할 수 있다 이럴 때 프로젝트 폴더 내에서 사용한 모듈들만 추출할 수 있는 모듈이 있는 데 그건 바로 pipreqs ** 앞에 !가 달려있는 이유는 쥬피터 노트북에서 실행했기 때문이고 터미널에서 실행하실 때는 !만 제거하면 됩니다! [설치 방법] !pip install pipreqs 터미널을 열고 위 코드를 작성하면 금방 다운로드가 완료된다! [사용방법] !pipreqs [원하는 폴더 절대 경로 / 상대경로] *윈도우에서는 인코딩 방식때문에 오류가 나기도 하는데 그럴 때는 아래와 같이 옵션을 추가해주면 된다. !pipreqs --encoding=utf-8.. 2023. 7. 25.
Pandas 2.0 : 더욱 빨라진 pandas / 결측치 처리 형 변환 없이! (1) !pip download pandas==2.0.3 1. 데이터 로드 속도 및 메모리 줄이기 약 850KB 짜리 데이터 Load 속도 줄이기 engine 로 Load속도 높이고, 로 Load속도 높이고, dtype_backend 로 메모리 줄이기 import pandas as pd %timeit df = pd.read_csv("Data/Ford Motor Company.csv") # 6.49 ms ± 215 µs per loop (mean ± std. dev. of 7 runs, 100 loops each) %timeit df_arrow = pd.read_csv("Data/Ford Motor Company.csv", engine='pyarrow', dtype_backend='pyarrow') # 2.83 .. 2023. 7. 3.
[Python] Dictionary에 key값이 없을 때 .get() / .setdefault()로 예외처리 딕셔너리에서 값을 찾을 때 특정 Key가 있는지 없는지 확인하기 위해 아래와 같은 코드를 이용하곤 한다. data = {'이름': '홍길동', '나이': 14} if '주소' in data: print(data['주소']) else: print("존재하지 않습니다!") Or data = {'이름': '홍길동', '나이': 14} try: print(data['주소']) except: print("존재하지 않습니다!") 이렇게 코드를 작성하다보면 코드가 엄청 길어지기 때문에 가독성이 떨어질 가능성이 높아진다. 이 때 있는지 없는지 단순히 확인하고 싶을 때 아래와 같이 사용할 수 있다. 1. .get(찾는 key값, 없으면 return 값) 함수 사용 : 값 저장 X get함수를 사용하면 data['이름'].. 2023. 5. 12.
[Python] 함수 실행 시간 구하기 / 데코레이터(@)를 사용한 함수 수행 시간 구하기 [ 사용 방법 ]1. 데코레이터 만들기 → 2. 함수 작성 전에 @데코레이터 → 3. 함수 실행 1. 데코레이터 만들기 import time #시간 측정을 위한 모듈 import # 함수 실행시간 데코레이터로 만들기 def logging_time(func): def wrapper(*args, **kwargs): start_time = time.time() # 시작 시간 result = func(*args, **kwargs) # 함수 실행 end_time = time.time() # 끝난 시간 print("[{}] 완료 : {:.1f} sec".format(func.__name__, end_time - start_time)) return result # 함수의 output return wrapper 2. .. 2023. 5. 12.
[Python/graphs] plotly.express 에서 그래프 크기 조절하기/plotly figure size 조절 매개변수 width, height로 조절 가능 px.scatter(data, x = 'average_montly_hours', y = 'satisfaction_level', width=800, height=400) [OUTPUT] px.box(data, x = 'number_project', y = 'satisfaction_level', width=400, height=400) 2023. 5. 11.