팀장/팀원 | 팀장 : 이주연 , 팀원 :강진성,박정원,염슬기,정종희 |
---|---|
개요 | 글로벌 시장을 대상으로 ESG 경영의 동향을 파악하고 기업 별 기사의 감정 방향성이 재무적 측면에 영향을 주는지 확인하고자 했다. 기업 별 ESG 경영 기사를 토대로 감정분석을 진행하여 감정의 방향성이 기업의 재무적 요소와 상관관계가 있는지 확인하고자 했다. 이를 위해, MSCI((Morgan Stanley Capital International)사의 ESG 등급 평가를 받은 기업 중 뉴욕증시(NYSE), 나스닥(NASDAQ), 미증권거래소(AMEX)에 상장종목을 둔 700여개의 기업을 대상으로 평가데이터를 검증하고자 했다. |
구현기능 | 1. ESG finance 동향 분석 -ESG Finance 구글 뉴스 크롤링을 통해 2019년부터 2021년 뉴스 데이터를 확보하고 데이터 토큰화 진행 - 데이터 전처리로 NLTK 및 함수 사용으로 축약형 단어 및 불용어 제거(영어 외 모든 단어 삭제) - 전처리 한 단어에 사이킷런 라이브러리로 TF-IDF 적용하여 단어 별 가중치를 부여하고 중요 키워드추출 및시각화(워드 클라우드,LDA,네트워크 분석) -워드클라우드 >연도별 주요 키워드 확인 -LDA 단어 묶음을 통해 토픽 선정 -네트워크분석 >노드간 연관성 파악 2. 기업별 ESG 뉴스 감정분석과 재무 데이터 상관관계 -기업별 ESG 뉴스 데이터를 셀레니움 활용하여 추출 -데이터 전처리 통해서 전체 문자열을 소문자로 변경,축약형 단어 늘리고,영어 이외 단어는 삭제함 -전처리된 데이터를 문장별 NLTK Vader를 적용하여 사전기반 감정분석 진행 -BERT 모델링을 통해 사전기반 NLTK의 성능 검증 - BeautifulSoup 으로 Yahoo finance 에서 재무제표 데이터 추출 -히트맵을 활용 산업별로 나누고 기업별 뉴스 감정분석 데이터와 재무 데이터의 상관관계 분석 |
설계의 주안점 | 1. ESG 시계열 분석을 통해 연도별 동향을 파악함 다양한 기술을 활용하여 직관적 시각화 2. 사전기반의 감정분석에 그치지 않고 BERT 딥러닝을 통해 감정분석 결과에 대한 검증을 하여 데이터 분석의 신뢰도를 높임 3. 700여개의 기업을 SICS 산업분류표에 의해 산업별로 나누어 상관관계 분석을 진행 |