저작권 문제로 기사 링크와 일부 타이틀만 올립니다.
뉴스 본문 링크
check_train_test_same_v2.ipynb : contents 내 기사가 testset 에 있으면 제거
Unsupervised 학습만 하여 레이블 없음
테스트 기사 링크와 타이틀 및 라벨링
데이터셋1 : 디렉토리 명으로 구분(finance, general, global, industry, stock)
데이터셋2 : label.md 에 있는 라벨 구분 활용
실제 사용 시 중복 데이터 등 제거하여 사용