- 검색어에 대한 자동 보고서 생성
- 검색 API: 네이버 검색 API에서 'news' 노드 활용 →
./검색어_naver_news.json
으로 파일 생성 - 검색 결과에서 각 뉴스 기사 페이지로 접속하여 <p> 테그 추적 및 텍스트 크롤링
- 크롤링한 데이터를 형태소 분석을 통해 빈도수 체크
- 상위 빈도 단어, 반복 명령을 통해 보고서 생성
- cache에 stopword 지정 가능
- 회고 in velog
- 파이썬(>=3.7), 자바(konlpy) 설치
- poetry 설치
pip install poetry
- 종속성 모듈 설치
poetry install
- ./.env 파일 만들기
client_id = "your_naver_client_id" client_secret = "your_naver_client_secret" open_ai_key = "your_open_ai_key"
- poetry 쉘 생성
poetry shell
- poetry 쉘 내부에서 main.py 실행
poetry run python3 main.py
main.py
의node
변수로 카테고리 선정 가능- 실행 후 키워드 입력 시 기존 json 파일 유무에 따라 크롤링 여부 결정
- json 파일 생성 시
./cache/
디렉토리에 생성
./cache/extracted_text.json
파일에형태소 키워드:빈도수
형식으로 저장gpt-3.5-turbo-0613
모델의 프롬프팅에 사용
report_generation.py
모듈을 통해./output/report.txt
파일에 보고서 생성
get_keywords()
함수로./keywords/generated_keyword.txt
파일 생성