params = {
'serviceKey': serviceKey,
'pageNo': '1', # 페이지 번호
'numOfRows': '10', # 한 번에 가져올 데이터 개수
'resultType': 'json', # 응답 형식 (JSON)
'sgId': '20200415', # 선거 ID
'sgTypecode': '2', # 선거 구분 코드
'cnddtId': '100135069', # 후보자 ID
}
값은 당선인정보api에서 가져와 csv에 제대로 넣은 거 같은데 무엇이 문제일까?
11,20200415,2,100135069,성북구갑,서울특별시,성북구,1,,더불어민주당,김영배,金永培,남,19670308,53,서울특별시 성북구 고려대로2길,75,정당인,68,고려대학교 정치외교학과 졸업,"(전) 민선5기, 6기 성북구청장",(전) 문재인대통령 청와대비서관(정책조정/민정),82954,60.9

국회의원은 공약서가 있지 않았다....
이게 요청 메세지가 아닌 응답 메세지에 있어서 확인에 시간이 걸렸다 국회의원은 api로 확인할 수 없음을 확인하였다.
어쩔 수 없이 공약 크롤링이 필요한 시점이 되었다.
https://policy.nec.go.kr
title
policy.nec.go.kr
우리위원회는 정당·후보자에게 ‘문자인식이 되는 PDF 파일’을 제출하여 시각장애인의 접근성·편의성을 확보토록 안내하고 있습니다
다행히 pdf에서 글자를 추출할 수 있다. 이제는 이름과 명칭을 연결해서 데이터를 만들어야 한다,,,
매우 귀찮아지긴 했지만, 그래도 할 수 있는 방향이 생겼다.
'Personal Project > 국회의원 분석 프로젝트' 카테고리의 다른 글
| 국회의원 회의록 정규식으로 구분하기, docker를 이용해 elastic search로 설치, 저장하기, 오류 해결하기 (0) | 2025.02.02 |
|---|---|
| 국회의원 회의록 데이터 가져오는 법 with Python (0) | 2025.01.31 |
| 공공 api 읽어온 후 json 파일 csv로 전환한 후 저장하기 - python (0) | 2025.01.22 |
| 공공 api로 국회의원 코드 읽어오기 - python (0) | 2025.01.20 |
| 네이버 api로 뉴스 읽어오기 - python (0) | 2025.01.19 |