목록파이썬 (2)
CDW (Coding Discussion World)
이번편은 random.choice를 활용한 load 분배를 해보려고 한다. X라는 리스트에 네이버, 카카오, 구글이 있다고 가정했을 때 랜덤한 값을 뽑으러면 random.choice(X)를 하면 된다. 그런데 네이버, 카카오, 구글을 5:3:2의 비율로 뽑고 싶다면 어떻게 하면 될까? 방법이야 많겠지만 아래처럼도 할 수 있다. 우선 주소 옆에 capa(비율)을 설정해보자. import random url = [ ['네이버',5], ['카카오',3], ['구글',2], ] 그 뒤에 url_total 이라는 변수를 만들고 미리 지정한 숫자만큼 변수에 데이터를 담는다 url_total = [] for i in url: for j in range(0,i[1]): url_total.append(i[0]) prin..

python selenium을 활용한 크롤링에 대해서 알아보고자 한다. 크롤링은 다들 많이 들어봤을거라고 생각한다. 크롬 등 웹에서 반복적으로 수행하는 일을 자동화 할수도 있고, 특정 게시글의 제목을 다 추출한다던가, 그림을 추출한다던가 응용하면 웹에서 반복적으로 수행해야 하는 일들을 자동화하기에 좋다. (이전 글중에 appium 을 통한 스마트폰 자동화랑 비슷하다) 우선 selenuim을 설치해보자. 이번편은 기본에 대해서 배울 것이므로 특별한 버전 없이 설치해도 무방하다. (신규 버전부터는 find_element_by_css_selector 등 기본적인 내용이 많이 바뀌었다. pip list로 selenium 버전이 4 이상이라면 3버전으로 설치하는것이 좋다 또는 pip list --outdated)..