목록분류 전체보기 (73)
CDW (Coding Discussion World)
간단하게 소개하자면 우리는 인트라넷에서 문서를 찾아야 하는 직원부터 자신에게 꼭 맞는 신발을 찾아 인터넷을 검색하는 고객까지 모두가 필요한 것을 더 빠르게 찾도록 돕습니다. 조금 더 기술적으로 설명하자면, Elasticsearch는 텍스트, 숫자, 위치 기반 정보, 정형 및 비정형 데이터 등 모든 유형의 데이터를 위한 무료 검색 및 분석 엔진으로 분산형과 개방형을 특징으로 합니다. Elasticsearch는 Apache Lucene을 기반으로 구축되었으며, Elasticsearch N.V.(현재 명칭 Elastic)가 2010년에 최초로 출시했습니다. 간단한 REST API, 분산형 특징, 속도, 확장성으로 유명한 Elasticsearch는 데이터 수집, 보강, 저장, 분석, 시각화를 위한 무료 개방형 ..
Red Hat OpenShift는 어디에 배포하든 클라우드와 유사한 경험을 지원하는 최고의 엔터프라이즈급 쿠버네티스 플랫폼입니다. Red Hat OpenShift를 사용하면 클라우드, 온프레미스, 엣지 등 위치와 관계없이 일관된 경험을 통해 애플리케이션을 빌드, 배포, 실행할 위치를 선택 확장성 Red Hat OpenShift에서 실행되는 앱은 몇 초 만에 수백 개의 노드에서 수천 개의 인스턴스로 확장할 수 있습니다. 유연성 Red Hat OpenShift는 하이브리드 인프라의 배포 및 관리를 단순화 하여 온프레미스 또는 클라우드 및 하이브리드 환경에서 실행 되는 자체 관리형 또는 완전 관리형 서비스 를 보유할 수 있는 유연성을 제공합니다. 오픈 소스 표준 Red Hat OpenShift는 OCI(Ope..
쿠버네티스의 기본 오브젝트에는 4가지가 있다. 1. 파드 - 쿠버네티스의 최소 단위. 서비스를 구동하는데 필요한 최소 단위 - 1개의 파드는 한 개 이상의 컨테리너를 가질 수 있지만 보통 1개의 파드에 1개의 컨테이너를 사용 2. 네임스페이스 - 쿠버네티스 클러스터에서 사용되는 리소스들을 구분해서 관리하는 그룹 3. 볼륨 - 파드가 생성될 때 파드에서 사용할 수 있는 디렉토리를 제공 4. 서비스 - 파드의 접속 정보가 고정이지 않기 때문에 새로 파드가 생성될 때 부여되는 새로운 IP를 기존에 제공하던 기능과 연결 (GW와 비슷한 역할) 추가적인 용어들 5. 디플로이먼트 - 레플리카셋 오브젝트를 합쳐놓은 형태 (레플리카셋을 포함하는 오브젝트의 상태 감시) - 다수의 파드 생성시 하나씩 생성하면 비효율적이므..
pyinstaller를 사용하면 python 스크립트를 가지고 실행 파일로 만들 수 있다. 우선 pyinstaller를 설치해준다. pip install pyinstaller 다음으로 pyinstaller ${파일명}.py를 실행시키면 파이썬 프로그램이 깔려있지 않아도 실행 가능한 파일들이 나온다. dist/build 라는 폴더가 생기고 해당 폴더 안에 파일들이 있다. pyinstaller ${파일명}.py 이제 실행파일(exe파일)로 만들어보자. -F 나 --onefile 옵션을 입력하면 된다. pyinstaller --onefile ${파일명}.py 이렇게 하면 build 폴더 안에 실행 가능한 파일이 만들어진다. (파일의 사이즈는 어떤 라이브러리들을 가져다 썼는지에 따라 차이가 많이 날 수 있다.)..
python selenium을 통해 대표 포털 사이트(네이버,구글,daum,zum,bing) 자동 검색하기를 해보고자 한다. selenium은 4버전 이상으로 한다. 1. Naver from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys import time url = 'https://www.naver.co.kr' options = webdriver.ChromeOptions() options.add_argument('start-maximized') driver = webdriver.Chrome('chromedriver.exe', options..
이번편은 random.choice를 활용한 load 분배를 해보려고 한다. X라는 리스트에 네이버, 카카오, 구글이 있다고 가정했을 때 랜덤한 값을 뽑으러면 random.choice(X)를 하면 된다. 그런데 네이버, 카카오, 구글을 5:3:2의 비율로 뽑고 싶다면 어떻게 하면 될까? 방법이야 많겠지만 아래처럼도 할 수 있다. 우선 주소 옆에 capa(비율)을 설정해보자. import random url = [ ['네이버',5], ['카카오',3], ['구글',2], ] 그 뒤에 url_total 이라는 변수를 만들고 미리 지정한 숫자만큼 변수에 데이터를 담는다 url_total = [] for i in url: for j in range(0,i[1]): url_total.append(i[0]) prin..

python selenium을 활용한 크롤링에 대해서 알아보고자 한다. 크롤링은 다들 많이 들어봤을거라고 생각한다. 크롬 등 웹에서 반복적으로 수행하는 일을 자동화 할수도 있고, 특정 게시글의 제목을 다 추출한다던가, 그림을 추출한다던가 응용하면 웹에서 반복적으로 수행해야 하는 일들을 자동화하기에 좋다. (이전 글중에 appium 을 통한 스마트폰 자동화랑 비슷하다) 우선 selenuim을 설치해보자. 이번편은 기본에 대해서 배울 것이므로 특별한 버전 없이 설치해도 무방하다. (신규 버전부터는 find_element_by_css_selector 등 기본적인 내용이 많이 바뀌었다. pip list로 selenium 버전이 4 이상이라면 3버전으로 설치하는것이 좋다 또는 pip list --outdated)..

구글 크롬 드라이버가 자동 업데이트 되면 신규 기능에 의한 버그가 발생할 수도 있고, 기존에 사용하던 크롬 드라이버랑 호환이 안맞는 프로그램이 생길수도 있다. 이에 크롬 드라이버 자동 업데이트를 취향에 맞게 On/Off 가능하다. Win + R 입력 후 taskschd.msc 입력 후 엔터 작업 스케줄러 화면이 나타나며 아래 두개의 이름이 있다. GoogleUpdateTaskMachineCore GoogleUpdateTaskMachineUA 2개의 항목에 대해 '사용 안함' 으로 설정하면 된다. (다시 On할수도 있으니 삭제하지는 말자)