어느새 아이펠 7주차가 끝났다. 첫 주였던 오티 이틀을 뺀다 해도 거의 2개월동안 아이펠 과정을 소화하고 있는 것이다. 7주차에는 1차 해커톤이 진행되었다. 저번주부터 정처기 공부에 이번주는 해커톤에 집중하느라 블로그 포스팅에 많이 소홀했었다. 그래서 1차 해커톤도 끝났겠다 1/3이 지난 시점을 기록으로 남겨두면 좋을 것 같아서 포스팅을 하게 되었다. 8/4 ~ 8/6 3일 동안 진행된 1차 해커톤은 캐글 경연대회에 참여하는 것이었다. https://www.kaggle.com/c/recruit-restaurant-visitor-forecasting Recruit Restaurant Visitor Forecasting | Kaggle www.kaggle.com 일본 레스토랑의 방문자 수를 예측하는, 이미 ..
인공지능, 머신러닝, 딥러닝의 관계는 위의 그림과 같다. 인공지능이 가장 큰 범주이고 그 범주 안에 머신러닝과 딥러닝이 있다. 딥 러닝은 머신러닝의 범주에 포함이 된다. - 인공지능 사람이 직접 프로그래밍 한 내용이 아닌, 기계가 자체적으로 규칙 시스템을 구축하는 과학이다. - 머신러닝 데이터를 통해 스스로 학습하는 방법론이다. 머신러닝은 데이터를 분석하고 데이터 내의 패턴을 파악하여 학습을 한다. 학습한 내용을 토대로 판단과 예측을 한다. - 딥러닝 딥러닝은 학습하는 모델의 형태가 신경망인 방법론이다. 아직까지도 딥러닝 보다는 머신러닝이 더 많이 활용되기도 한다. > 딥러닝 vs 머신러닝 연결주의 신경망과 함수, 모델
파이썬으로 이미지를 다루기 전, 디지털 이미지에 대한 이해가 우선으로 필요하다. 디지털 화면은 색상을 가지는 점인 화소로 이루어져 있으며 각 화소는 RGB(Red, Green, Blue) 세 개의 색의 조합으로 색상이 표현된다. 디지털 이미지를 저장할 때는 각 점마다 색상 값을 저장하는 방식으로 저장한다. 이를 래스터(raster) 또는 비트맵(bitmap)이라고 하며 한 점마다 각 색상별로 8비트를 사용한다. 또 0 ~ 255 사이의 값(2^8=256)으로 해당 색의 감도를 표시한다. 또 다른 디지털 이미지 저장 방식으로는 벡터(vector) 방식이 있다. 이는 상대적인 점과 선의 위치를 방정식으로 기록했다가 확대 및 축소에 따라 각 화소가 어떻게 표현되는지를 재계산하기 때문에 디지털 이미지의 깨짐 현..
관세청 수출입 무역 통계 데이터를 사용하여 데이터 전처리를 해보았다. 먼저 데이터를 준비한다. 데이터를 가지고 무언가를 하기 전에 데이터의 대한 기본 정보부터 알아야 한다. 해당 데이터에서 금액은 단위가 천 불(USD 1,000)이며 무역수지는 '수출금액 - 수입금액'이다. > 결측치 (Missing Data) 중복된 데이터 이상치 (Outlier) 정규화(Normalization) 원-핫 인코딩 (One-Hot Encoding) 구간화 (Binning)
- 정규표현식 문서나 웹 사이트에서 특정 단어를 검색할 때 대부분 사용하는 Ctrl+F가 정규 표현식에 근거하여 만들어진 기능이라는 것을 lms 노드를 공부하면서 알게 되었다. 문자열에서 특정 문자를 원하는 문자로 변경할 때는 파이썬에서 .replace()를 사용하면 된다. 이는 정규 표현식을 이용하여 할 수도 있다. import re >>> text = 'I My Me Mine' >>> text_pattern = re.sub("I", "You", text) #re.compile()로 Regex 객체를 만든다. >>> print(text_pattern) You My Me Mine 정규 표현식은 특정 문자열 패턴을 정의하고 기존 문자열과 비교하여 일치하는지 확인하는 작업이다. import re >>> te..
- GitHub(깃허브) GitHub는 코드를 다루는 개발자들이 편리하게 협업하기 위한 도구이다. *Git : 개발을 진행하며 작성하는 소스 코드가 업데이트 되는 버전을 기록해두고 관리할 수 있는 소스 코드 버전 관리 시스템이다. *GitHub : Git으로 관리하는 프로젝트를 호스팅하고, 시간과 공간의 제약 없이 협업할 수 있는 온라인 서비스이다. Git이 버전 기록을 저장한다면 GitHub에서는 그 기록을 다른 사람과 공유하는 것이다. 로컬(Local, 개인 노트북 또는 데스크탑 같은 개인 컴퓨터)에서 작업한 내용을 Git을 통해 저장했다면 GitHub에 올려 원격(Remote, 웹사이트)으로도 작업 할 수 있도록 한다. 깃허브는 sw 개발 인턴을 하면서 두번째 프로젝트를 진행하는 동안 계속 썼기 때..
한국사 시험을 친 후 일주일 정도 방황(?하다가 다시 마음을 잡고 정처기 필기 공부와 코테 공부 병행 중이었다. 공부를 하던 중 문득, 이력서에 한 줄이라도 더 쓸 수 있는 자격증도 좋지만 나를 어필하고 보여줄 수 있는 것은 직접 겪어보는 경험들이 아닐까라는 생각이 들었다. 하지만 나는 고작 소프트웨어 개발이라고는 하지만 개발 축에 낄 수도 없는 유치원 수준의 sw 개발 인턴 4개월짜리 경험이 전부였다. 여기저기서 정보를 얻기 위해 오픈채팅방도 들어가고 인터넷 검색도 하면서 부트캠프를 알게 되었고, K-digital training이라는 정부에서 시행 중인 훈련 과정도 알게 되었다. 비전공자도 물론 신청하고 참여할 수 있다고는 하지만, 기본적인 코딩 개념은 있어야하며 기본 6개월이라는 시간동안 참여해야하..