모두의연구소

일상/AIFFEL(아이펠)

AIFFEL 첫번째 해커톤 후기 | 캐글 레스토랑 방문자 수 예측하기

어느새 아이펠 7주차가 끝났다. 첫 주였던 오티 이틀을 뺀다 해도 거의 2개월동안 아이펠 과정을 소화하고 있는 것이다. 7주차에는 1차 해커톤이 진행되었다. 저번주부터 정처기 공부에 이번주는 해커톤에 집중하느라 블로그 포스팅에 많이 소홀했었다. 그래서 1차 해커톤도 끝났겠다 1/3이 지난 시점을 기록으로 남겨두면 좋을 것 같아서 포스팅을 하게 되었다. 8/4 ~ 8/6 3일 동안 진행된 1차 해커톤은 캐글 경연대회에 참여하는 것이었다. https://www.kaggle.com/c/recruit-restaurant-visitor-forecasting Recruit Restaurant Visitor Forecasting | Kaggle www.kaggle.com 일본 레스토랑의 방문자 수를 예측하는, 이미 ..

ML & DL

딥러닝과 머신러닝의 차이/연결주의/함수와 딥러닝 모델

인공지능, 머신러닝, 딥러닝의 관계는 위의 그림과 같다. 인공지능이 가장 큰 범주이고 그 범주 안에 머신러닝과 딥러닝이 있다. 딥 러닝은 머신러닝의 범주에 포함이 된다. - 인공지능 사람이 직접 프로그래밍 한 내용이 아닌, 기계가 자체적으로 규칙 시스템을 구축하는 과학이다. - 머신러닝 데이터를 통해 스스로 학습하는 방법론이다. 머신러닝은 데이터를 분석하고 데이터 내의 패턴을 파악하여 학습을 한다. 학습한 내용을 토대로 판단과 예측을 한다. - 딥러닝 딥러닝은 학습하는 모델의 형태가 신경망인 방법론이다. 아직까지도 딥러닝 보다는 머신러닝이 더 많이 활용되기도 한다. > 딥러닝 vs 머신러닝 연결주의 신경망과 함수, 모델

Python

[Python] Pillow, Opencv로 이미지 다루기

파이썬으로 이미지를 다루기 전, 디지털 이미지에 대한 이해가 우선으로 필요하다. 디지털 화면은 색상을 가지는 점인 화소로 이루어져 있으며 각 화소는 RGB(Red, Green, Blue) 세 개의 색의 조합으로 색상이 표현된다. 디지털 이미지를 저장할 때는 각 점마다 색상 값을 저장하는 방식으로 저장한다. 이를 래스터(raster) 또는 비트맵(bitmap)이라고 하며 한 점마다 각 색상별로 8비트를 사용한다. 또 0 ~ 255 사이의 값(2^8=256)으로 해당 색의 감도를 표시한다. 또 다른 디지털 이미지 저장 방식으로는 벡터(vector) 방식이 있다. 이는 상대적인 점과 선의 위치를 방정식으로 기록했다가 확대 및 축소에 따라 각 화소가 어떻게 표현되는지를 재계산하기 때문에 디지털 이미지의 깨짐 현..

Python

[Python] 데이터 전처리 하기 / 결측치, 중복 데이터, 이상치, 정규화, 원-핫 인코딩, 구간화

관세청 수출입 무역 통계 데이터를 사용하여 데이터 전처리를 해보았다. 먼저 데이터를 준비한다. 데이터를 가지고 무언가를 하기 전에 데이터의 대한 기본 정보부터 알아야 한다. 해당 데이터에서 금액은 단위가 천 불(USD 1,000)이며 무역수지는 '수출금액 - 수입금액'이다. > 결측치 (Missing Data) 중복된 데이터 이상치 (Outlier) 정규화(Normalization) 원-핫 인코딩 (One-Hot Encoding) 구간화 (Binning)

Python

[Python] 데이터를 array와 table로 표현하고 시각화 하기 / NumPy, Pandas, Matplotlib

>NumPy>> import numpy as np >>> a = np.arange(3) >>> a [0 1 2] >>> b = np.array([0,1,2]) >>> b [0 1 2] >>> c = np.array([0,1,2,3,'4']) >>> c ['0','1','2','3','4'] - 특수행렬 numpy는 단위행렬, 0 행렬, 1 행렬 등과 같은 특수 행렬을 함수로 제공하고 있다. >>> import numpy >>> np.eye(3) #단위행렬 array([[1., 0., 0.], [0., 1., 0.], [0., 0., 1.]]) >>> np.zeros([2,3]) #0 행렬 array([[0., 0., 0.], [0., 0., 0.]]) >>> np.ones([3,3]) #1 행렬 arra..

Python

[Python] 정규표현식, 파이썬으로 여러가지 파일 포맷 다루기(CSV, XML, JSON)

- 정규표현식 문서나 웹 사이트에서 특정 단어를 검색할 때 대부분 사용하는 Ctrl+F가 정규 표현식에 근거하여 만들어진 기능이라는 것을 lms 노드를 공부하면서 알게 되었다. 문자열에서 특정 문자를 원하는 문자로 변경할 때는 파이썬에서 .replace()를 사용하면 된다. 이는 정규 표현식을 이용하여 할 수도 있다. import re >>> text = 'I My Me Mine' >>> text_pattern = re.sub("I", "You", text) #re.compile()로 Regex 객체를 만든다. >>> print(text_pattern) You My Me Mine 정규 표현식은 특정 문자열 패턴을 정의하고 기존 문자열과 비교하여 일치하는지 확인하는 작업이다. import re >>> te..

Git

GitHub (깃허브) 시작하기

- GitHub(깃허브) GitHub는 코드를 다루는 개발자들이 편리하게 협업하기 위한 도구이다. *Git : 개발을 진행하며 작성하는 소스 코드가 업데이트 되는 버전을 기록해두고 관리할 수 있는 소스 코드 버전 관리 시스템이다. *GitHub : Git으로 관리하는 프로젝트를 호스팅하고, 시간과 공간의 제약 없이 협업할 수 있는 온라인 서비스이다. Git이 버전 기록을 저장한다면 GitHub에서는 그 기록을 다른 사람과 공유하는 것이다. 로컬(Local, 개인 노트북 또는 데스크탑 같은 개인 컴퓨터)에서 작업한 내용을 Git을 통해 저장했다면 GitHub에 올려 원격(Remote, 웹사이트)으로도 작업 할 수 있도록 한다. 깃허브는 sw 개발 인턴을 하면서 두번째 프로젝트를 진행하는 동안 계속 썼기 때..

일상/AIFFEL(아이펠)

인공지능 개발자 양성과정 AIFFEL(아이펠) 합격 | 면접 후기

한국사 시험을 친 후 일주일 정도 방황(?하다가 다시 마음을 잡고 정처기 필기 공부와 코테 공부 병행 중이었다. 공부를 하던 중 문득, 이력서에 한 줄이라도 더 쓸 수 있는 자격증도 좋지만 나를 어필하고 보여줄 수 있는 것은 직접 겪어보는 경험들이 아닐까라는 생각이 들었다. 하지만 나는 고작 소프트웨어 개발이라고는 하지만 개발 축에 낄 수도 없는 유치원 수준의 sw 개발 인턴 4개월짜리 경험이 전부였다. 여기저기서 정보를 얻기 위해 오픈채팅방도 들어가고 인터넷 검색도 하면서 부트캠프를 알게 되었고, K-digital training이라는 정부에서 시행 중인 훈련 과정도 알게 되었다. 비전공자도 물론 신청하고 참여할 수 있다고는 하지만, 기본적인 코딩 개념은 있어야하며 기본 6개월이라는 시간동안 참여해야하..

토오오끼
'모두의연구소' 태그의 글 목록