AI 부트캠프/챕터2(10.14~11.08) 21

TIL 18 머신러닝

ANN 인공신경망사람의 실제 신경망을 모델링해서 만든 네트워크다. 입력층(Input Layer), 은닉층(Hidden Layer), 출력층(Output Layer)으로 구성되며, 각 층은 뉴런(Neuron)으로 이루어져 있다. ANN에서 뉴런은 퍼셉트론(perceptron)이라고 한다. 하나의 층은 여러 개의 퍼셉트론으로 이루어져있고, 이 층이 여러 개로 이루어진 것이 인공신경망 ANN이다.출력층 Output Layer문제의 형태에 따라 출력의 형태도 달라져야 한다. 출력층을 하나로만 일관시켜 사용하면 이런 세분화된 문제를 해결하지 못하기 때문에 우리는 출력층부터 만들게 된다. 은닉층에서의 연산 결과를 원하는 출력으로 바꾸는 것이 출력층이다. 입력층 Input Layer우리가 데이터를 사용할 때, 데이터..

WIL 3

새로운 챕터가 시작되고, 새로운 조원들을 만났다. 새로운 강의도 받고 새로운 내용을 배웠다. 이번 주의 초반은 챕터 1에서 마무리하지 못한 내용들과, 개인 과제를 완료하는 데 투자했다. 개인 과제를 해결하는 데 아주 큰 어려움이 많았다. 혼자서 배운 내용만으로 해결할 수 있는 가에 대한 의문이 계속 들었다. 튜터님께 질문하기 전에 혼자 이것저것 해보다가 그래도 안 되면 오라는 말을 들어서, 혼자서 어찌저찌 끝까지 마무리해서 제출했다. 그러나 이번 주 중간에 튜터님께서 조에 방문해서 부담없이 와서 질문해도 된다고 말씀해주셨고, 이제는 혼자서 끝까지 끙끙 앓지 않으려고 한다. 혼자서 끝까지 해낸 과제 결과물이 썩 마음에 들지도 않고, 제대로 했는 지도 모르겠기 때문이다. 아직 튜터님께 질문하러 가본 적이 없..

TIL 16 머신러닝

비지도학습지도학습은 정답이 존재하고, 이 정답을 맞추거나 예측하는 문제를 푸는데, 데이터에도 정답이 포함돼있어야 했다. 이에 반해 비지도학습은 정답을 맞추는 문제를 풀지 않는다. 비지도학습 중 군집화모델에 대해 알아보자. 먼저 군집화모델 중 k-means clusterig을 먼저 살펴보자.1. 군집화모델     1) k-means clustering이는 데이터를 그림으로 표현했을 때 가까운 애들끼리 묶는 것을 말한다. 머신러닝보다 알고리즘에 더 가깝다고 한다. 군집을 몇 개로 설정할 지를 구하는 방법으로 엘보우 방법이 있다. 엘보우 방법은 군집이 뭉쳐있을 수록 군집화가 잘 된 것인데, 이렇게 되게 하는 개수를 선택하는 방법이다.     2) 계층적 군집화데이터포인트를 계층 구조로 그룹화하는 방법이다. 크..

TIL 15 실무에 바로 쓰는 바닥부터 시작하는 머신러닝

Kaggle경진에 참여해 좋은 성취를 얻는 것만으로도 좋은 스펙이 될 수 있다. 캐글에 참여하는 것 자체가 하나의 포트폴리오가 될 수 있다. 데이터프레임데이터프레임의 기본 정보를 확인하는 메서드들을 함수가 아니기 때문에 변수를 호출하듯이 적어주면 된다.df.shape # 데이터프레임의 크기 확인(행, 열)df.coumns # 데이터프레임의 컬럼명 확인df.dtypes # 데이터프레임의 데이터 타입 확인df.describe() # 데이터프레임의 요약 통계량 확인df.info() # 데이터프레임의 기본 정보 확인(null값, 데이터 타입 등)데이터 전처리불러온 데이터를 머신러닝에 사용하려면 전처리를 해야 한다. 이를 통해 잘못된 데이터를 처리하고 데이터를 머신러닝이 이해하기 쉬운 형태로 바꿔줌으로써 머신러닝..

TIL 14 코드카타

강의 외부에서 추가로 알게된 내용1. 리스트 자체를 수정하는 메서드들 (in-place 수정)이 메서드들은 리스트 자체를 변경하고, 새로운 리스트를 반환하지 x.sort(): 리스트를 정렬하고, 반환 값은 None.append(): 리스트에 요소를 추가하고, 반환 값은 None.remove(): 리스트에서 특정 값을 제거하고, 반환 값은 None.reverse(): 리스트를 뒤집고, 반환 값은 None.2. 새로운 리스트를 반환하는 메서드들이 메서드들은 원본 리스트를 변경하지 않고, 새로운 리스트를 반환 o.sorted(): 원본 리스트는 그대로 두고, 정렬된 새로운 리스트를 반환합니다.copy(): 원본 리스트의 복사본을 반환합니다.map(): 각 요소에 함수를 적용한 새로운 리스트(또는 이터러블)를 ..

TIL 13 파이썬 라이브러리 복습 & 머신러닝

merge()를 사용해서 두 데이터프레임을 공통 열을 기준으로 병합할 수 있으며, concat()으로 행 또는 열 단위로 데이터프레임을 연결할 수 있고, join()으로는 인덱스를 기준으로 데이터프레임을 병합할 수 있다. groupby()함수를 통해 데이터를 특정 열을 기준으로 그룹화할 수 있는데, 그룹화한 데이터에 대해 다양한 집계함수를 사용할 수 있으며, 여러 열을 기준으로 그룹화할  수도 있다. pivot_table() 함수로 피벗테이블을 생성하여 데이터를 요약하고 특정 기준에 따라 재구조화할 수 있다. aggfunc에 여러 집계함수를 지정해 다양한 요약 통계를 얻을 수 있다. margins 옵션을 사용해 전체 합계를 추가할 수도 있다.# 점수의 합계와 평균을 계산하는 피벗테이블 생성pivot_mu..

TIL 12 인공지능을 위한 파이썬 & 라이브러리 복습

데이터프레임은 판다스의 핵심 자료 구조로 행과 열로 구성된 2차원 데이터 구조이고, 다양한 데이터 타입을 허용한다. 시리즈는 데이터프레임의 구성요소 중 하나로 하나의 열을 나타내는 1차원 구조다. 인덱스와 데이터 값이 쌍으로 구성되며 하나의 데이터 타입을 허용한다. 여러 개의 시리즈가 모여서 데이터프레임이 되는 것이다. 이 둘은 모두 인덱스를 가진다. Numpy는 ndarray와 배열을 효율적으로 처리할 수 있는 다양한 함수들을 제공하며, 데이터분석·머신러닝 ·딥러닝에서 기초가 되는 라이브러리로, 판다스와 함께 자주 사용된다. Numpy 배열에서는 반복문 없이 벡터화 연산으로 연산이 용이하다. 배열 간의 기본 연산은 모두 요소별로 수행된다. 인덱싱을 통해 배열의 특정 위치에 접근할 수 있고, 슬라이싱을 ..