1 - 3 Pandas의 기본. 시리즈와 데이터 프레임 개념 잡기
- 시리즈와 데이터 프레임의 차이점 및 공통점
시리즈 | 인덱스 | |
차이점 | 1차원. 하나의 데이터 타입 허용 | 2차원. 다양한 데이터 타입 허용 |
공통점 | 인덱스를 가지고 있어 데이터에 쉽게 접근 가능. 판다스에서 가장 기본적인 데이터 구조 |
2 - 1 Numpy 소개 및 설치
- Numpy : 과학 · 수학 계산에 강력한 성능을 제공하는 파이썬 라이브러리.
- 주요 특징 1) 고속 배열 연산 2) 다양한 수학 함수 3) 선형대수, 통계 함수
- 복잡한 계산을 단순하게 만들 수 있지만, 내부적인 동작 원리에 따라 에러 발생하는 문법이 있을 수 有 때문에 주의!
2 - 2 Numpy 배열(array) 생성 및 기초 연산
- 다양한 attribute들
arr.ndim # 차원을 확인.
arr.size # 배열이 전체 요소를 몇 개 갖고 있는 지 확인.
arr.dtype # 데이터 타입 확인.(전체 데이터 타입은 전체를 수용가능한 상태로 바뀜)
arr.nbytes # 배열이 실제로 얼만큼의 메모리를 차지하고 있는지 확인.(우리가 사용하는 데이터의 크기가 클수록 필요한 작업)
arr.T # 선형대수의 transpose 확인.(전차행렬 확인)
arr.reshape # 데이터의 차원 계산만 맞다면, 개수를 맞출 수 있다면 바로 차원을 바꿀 수 ㅇ. 형상을 원하는 대로 구성할 수 있는 것.
arr_2.ravle() # 데이터 개수와 상관없이 1차원으로 바꿀 수 ㅇ.
arr_2.flatten() # 1차원으로 바꾸지만(차원을 평탄화해주지만), 원본은 바꾸지 않음.
arr_2.transposed # 배열의 축을 transpose함.
arr_2.sum() # 좀 더 다양하게 활용 가능. 축 지정 가능. 괄호 안에 열 기준 axis=0, 행 기준 axis=1를 넣으면 됨.
arr_2.mean() # 평균 구하기.
arr_2.max() # 최댓값 구하기.
* 주의 : 복합 대입 연산자는 메모리 자체에 변경을 가하려고 하는데, 데이터 타입이 맞지 않는 결과가 나오는 경우 문제됨.
but 데이터 타입이 맞으면 문제 생기지 x.
∴ 데이터 타입을 바꾸는 연산을 진행하면, 계산 진행한 다음 다시 변수에 집어넣어주는 형태로 값을 구성해야 함.
이는 파이썬의 구조와 관련되므로 외우자!
- 복합 연산 中 2차원을 곱하는 경우, 각각 맵핑시켜서 곱하기 때문에 단순히 행렬 곱을 기대하면 원하는 결과가 나오지x.
'AI 부트캠프 > 챕터1(9.30~10.11)' 카테고리의 다른 글
TIL 7 인공지능을 위한 파이썬 라이브러리 (4 - 1 ~ 5 - 4) (0) | 2024.10.08 |
---|---|
TIL 6 인공지능을 위한 파이썬 라이브러리 (2 - 3 ~ 3 - 4) : TIL 특강을 듣고 작성 방식을 변경함 (0) | 2024.10.05 |
WIL 1 (0) | 2024.10.03 |
TIL 4 (파이썬 강의 5 - 1 ~ 5 - 2 + 라이브러리 강의 1 - 1 ~ 1 - 2 ) (3) | 2024.10.02 |
TIL 3 (인공지능을 위한 파이썬 3 - 5 ~ 4 - 5) (1) | 2024.10.02 |