AI 부트캠프/챕터1(9.30~10.11)

TIL 5 인공지능을 위한 파이썬 라이브러리 (1 - 3 ~ 2 - 2)

musukie 2024. 10. 4. 17:20

   1 - 3 Pandas의 기본. 시리즈와 데이터 프레임 개념 잡기

- 시리즈와 데이터 프레임의 차이점 및 공통점

  시리즈 인덱스
차이점 1차원. 하나의 데이터 타입 허용 2차원. 다양한 데이터 타입 허용
공통점 인덱스를 가지고 있어 데이터에 쉽게 접근 가능.
판다스에서 가장 기본적인 데이터 구조

 

   2 - 1 Numpy 소개 및 설치

- Numpy : 과학 · 수학 계산에 강력한 성능을 제공하는 파이썬 라이브러리.

- 주요 특징 1) 고속 배열 연산    2) 다양한 수학 함수    3) 선형대수, 통계 함수

- 복잡한 계산을 단순하게 만들 수 있지만, 내부적인 동작 원리에 따라 에러 발생하는 문법이 있을 수 有 때문에 주의!

   2 - 2 Numpy 배열(array) 생성 및 기초 연산

- 다양한 attribute들

arr.ndim	# 차원을 확인.
arr.size	# 배열이 전체 요소를 몇 개 갖고 있는 지 확인.
arr.dtype	# 데이터 타입 확인.(전체 데이터 타입은 전체를 수용가능한 상태로 바뀜)
arr.nbytes	# 배열이 실제로 얼만큼의 메모리를 차지하고 있는지 확인.(우리가 사용하는 데이터의 크기가 클수록 필요한 작업)
arr.T		# 선형대수의 transpose 확인.(전차행렬 확인)
arr.reshape	# 데이터의 차원 계산만 맞다면, 개수를 맞출 수 있다면 바로 차원을 바꿀 수 ㅇ. 형상을 원하는 대로 구성할 수 있는 것.
arr_2.ravle()	# 데이터 개수와 상관없이 1차원으로 바꿀 수 ㅇ.
arr_2.flatten()	# 1차원으로 바꾸지만(차원을 평탄화해주지만), 원본은 바꾸지 않음.
arr_2.transposed	# 배열의 축을 transpose함.
arr_2.sum()	# 좀 더 다양하게 활용 가능. 축 지정 가능. 괄호 안에 열 기준 axis=0, 행 기준 axis=1를 넣으면 됨.
arr_2.mean()	# 평균 구하기.
arr_2.max()	# 최댓값 구하기.

 

* 주의 : 복합 대입 연산자는 메모리 자체에 변경을 가하려고 하는데, 데이터 타입이 맞지 않는 결과가 나오는 경우 문제됨.

             but 데이터 타입이 맞으면 문제 생기지 x. 

            ∴ 데이터 타입을 바꾸는 연산을 진행하면, 계산 진행한 다음 다시 변수에 집어넣어주는 형태로 값을 구성해야 함.

            이는 파이썬의 구조와 관련되므로 외우자!

- 복합 연산 中 2차원을 곱하는 경우, 각각 맵핑시켜서 곱하기 때문에 단순히 행렬 곱을 기대하면 원하는 결과가 나오지x.