-
데이터 분석에서 Numpy를 쓰는 이유Learning with class/Deep Learning 2022. 12. 8. 00:07
✔ 분석모델들이 Numpy를 활용하는 이유
파이썬은 분석을 목적으로 제작된 언어가 아니다. 따라서, R과 달리 분석에 적합한 자료구조나
계산방식을 자체적으로 갖고있지 않다.
따라서, (1, 2, 3) * 3 == (3, 6, 9) 라는 값을 얻고자 한다면 넘파이 자료형을 통해 계산을 수행해야 한다.
## 리스트 자료형의 곱 thelist = [1,2,3] thelist * 3 # output ([1,2,3],[1,2,3],[1,2,3]) ## 넘파이 자료형의 곱 import numpy as np np.array(thelist) * 3 # output ([3,6,8])
배열의 구조가 다르지만 '브로드캐스팅'을 통해 각 요소에 3의 값이 곱해진 것을 알 수 있다.
만약 리스트를 통해 동일한 계산을 수행하려면 다중반복문을 통해 각 리스트의 요소에 접근해야 한다.
또한, 넘파이는 '행렬곱'의 형태로 서로 다른 배열간의 계산을 수행 할 수 있어서 머신러닝이나 딥러닝의 수학적 모델을 계산하는데 적합하다고 할 수 있다.
** 여기서 판다스는 엑셀과 같이 '관계형 테이블' 구조에 맞춘 'DataFrame' 자료형을 가진 도구로써,
2차원 Numpy 자료형에 부가적 기능이 들어간 형태라고 볼 수 있다. 데이터의 탐색 및 시각화에 특히 유용하게 활용된다.
https://cleancode-ws.tistory.com/13
[파이썬] 간단 명료한 Numpy와 Pandas 차이
머신러닝과 딥러닝을 할때, 구분해서 사용하면 좋음. Numpy (핵심 기능: 다차원(n-차원) 배열인 ndarray 클래스, 배열의 모든 원소는 동일한 데이터 타입이여야 함) 1. 다차원 배열 객체 2. 유니버설 함
cleancode-ws.tistory.com
'Learning with class > Deep Learning' 카테고리의 다른 글
GAN(Generative Adversarial Networks) 개요 (0) 2022.12.08 Loss와 Metric 매개변수의 차이 (0) 2022.12.08 텐서플로우 vs 케라스 (참고페이지) (0) 2022.12.07 딥러닝_경사하강법 옵티마이저 (0) 2022.12.05 딥러닝의 이해(2) - 가중치 (0) 2022.12.05