Guts !!
[패스트 캠퍼스 수강 후기] 올인원 패키지: 직장인을 위한 파이썬 데이터 분석 100% 환급 챌린지 23회차 미션 본문
[패스트 캠퍼스 수강 후기] 올인원 패키지: 직장인을 위한 파이썬 데이터 분석 100% 환급 챌린지 23회차 미션
버블스텝 2020. 11. 10. 23:01[ Python 필수 스킬 - Numpy ]
- 브로드캐스팅
[ Python 필수 스킬 - Pandas ]
- Series 와 DataFrame
오늘 포스팅은 어제 못했던 Numpy 수업의 마지막 브로드캐스팅에 관한 강의 리뷰와 Pandas라는 새로운 주제로 넘어가겠습니다.
[ 브로드캐스팅 ]
브로드 캐스팅은 쉽게 말해서 이전의 배열에 관한 덧셈이나 곱셈을 구했을 때 똑같이 요소(원소)값에 +3을 더해주고 싶다면 3으로 가득찬 배열을 하나더 만들어서 사칙연산을 진행 했어야 됬다. 그렇지만 브로드 캐스팅이라는 기능을 사용하면 그냥 배열객체에 +3, *3을 해주면 끝나게 된다.
[ Pandas ]
이번 부터 새로운 주제인 Pandas 입니다. 먼저 Pandas를 사용하기 위해서는 다음과 같은 모듈 Import를 시켜주기로 하자 as는 이전에 설명했듯이 별명을 만들어 주는 것 !
주로 pd 라는 축약어로 사용된다.
주로 Pandas는 데이터 오브젝트(데이터를 담고 있는 그릇) 중에서 Series 와 DataFrame 을 많이 사용할 것 입니다.
이 두가지 데이터 오브젝트에 관해 잘 이해 하면 Pandas의 전부를 이해 한것과 비슷할 것입니다.
두 오브젝트의 특징은 차원입니다. Series는 1차원 배열 !! DataFrame은 2차원 배열 이라고 생각 하면 됩니다.
1. 첫번째 Series
Pandas에서 중요한 데이터 오브젝트 중 하나인 Series는 기본적으로 아래와 같이 값의 리스트를 넘겨 주어 만들 수 있습니다. 또한 값이 위치하고 있는 정보인 index가 Series에 같이 저장되게 됩니다.
2. DataFrame
두번째 데이터 오브젝트인 DataFrame은 여러 형태의 데이터를 받아 생성할 수 있습니다.
그중 한가지 방법으로는 numpy array를 받아 생성이 가능하고 또는 2차원의 리스트를받아서 또는
Dict를 이용하는 방법이 있습니다.
1) Series 합치기
2) numpy array로 받기
3) Dict로 만들기
4) 2차원 리스트만들고 변환하기
DataFrame 을 간단하게 하나만 설정을 하겠습니다.
[ 2차원 리스트 형태로 형성 ]
위와 같이 company 라는 객체에 2차원 리스트를 형성해서 pd.DataFrame함수를 이용해서 DataFrame이라는 데이터 오브젝트를 형성해주게 됩니다.
위와 같이 마치 엑셀의 하나의 행렬처럼 나오게 되는 형태가 바로 DataFrame 입니다. 그런데 row와 column의 이름이 정해지지 않으면 저렇게 순서대로 번호로 주어지게 됩니다.
이것을 바꾸는 방법은
위와 같이 해줘도 되고 처음부터 만들때 넣어주는 방식도 있습니다. 그럼 컬럼명과 인덱스 명을 넣어주는 방법도 해보겠습니다.
* pd.data_range() 데이터의 값을 범위를 지정해서 줄 수 있다.
여기선 20201110 이라는 날짜 데이터에 Periods = 6 이라는 옵션을 부여 하게 되서
11/10~ 11/15일까지 일정에 대한 데이터를 뽑아준다.
그 이후에 pd.DataFrame을 이용해서 변환해주고 np.random.randn()라는 것은 데이터값을 임의이 숫자로 넣어 달라고 하는 함수입니다. (6,4)이기 때문에 이에 맞게 row 명과 column명을 지정해 줘야 합니다.
index = data는 아까 만든 날짜 6개 데이터 입니다. 4개를 일렬로 리스트 형태로 넣어주게 됩니다. 만약에 ('ABCD')만 쓰고 넣어준다면 오류가 발생하게 됩니다. 그렇기에 list('ABCD')라고 하면 각 알파벳을 LIST로 변환해서 값을 넣어주기 때문에 오류가 뜨지 않습니다.
오늘의 포스팅은 여기 까지 하겠습니다. 내일은 남은 방법 중 DataFrame을 만드는 방법과
이후 Pandas 기본을 배우겠습니다.
해당 강의 이미지 링크
'FastCampus[직장인] 위한 파이썬(미션)' 카테고리의 다른 글
[패스트 캠퍼스 수강 후기] 올인원 패키지: 직장인을 위한 파이썬 데이터 분석 100% 환급 챌린지 25회차 미션 (0) | 2020.11.12 |
---|---|
[패스트 캠퍼스 수강 후기] 올인원 패키지: 직장인을 위한 파이썬 데이터 분석 100% 환급 챌린지 24회차 미션 (0) | 2020.11.11 |
[패스트 캠퍼스 수강 후기] 올인원 패키지: 직장인을 위한 파이썬 데이터 분석 100% 환급 챌린지 22회차 미션 (0) | 2020.11.09 |
[패스트 캠퍼스 수강 후기] 올인원 패키지: 직장인을 위한 파이썬 데이터 분석 100% 환급 챌린지 21회차 미션 (0) | 2020.11.08 |
[패스트 캠퍼스 수강 후기] 올인원 패키지: 직장인을 위한 파이썬 데이터 분석 100%환급 챌린지 20회차 미션 (0) | 2020.11.07 |