본문 바로가기

728x90
반응형

연구개발/데이터시각화

(25)
데이터 시각화 프로그래밍9 - pandas를 이용해 주식 차트 그리기 파이썬 Matplotlib을 이용한 데이터 시각화 프로그래밍9 - pandas를 이용해 주식 차트 그리기 pandas는 파이썬을 위한 데이터 구조 및 분석을 위한 매우 편리하고 고성능의 오픈소스 라이브러리 입니다. BSD 라이선스라서 pandas를 누구나 수정하여 사용할 수 있고, 재배포의 의무가 없으며 심지어 상용 소프트웨어에서도 제한없이 사용할 수 있습니다. 8편에서 주식 차트를 그리기위해 야후의 Open API URL주소를 이용해서 데이터를 가져오고 그것을 numpy.loadtxt()라는 함수로 주가 데이터를 파싱하여 matplotlib으로 차트를 그리는 알고리즘이었습니다. 자, 이제는 pandas를 이용해 8편과 동일한 프로그램을 만들어 보겠습니다. pandas의 위력을 조금이나마 알 수 있습니다..
데이터 시각화 프로그래밍8 - Open API를 이용해 주식 차트 그리기 파이썬 Matplotlib을 이용한 데이터 시각화 프로그래밍8 - Open API를 이용해 주식 차트 그리기 이번에는 인터넷에 공개된 API를 이용해 주식 정보를 받아오고 이에 대한 차트를 Matplotlib으로 그려보도록 하겠습니다. 불행히도 주식 정보를 API로 제공하는 국내 사이트는 없습니다. 증권사에서 자체적인 API를 제공해주고 있긴 한데, 그냥 가져다 쓰기에는 무척이나 번거로운 작업이고 절차도 까다롭습니다. 하지만 걱정은 여기까지~ 우리나라 주가 정보를 편리하게 제공해주는 사이트가 하나 있는데, 바로 미국의 야후입니다.주가 정보를 제공하는 주소는 다음과 같습니다. http://chartapi.finance.yahoo.com/instrument/1.0/{종목코드}/chartdata:type=qu..
데이터 시각화 프로그래밍7 - 파일을 읽어서 그래프 그리기 파이썬 Matplotlib을 이용한 데이터 시각화 프로그래밍7 - 파일로부터 데이터를 읽어서 그래프 그리기 첨부한 파일(births.txt)은 1880년부터 2011년까지 미국에서 태어난 남녀 출생아 수를 정리한 데이터입니다.이 파일은 아래와 같은 형식으로 되어 있습니다. 1880, 90993, 110491 1881, 91954, 100745 1882, 107850, 113688........ 각 숫자는 콤마로 구분되어 있고 첫번째 데이터는 년도, 두번째 데이터는 여자 아기 출생수, 세번째 데이터는 남자 아기 출생수입니다.우리가 해볼 것은 이 데이터를 읽어서 여자 아기와 남자 아기의 출생수 추이를 그래프로 나타내 보고자 합니다. 자, 코드를 바로 보실까요.. >>> import csv 파일로부터 데이터를..
데이터 시각화 프로그래밍6 - 파이 차트 그리기 파이썬 Matplotlib을 이용한 데이터 시각화 프로그래밍6 - Matplotlib으로 파이 차트 그리기 파이 차트는 전체를 이루는 각 구성 요소가 전체 중 얼마만큼의 비중으로 되어 있는지 파악하기 매우 좋은 그래프 유형입니다. 바로 코드를 보실까요.. 파이 차트를 그리기 위한 데이터는 누적 영역 그래프에서 사용된 어느 사람의 한달 동안 하루 일과 데이터입니다. >>> activities = ['sleeping', 'working', 'eating', playing'] 파이 차트의 라벨을 정의합니다. 이는 데이터 순서와 동일해야 합니다. >>> n = 11>>> title = 'Pie Chart for %d day' %(n+1)>>> plt.title(title) 한 사람의 한달 동안 하루 일과에서 1..
데이터 시각화 프로그래밍5 - 누적 영역 그래프 그리기 파이썬 Matplotlib을 이용한 데이터 시각화 프로그래밍5 - Matplotlib으로 누적 영역 그래프 그리기 누적 영역 그래프(Stacked Area Graph)는 전체에서 부분이 차지하는 것을 쉽게 보이게 하는 그래프의 한 종류입니다. 이런 목적을 가진 다른 유형의 그래프는 파이 차트입니다. 누적 그래프는 시간의 경과에 따라 각 부분들이 어떻게 변해가는지 살펴보기에 좋은 유형의 그래프인 반면, 파이 차트는 특정 기간 동안 각 부분이 얼만큼 비중을 차지하는가를 살펴보기에 좋은 그래프입니다. 일단 누적 영역 그래프를 그려보겠습니다. 이 코드는 1에서 180도까지 사인 그래프 4개를 누적시킨 그래프를 그립니다.Matplotlib의 누적 영역 그래프를 그리는 함수는 plt.stackplot() 입니다. ..
데이터 시각화 프로그래밍4 - 산점도 그리기 파이썬 Matplotlib을 이용한 데이터 시각화 프로그래밍4 - Matplotlib으로 산점도 그리기 산점도(Scatter plot)는 2차원 또는 3차원 좌표에 도형으로 표시를 하여 데이터의 상관관계 등을 파악하기 위해 주로 사용됩니다. 아래의 코드는 1에서 100까지 수를 마구 섞어 x좌표, y좌표를 만들고 산점도 결과를 출력하는 코드입니다. 산점도를 그려주는 Matplotlib 함수는 plt.scatter() 입니다. scatter() 함수의 인자는 다양한데, 이 코드에서는 x, y좌표와 라벨, 표시할 도형 종류, 그리고 색상만 인자로 정의했습니다. 산점도에서 표시할 수 있는 도형은 marker= 로 지정하면 되는데, Matplotlib에서 제공하는 마커의 종류는 여기를 참고하세요. 산점도 그리기..
데이터 시각화 프로그래밍3 - 막대그래프 그리기 파이썬 Matplotlib을 이용한 데이터 시각화 프로그래밍3 - Matplotlib으로 막대그래프, 히스토그램 그리기 막대 그래프(Bar Chart)나 히스토그램은 특정 그룹의 데이터의 추세와 정량적인 분포를 파악하는데 매우 유용합니다. Matplotlib으로 막대 그래프 그리기다음과 같은 두 개의 데이터 세트가 있다고 가정합니다. 세트1: (1, 5), (3, 3), (5, 9), (7, 2), (9, 8) 세트2: (2, 8), (4, 7), (6, 2), (8, 11), (10, 4) 이를 막대 그래프로 그리기 위한 코드는 아래와 같습니다. >>> plt.bar(data_x1, data_y1, label='Set 1', color='b') Matplotlib에서 막대 그래프를 그리는 함수는 plt..
데이터 시각화 프로그래밍2 - Matplotlib 제목과 라벨 삽입하기 파이썬 Matplotlib을 이용한 데이터 시각화 프로그래밍2 - Matplotlib에 제목, 라벨, 레전드 삽입하기 데이터를 분석하고 그 결과만 화면에 출력한다면 이게 무슨 데이터를 분석하여 나온 결과인지 전혀 모를 수 있습니다.따라서 결과 화면에 제목과 라벨, 레전드 등을 삽입하여 결과를 보는 사용자에게 친절함을 베풀어주는 것이 중요하겠죠. 이번 포스팅에서는 Matplotlib을 이용해 결과를 화면에 출력하되 제목과 라벨, 레전드를 삽입하는 방법에 대해 알아봅니다. 아래는 Jupyter Notebook으로 코딩을 하고 실행한 후 결과를 보인 것입니다. 이 코드는 0도에서 360도 범위에서 삼각함수의 사인함수와 코사인함수의 그래프를 화면에 출력합니다.plt.plot()에 대해서는 이전 포스팅에서 배웠으..

728x90
반응형