본문 바로가기

이론/데이터 분석을 위한 판다스

(4)
데이터 가공하기 데이터 병합하기 # 실습을 위한 데이터 프레임 만들기 1 adf = pd.DataFrame({"x1" : ["A","B","C"], "x2": [1,2,3]}) adf # 데이터 프레임 만들기 2 bdf = pd.DataFrame({"x1" : ["A","B","D"], "x3": ["T","F","T"]}) bdf # 데이터 프레임 만들기 3 cdf = pd.DataFrame({"x1" : ["B","C","D"], "x2": [2,3,4]}) cdf 70. 왼쪽 열을 축으로 병합하기 pd.merge(adf, bdf, how='left', on='x1') # x1을 키로 해서 병합, 왼쪽(adf)를 기준으로 # 왼쪽의 adf에는 D가 없으므로 해당 값은 NaN으로 변환 71. 오른쪽 열을 축으로 병합하..
데이터 변환하기 새로운 열 만들기 52. 조건에 맞는 새 열 만들기 53. assign()을 이용해 조건에 맞는 새 열 만들기 54. 숫자형 데이터를 구간으로 나누기 55. 기준 값 이하와 이상을 모두 통일시키기 56. 최댓값 불러오기 57. 최솟값 불러오기 행과 열 변환하기 58. 모든 열을 행으로 변환하기 59. 하나의 열만 행으로 이동시키기 60. 여러 개의 열을 행으로 이동시키기 61. 특정 열의 값을 기준으로 새로운 열 만들기 62. 원래 데이터 형태로 되돌릭 시리즈 데이터 연결하기 63. 시리즈 데이터 합치기 64. 데이터를 병합할 때 새로운 인덱스 만들기 65. 계층적 인덱스를 추가하고 열 이름 지정하기 데이터 프레임 연결하기 66. 데이터 프레임 합치기 67. 열의 수가 다른 두 데이터 프레임 합치기 68..
데이터 정렬하기2 행과 열 추출하기 # 28.특정한 행과 열을 지정해 가져오기 #df.loc[가져올 행,가져올 열]의 형태로 불러옵니다. df.loc[:, 'a':'c'] # 모든 인덱스에서, a열부터 c열까지를 가져오라는 의미입니다. # 29. 인덱스로 특정 행과 열 가져오기 df.iloc[0:3, [0, 2]] # 0 인덱스부터 2인덱스까지, 0번째 열과 2번째 열을 가져오라는 의미입니다. (첫 열이 0번째입니다.) # 30. 특정 열에서 조건을 만족하는 행과 열 가져오기 df.loc[df['a'] > 5, ['a', 'c']] # a열의 값이 5보다 큰 경우의 a열과 c열을 출력하라는 의미입니다. # 31. 인덱스를 이용해 특정 조건을 만족하는 값 불러오기 df.iat[1, 2] # 1번째 인덱스에서 2번째 열 값을..
데이터 다루기 판다스 : 판다스는 데이터 분석과 관련된 다양한 기능을 제공하는 파이썬 라이브러리입니다. 데이터 만들기 # 1. 판다스 라이브러리 불러오기 import pandas as pd # 2. 데이터 프레임 만들기 df = pd.DataFrame( # df라는 변수에 데이터 프레임을 담아 줍니다. {"a" : [4 ,5, 6, 7], # 열 이름을 지정해 주고 시리즈 형태로 데이터를 저장합니다. "b" : [8, 9, 10, 11], "c" : [12, 13, 14, 15]}, index = [1, 2, 3, 4]) # 인덱스는 1,2,3으로 정해 줍니다. # 3. 데이터 프레임 출력 df # 4. 데이터의 열 이름을 따로 지정해서 만들기 df = pd.DataFrame( [[4, 8, 12], [5, 9, 13..