데이터 로드
import pandas as pd
import numpy as np
mpg=pd.read_csv('mpg.csv')
mpg.head()
| manufacturer | model | displ | year | cyl | trans | drv | cty | hwy | fl | category | |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | audi | a4 | 1.8 | 1999 | 4 | auto(l5) | f | 18 | 29 | p | compact |
| 1 | audi | a4 | 1.8 | 1999 | 4 | manual(m5) | f | 21 | 29 | p | compact |
| 2 | audi | a4 | 2.0 | 2008 | 4 | manual(m6) | f | 20 | 31 | p | compact |
| 3 | audi | a4 | 2.0 | 2008 | 4 | auto(av) | f | 21 | 30 | p | compact |
| 4 | audi | a4 | 2.8 | 1999 | 6 | auto(l5) | f | 16 | 26 | p | compact |
컬럼 설명
#변수 속성 및 데이터 타입 출력
mpg.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 234 entries, 0 to 233
Data columns (total 11 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 manufacturer 234 non-null object
1 model 234 non-null object
2 displ 234 non-null float64
3 year 234 non-null int64
4 cyl 234 non-null int64
5 trans 234 non-null object
6 drv 234 non-null object
7 cty 234 non-null int64
8 hwy 234 non-null int64
9 fl 234 non-null object
10 category 234 non-null object
dtypes: float64(1), int64(4), object(6)
memory usage: 20.2+ KB
#요약통계
mpg.describe()
| displ | year | cyl | cty | hwy | |
|---|---|---|---|---|---|
| count | 234.000000 | 234.000000 | 234.000000 | 234.000000 | 234.000000 |
| mean | 3.471795 | 2003.500000 | 5.888889 | 16.858974 | 23.440171 |
| std | 1.291959 | 4.509646 | 1.611534 | 4.255946 | 5.954643 |
| min | 1.600000 | 1999.000000 | 4.000000 | 9.000000 | 12.000000 |
| 25% | 2.400000 | 1999.000000 | 4.000000 | 14.000000 | 18.000000 |
| 50% | 3.300000 | 2003.500000 | 6.000000 | 17.000000 | 24.000000 |
| 75% | 4.600000 | 2008.000000 | 8.000000 | 19.000000 | 27.000000 |
| max | 7.000000 | 2008.000000 | 8.000000 | 35.000000 | 44.000000 |
#변수의 이름 바꾸기
mpg.rename(columns={'manufacturer' : '제조_회사','displ' : '배기량','cyl' : '실린더_개수','drv' : '구동_방식','hwy' : '고속도로_연비','class' : '자동차_종류','model' : '자동차_모델명','year' : '생산연도','trans' : '변속기_종류','cty' : '도시_연비','fl' : '연료_종류','category':'카테고리'}, inplace=True)
mpg
| 제조_회사 | 자동차_모델명 | 배기량 | 생산연도 | 실린더_개수 | 변속기_종류 | 구동_방식 | 도시_연비 | 고속도로_연비 | 연료_종류 | 카테고리 | |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | audi | a4 | 1.8 | 1999 | 4 | auto(l5) | f | 18 | 29 | p | compact |
| 1 | audi | a4 | 1.8 | 1999 | 4 | manual(m5) | f | 21 | 29 | p | compact |
| 2 | audi | a4 | 2.0 | 2008 | 4 | manual(m6) | f | 20 | 31 | p | compact |
| 3 | audi | a4 | 2.0 | 2008 | 4 | auto(av) | f | 21 | 30 | p | compact |
| 4 | audi | a4 | 2.8 | 1999 | 6 | auto(l5) | f | 16 | 26 | p | compact |
| ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
| 229 | volkswagen | passat | 2.0 | 2008 | 4 | auto(s6) | f | 19 | 28 | p | midsize |
| 230 | volkswagen | passat | 2.0 | 2008 | 4 | manual(m6) | f | 21 | 29 | p | midsize |
| 231 | volkswagen | passat | 2.8 | 1999 | 6 | auto(l5) | f | 16 | 26 | p | midsize |
| 232 | volkswagen | passat | 2.8 | 1999 | 6 | manual(m5) | f | 18 | 26 | p | midsize |
| 233 | volkswagen | passat | 3.6 | 2008 | 6 | auto(s6) | f | 17 | 26 | p | midsize |
234 rows × 11 columns
data1=mpg.sort_values('배기량',ascending=False)[['배기량','실린더_개수']].reset_index()
data1
| index | 배기량 | 실린더_개수 | |
|---|---|---|---|
| 0 | 27 | 7.0 | 8 |
| 1 | 31 | 6.5 | 8 |
| 2 | 26 | 6.2 | 8 |
| 3 | 25 | 6.2 | 8 |
| 4 | 129 | 6.1 | 8 |
| ... | ... | ... | ... |
| 229 | 101 | 1.6 | 4 |
| 230 | 100 | 1.6 | 4 |
| 231 | 99 | 1.6 | 4 |
| 232 | 103 | 1.6 | 4 |
| 233 | 102 | 1.6 | 4 |
234 rows × 3 columns
t={}
for i in range(len(data1)):
x=data1['배기량'][i]
y=data1['실린더_개수'][i]
if x not in t:
t[x]=y
else:
continue
print(t)
{7.0: 8, 6.5: 8, 6.2: 8, 6.1: 8, 6.0: 8, 5.9: 8, 5.7: 8, 5.6: 8, 5.4: 8, 5.3: 8, 5.2: 8, 5.0: 8, 4.7: 8, 4.6: 8, 4.4: 8, 4.2: 6, 4.0: 6, 3.9: 6, 3.8: 6, 3.7: 6, 3.6: 6, 3.5: 6, 3.4: 6, 3.3: 6, 3.1: 6, 3.0: 6, 2.8: 6, 2.7: 6, 2.5: 4, 2.4: 4, 2.2: 4, 2.0: 4, 1.9: 4, 1.8: 4, 1.6: 4}
data2=pd.DataFrame({'배기량':t.keys(), '실린더_개수':t.values()})
data2.sort_values('배기량',ascending=False)
| 배기량 | 실린더_개수 | |
|---|---|---|
| 0 | 7.0 | 8 |
| 1 | 6.5 | 8 |
| 2 | 6.2 | 8 |
| 3 | 6.1 | 8 |
| 4 | 6.0 | 8 |
| 5 | 5.9 | 8 |
| 6 | 5.7 | 8 |
| 7 | 5.6 | 8 |
| 8 | 5.4 | 8 |
| 9 | 5.3 | 8 |
| 10 | 5.2 | 8 |
| 11 | 5.0 | 8 |
| 12 | 4.7 | 8 |
| 13 | 4.6 | 8 |
| 14 | 4.4 | 8 |
| 15 | 4.2 | 6 |
| 16 | 4.0 | 6 |
| 17 | 3.9 | 6 |
| 18 | 3.8 | 6 |
| 19 | 3.7 | 6 |
| 20 | 3.6 | 6 |
| 21 | 3.5 | 6 |
| 22 | 3.4 | 6 |
| 23 | 3.3 | 6 |
| 24 | 3.1 | 6 |
| 25 | 3.0 | 6 |
| 26 | 2.8 | 6 |
| 27 | 2.7 | 6 |
| 28 | 2.5 | 4 |
| 29 | 2.4 | 4 |
| 30 | 2.2 | 4 |
| 31 | 2.0 | 4 |
| 32 | 1.9 | 4 |
| 33 | 1.8 | 4 |
| 34 | 1.6 | 4 |
mpg['average_y']=mpg['도시_연비']*0.55+mpg['고속도로_연비']*0.45
mpg.head()
| 제조_회사 | 자동차_모델명 | 배기량 | 생산연도 | 실린더_개수 | 변속기_종류 | 구동_방식 | 도시_연비 | 고속도로_연비 | 연료_종류 | 카테고리 | average_y | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | audi | a4 | 1.8 | 1999 | 4 | auto(l5) | f | 18 | 29 | p | compact | 22.95 |
| 1 | audi | a4 | 1.8 | 1999 | 4 | manual(m5) | f | 21 | 29 | p | compact | 24.60 |
| 2 | audi | a4 | 2.0 | 2008 | 4 | manual(m6) | f | 20 | 31 | p | compact | 24.95 |
| 3 | audi | a4 | 2.0 | 2008 | 4 | auto(av) | f | 21 | 30 | p | compact | 25.05 |
| 4 | audi | a4 | 2.8 | 1999 | 6 | auto(l5) | f | 16 | 26 | p | compact | 20.50 |
1) 모델별 가장 복합연비가 좋은 차
mpg.groupby('자동차_모델명').agg(best=('average_y','max'))
| best | |
|---|---|
| 자동차_모델명 | |
| 4runner 4wd | 17.80 |
| a4 | 25.05 |
| a4 quattro | 23.60 |
| a6 quattro | 20.60 |
| altima | 27.05 |
| c1500 suburban 2wd | 16.70 |
| camry | 25.50 |
| camry solara | 26.05 |
| caravan 2wd | 20.70 |
| civic | 30.25 |
| corolla | 32.05 |
| corvette | 20.50 |
| dakota pickup 4wd | 16.80 |
| durango 4wd | 15.25 |
| expedition 2wd | 14.70 |
| explorer 4wd | 16.80 |
| f150 pickup 4wd | 15.35 |
| forester awd | 23.15 |
| grand cherokee 4wd | 19.25 |
| grand prix | 22.50 |
| gti | 25.15 |
| impreza awd | 23.25 |
| jetta | 37.95 |
| k1500 tahoe 4wd | 16.25 |
| land cruiser wagon 4wd | 15.25 |
| malibu | 25.60 |
| maxima | 21.70 |
| mountaineer 4wd | 15.70 |
| mustang | 21.60 |
| navigator 2wd | 14.70 |
| new beetle | 39.05 |
| passat | 24.60 |
| pathfinder 4wd | 16.70 |
| ram 1500 pickup 4wd | 14.80 |
| range rover | 14.70 |
| sonata | 25.50 |
| tiburon | 23.60 |
| toyota tacoma 4wd | 19.25 |
2) 모델 중 가장 높은 복합연비
mpg.groupby('자동차_모델명').agg(best=('average_y','max')).max()
best 39.05
dtype: float64
mpg['aver_y']=(mpg['도시_연비']+mpg['고속도로_연비'])/2
mpg.head()
| 제조_회사 | 자동차_모델명 | 배기량 | 생산연도 | 실린더_개수 | 변속기_종류 | 구동_방식 | 도시_연비 | 고속도로_연비 | 연료_종류 | 카테고리 | average_y | aver_y | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | audi | a4 | 1.8 | 1999 | 4 | auto(l5) | f | 18 | 29 | p | compact | 22.95 | 23.5 |
| 1 | audi | a4 | 1.8 | 1999 | 4 | manual(m5) | f | 21 | 29 | p | compact | 24.60 | 25.0 |
| 2 | audi | a4 | 2.0 | 2008 | 4 | manual(m6) | f | 20 | 31 | p | compact | 24.95 | 25.5 |
| 3 | audi | a4 | 2.0 | 2008 | 4 | auto(av) | f | 21 | 30 | p | compact | 25.05 | 25.5 |
| 4 | audi | a4 | 2.8 | 1999 | 6 | auto(l5) | f | 16 | 26 | p | compact | 20.50 | 21.0 |
1) 모델별 가장 평균연비가 좋은 차
mpg.groupby('자동차_모델명').agg(best=('aver_y','max'))
| best | |
|---|---|
| 자동차_모델명 | |
| 4runner 4wd | 18.0 |
| a4 | 25.5 |
| a4 quattro | 24.0 |
| a6 quattro | 21.0 |
| altima | 27.5 |
| c1500 suburban 2wd | 17.0 |
| camry | 26.0 |
| camry solara | 26.5 |
| caravan 2wd | 21.0 |
| civic | 30.5 |
| corolla | 32.5 |
| corvette | 21.0 |
| dakota pickup 4wd | 17.0 |
| durango 4wd | 15.5 |
| expedition 2wd | 15.0 |
| explorer 4wd | 17.0 |
| f150 pickup 4wd | 15.5 |
| forester awd | 23.5 |
| grand cherokee 4wd | 19.5 |
| grand prix | 23.0 |
| gti | 25.5 |
| impreza awd | 23.5 |
| jetta | 38.5 |
| k1500 tahoe 4wd | 16.5 |
| land cruiser wagon 4wd | 15.5 |
| malibu | 26.0 |
| maxima | 22.0 |
| mountaineer 4wd | 16.0 |
| mustang | 22.0 |
| navigator 2wd | 15.0 |
| new beetle | 39.5 |
| passat | 25.0 |
| pathfinder 4wd | 17.0 |
| ram 1500 pickup 4wd | 15.0 |
| range rover | 15.0 |
| sonata | 26.0 |
| tiburon | 24.0 |
| toyota tacoma 4wd | 19.5 |
2) 모델 중 가장 높은 평균연비
mpg.groupby('자동차_모델명').agg(best=('aver_y','max')).max()
best 39.5
dtype: float64
mpg.query('제조_회사=="audi" & 자동차_모델명=="a4"')['aver_y'].mean()
23.571428571428573
mpg.query('제조_회사=="audi" & 자동차_모델명=="a4"')['average_y'].mean()
23.1
mpg.groupby('카테고리').agg(mean_t=("도시_연비","max")).query('카테고리=="midsize"')
| mean_t | |
|---|---|
| 카테고리 | |
| midsize | 23 |
mpg.query('도시_연비==23 & 카테고리=="midsize"')
| 제조_회사 | 자동차_모델명 | 배기량 | 생산연도 | 실린더_개수 | 변속기_종류 | 구동_방식 | 도시_연비 | 고속도로_연비 | 연료_종류 | 카테고리 | average_y | aver_y | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 143 | nissan | altima | 2.5 | 2008 | 4 | auto(av) | f | 23 | 31 | r | midsize | 26.60 | 27.0 |
| 144 | nissan | altima | 2.5 | 2008 | 4 | manual(m6) | f | 23 | 32 | r | midsize | 27.05 | 27.5 |
mpg.groupby('카테고리').agg(mean_t=("고속도로_연비","max")).query('카테고리=="midsize"')
| mean_t | |
|---|---|
| 카테고리 | |
| midsize | 32 |
mpg.query('고속도로_연비==32 & 카테고리=="midsize"')
| 제조_회사 | 자동차_모델명 | 배기량 | 생산연도 | 실린더_개수 | 변속기_종류 | 구동_방식 | 도시_연비 | 고속도로_연비 | 연료_종류 | 카테고리 | average_y | aver_y | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 144 | nissan | altima | 2.5 | 2008 | 4 | manual(m6) | f | 23 | 32 | r | midsize | 27.05 | 27.5 |
mpg.groupby('카테고리').agg(mean_t=("average_y","max")).query('카테고리=="midsize"')
| mean_t | |
|---|---|
| 카테고리 | |
| midsize | 27.05 |
mpg.query('average_y==27.05 & 카테고리=="midsize"')
| 제조_회사 | 자동차_모델명 | 배기량 | 생산연도 | 실린더_개수 | 변속기_종류 | 구동_방식 | 도시_연비 | 고속도로_연비 | 연료_종류 | 카테고리 | average_y | aver_y | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 144 | nissan | altima | 2.5 | 2008 | 4 | manual(m6) | f | 23 | 32 | r | midsize | 27.05 | 27.5 |
mpg.groupby('카테고리').agg(mean_t=("aver_y","max")).query('카테고리=="midsize"')
| mean_t | |
|---|---|
| 카테고리 | |
| midsize | 27.5 |
mpg.query('aver_y==27.5 & 카테고리=="midsize"')
| 제조_회사 | 자동차_모델명 | 배기량 | 생산연도 | 실린더_개수 | 변속기_종류 | 구동_방식 | 도시_연비 | 고속도로_연비 | 연료_종류 | 카테고리 | average_y | aver_y | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 144 | nissan | altima | 2.5 | 2008 | 4 | manual(m6) | f | 23 | 32 | r | midsize | 27.05 | 27.5 |
mpg.groupby('카테고리').agg(min=('배기량','min'),
max=('배기량','max'),
mean=('배기량','mean'))
| min | max | mean | |
|---|---|---|---|
| 카테고리 | |||
| 2seater | 5.7 | 7.0 | 6.160000 |
| compact | 1.8 | 3.3 | 2.325532 |
| midsize | 1.8 | 5.3 | 2.921951 |
| minivan | 2.4 | 4.0 | 3.390909 |
| pickup | 2.7 | 5.9 | 4.418182 |
| subcompact | 1.6 | 5.4 | 2.660000 |
| suv | 2.5 | 6.5 | 4.456452 |
t1=mpg.query('제조_회사=="audi" | 제조_회사=="volkswagen"').agg(germany=("average_y","max"))
t1
| average_y | |
|---|---|
| germany | 39.05 |
t2=mpg.query('제조_회사=="chevrolet" | 제조_회사=="dodge" | 제조_회사=="ford" | 제조_회사=="jeep" | 제조_회사=="lincoln"| 제조_회사=="mercury" | 제조_회사=="pontiac"').agg(usa=("average_y","max"))
t2
| average_y | |
|---|---|
| usa | 25.6 |
t3=mpg.query('제조_회사=="honda" | 제조_회사=="nissan"| 제조_회사=="subaru"| 제조_회사=="toyota"').agg(japan=("average_y","max"))
t3
| average_y | |
|---|---|
| japan | 32.05 |
t4=mpg.query('제조_회사=="hyundai"').agg(korea=("average_y","max"))
t4
| average_y | |
|---|---|
| korea | 25.5 |
t5=mpg.query('제조_회사=="land rover"').agg(uk=("average_y","max"))
t5
| average_y | |
|---|---|
| uk | 14.7 |
pd.concat([t1,t2,t3,t4,t5]).sort_values('average_y',ascending=False)
| average_y | |
|---|---|
| germany | 39.05 |
| japan | 32.05 |
| usa | 25.60 |
| korea | 25.50 |
| uk | 14.70 |
mpg.query('제조_회사=="audi" | 제조_회사=="volkswagen"').sort_values('average_y',ascending=False).head()
| 제조_회사 | 자동차_모델명 | 배기량 | 생산연도 | 실린더_개수 | 변속기_종류 | 구동_방식 | 도시_연비 | 고속도로_연비 | 연료_종류 | 카테고리 | average_y | aver_y | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 221 | volkswagen | new beetle | 1.9 | 1999 | 4 | manual(m5) | f | 35 | 44 | d | subcompact | 39.05 | 39.5 |
| 212 | volkswagen | jetta | 1.9 | 1999 | 4 | manual(m5) | f | 33 | 44 | d | compact | 37.95 | 38.5 |
| 222 | volkswagen | new beetle | 1.9 | 1999 | 4 | auto(l4) | f | 29 | 41 | d | subcompact | 34.40 | 35.0 |
| 215 | volkswagen | jetta | 2.0 | 2008 | 4 | auto(s6) | f | 22 | 29 | p | compact | 25.15 | 25.5 |
| 210 | volkswagen | gti | 2.0 | 2008 | 4 | auto(s6) | f | 22 | 29 | p | compact | 25.15 | 25.5 |
mpg.query('생산연도 == 1999').sort_values(['배기량','average_y'],ascending=[False,False]).head(10)
| 제조_회사 | 자동차_모델명 | 배기량 | 생산연도 | 실린더_개수 | 변속기_종류 | 구동_방식 | 도시_연비 | 고속도로_연비 | 연료_종류 | 카테고리 | average_y | aver_y | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 31 | chevrolet | k1500 tahoe 4wd | 6.5 | 1999 | 8 | auto(l4) | 4 | 14 | 17 | d | suv | 15.35 | 15.5 |
| 63 | dodge | durango 4wd | 5.9 | 1999 | 8 | auto(l4) | 4 | 11 | 15 | r | suv | 12.80 | 13.0 |
| 73 | dodge | ram 1500 pickup 4wd | 5.9 | 1999 | 8 | auto(l4) | 4 | 11 | 15 | r | pickup | 12.80 | 13.0 |
| 23 | chevrolet | corvette | 5.7 | 1999 | 8 | manual(m6) | r | 16 | 26 | p | 2seater | 20.50 | 21.0 |
| 24 | chevrolet | corvette | 5.7 | 1999 | 8 | auto(l4) | r | 15 | 23 | p | 2seater | 18.60 | 19.0 |
| 21 | chevrolet | c1500 suburban 2wd | 5.7 | 1999 | 8 | auto(l4) | r | 13 | 17 | r | suv | 14.80 | 15.0 |
| 30 | chevrolet | k1500 tahoe 4wd | 5.7 | 1999 | 8 | auto(l4) | 4 | 11 | 15 | r | suv | 12.80 | 13.0 |
| 75 | ford | expedition 2wd | 5.4 | 1999 | 8 | auto(l4) | r | 11 | 17 | r | suv | 13.70 | 14.0 |
| 134 | lincoln | navigator 2wd | 5.4 | 1999 | 8 | auto(l4) | r | 11 | 17 | r | suv | 13.70 | 14.0 |
| 135 | lincoln | navigator 2wd | 5.4 | 1999 | 8 | auto(l4) | r | 11 | 16 | p | suv | 13.25 | 13.5 |
mpg.query('생산연도 == 2008').sort_values(['배기량','average_y'],ascending=[False,False]).head(10)
| 제조_회사 | 자동차_모델명 | 배기량 | 생산연도 | 실린더_개수 | 변속기_종류 | 구동_방식 | 도시_연비 | 고속도로_연비 | 연료_종류 | 카테고리 | average_y | aver_y | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 27 | chevrolet | corvette | 7.0 | 2008 | 8 | manual(m6) | r | 15 | 24 | p | 2seater | 19.05 | 19.5 |
| 25 | chevrolet | corvette | 6.2 | 2008 | 8 | manual(m6) | r | 16 | 26 | p | 2seater | 20.50 | 21.0 |
| 26 | chevrolet | corvette | 6.2 | 2008 | 8 | auto(s6) | r | 15 | 25 | p | 2seater | 19.50 | 20.0 |
| 129 | jeep | grand cherokee 4wd | 6.1 | 2008 | 8 | auto(l5) | 4 | 11 | 14 | p | suv | 12.35 | 12.5 |
| 22 | chevrolet | c1500 suburban 2wd | 6.0 | 2008 | 8 | auto(l4) | r | 12 | 17 | r | suv | 14.25 | 14.5 |
| 62 | dodge | durango 4wd | 5.7 | 2008 | 8 | auto(l5) | 4 | 13 | 18 | r | suv | 15.25 | 15.5 |
| 128 | jeep | grand cherokee 4wd | 5.7 | 2008 | 8 | auto(l5) | 4 | 13 | 18 | r | suv | 15.25 | 15.5 |
| 199 | toyota | land cruiser wagon 4wd | 5.7 | 2008 | 8 | auto(s6) | 4 | 13 | 18 | r | suv | 15.25 | 15.5 |
| 72 | dodge | ram 1500 pickup 4wd | 5.7 | 2008 | 8 | auto(l5) | 4 | 13 | 17 | r | pickup | 14.80 | 15.0 |
| 153 | nissan | pathfinder 4wd | 5.6 | 2008 | 8 | auto(s5) | 4 | 12 | 18 | p | suv | 14.70 | 15.0 |
mpg['구동_방식'].unique()
array(['f', '4', 'r'], dtype=object)
mpg.query('구동_방식=="4"')['average_y'].unique()
array([21.6 , 20.05, 23.6 , 22.6 , 19.5 , 20.6 , 19.05, 19.15, 16.25,
12.35, 12.8 , 15.35, 16.8 , 15.8 , 14.8 , 10.35, 13.7 , 13.25,
15.25, 13.8 , 15.7 , 14.35, 19.25, 17.25, 14.7 , 15.9 , 16.7 ,
21.15, 20.7 , 23.15, 21.7 , 22.7 , 20.25, 23.25, 22.15, 22.25,
17.8 , 16.35])
mpg.query('구동_방식=="4"').agg(mean=("average_y","mean"))
| average_y | |
|---|---|
| mean | 16.510194 |
mpg['제조_회사'].unique()
array(['audi', 'chevrolet', 'dodge', 'ford', 'honda', 'hyundai', 'jeep',
'land rover', 'lincoln', 'mercury', 'nissan', 'pontiac', 'subaru',
'toyota', 'volkswagen'], dtype=object)
mpg.query('제조_회사=="hyundai"').agg(small=('배기량','min'))
| 배기량 | |
|---|---|
| small | 2.0 |
mpg.query('제조_회사=="hyundai" & 배기량 ==2')
| 제조_회사 | 자동차_모델명 | 배기량 | 생산연도 | 실린더_개수 | 변속기_종류 | 구동_방식 | 도시_연비 | 고속도로_연비 | 연료_종류 | 카테고리 | average_y | aver_y | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 115 | hyundai | tiburon | 2.0 | 1999 | 4 | auto(l4) | f | 19 | 26 | r | subcompact | 22.15 | 22.5 |
| 116 | hyundai | tiburon | 2.0 | 1999 | 4 | manual(m5) | f | 19 | 29 | r | subcompact | 23.50 | 24.0 |
| 117 | hyundai | tiburon | 2.0 | 2008 | 4 | manual(m5) | f | 20 | 28 | r | subcompact | 23.60 | 24.0 |
| 118 | hyundai | tiburon | 2.0 | 2008 | 4 | auto(l4) | f | 20 | 27 | r | subcompact | 23.15 | 23.5 |
mpg['연료_종류'].unique()
array(['p', 'r', 'e', 'd', 'c'], dtype=object)
mpg.query('연료_종류=="e"').agg(best=("average_y","max"))
| average_y | |
|---|---|
| best | 13.7 |
mpg.query('연료_종류=="e" & average_y>=13.7')
| 제조_회사 | 자동차_모델명 | 배기량 | 생산연도 | 실린더_개수 | 변속기_종류 | 구동_방식 | 도시_연비 | 고속도로_연비 | 연료_종류 | 카테고리 | average_y | aver_y | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 43 | dodge | caravan 2wd | 3.3 | 2008 | 6 | auto(l4) | f | 11 | 17 | e | minivan | 13.7 | 14.0 |
mpg[mpg['도시_연비']<mpg['고속도로_연비']]
| 제조_회사 | 자동차_모델명 | 배기량 | 생산연도 | 실린더_개수 | 변속기_종류 | 구동_방식 | 도시_연비 | 고속도로_연비 | 연료_종류 | 카테고리 | average_y | aver_y | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | audi | a4 | 1.8 | 1999 | 4 | auto(l5) | f | 18 | 29 | p | compact | 22.95 | 23.5 |
| 1 | audi | a4 | 1.8 | 1999 | 4 | manual(m5) | f | 21 | 29 | p | compact | 24.60 | 25.0 |
| 2 | audi | a4 | 2.0 | 2008 | 4 | manual(m6) | f | 20 | 31 | p | compact | 24.95 | 25.5 |
| 3 | audi | a4 | 2.0 | 2008 | 4 | auto(av) | f | 21 | 30 | p | compact | 25.05 | 25.5 |
| 4 | audi | a4 | 2.8 | 1999 | 6 | auto(l5) | f | 16 | 26 | p | compact | 20.50 | 21.0 |
| ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
| 229 | volkswagen | passat | 2.0 | 2008 | 4 | auto(s6) | f | 19 | 28 | p | midsize | 23.05 | 23.5 |
| 230 | volkswagen | passat | 2.0 | 2008 | 4 | manual(m6) | f | 21 | 29 | p | midsize | 24.60 | 25.0 |
| 231 | volkswagen | passat | 2.8 | 1999 | 6 | auto(l5) | f | 16 | 26 | p | midsize | 20.50 | 21.0 |
| 232 | volkswagen | passat | 2.8 | 1999 | 6 | manual(m5) | f | 18 | 26 | p | midsize | 21.60 | 22.0 |
| 233 | volkswagen | passat | 3.6 | 2008 | 6 | auto(s6) | f | 17 | 26 | p | midsize | 21.05 | 21.5 |
234 rows × 13 columns
댓글