For_Oanh

Last updated: April 26th, 20202020-04-26Project preview
In [19]:
import pandas as pd
from pandas import ExcelWriter
from pandas import ExcelFile
import numpy as np
import matplotlib.pyplot as plt

# Đọc dữ liệu từ file exel
df = pd.read_excel('Sample_Responses_clean.xlsx')

# In ra tên của các cột, nếu cần
# print("Tên cột:")
# print(df.columns)

# Xóa bỏ các hàng không có dữ liệu
df = df.dropna()

# Lấy dữ liệu theo tên cột
Tuoi = df['Tuổi']
So_luong_mon_hoc_truc_tuyen = df['Số lượng môn học mà bạn đang học trực tuyến?']

# Vẽ biểu đồ hiển thị số liệu dạng scatter plot
plt.scatter(Tuoi, So_luong_mon_hoc_truc_tuyen)
plt.xlabel('Tuổi', fontsize = 14)
plt.ylabel ('Số lượng môn học trực tuyến', fontsize = 14)
plt.title ('Biểu đồ scatter giữa số lượng môn học và số tuổi', fontsize = 16)
plt.show()

# Vẽ biểu đồ hiển thị số liệu dạng historam
so_gio_hoc_tap_moi_ngay = df['SỐ GIỜ MỖI NGÀY Bạn dành khoảng thời gian bao lâu để sử dụng internet cho mục đích học tập?']
so_gio_khac_moi_ngay = df['SỐ GIỜ MỖI NGÀY, bạn dành khoảng thời gian bao lâu để sử dụng internet cho mục đích khác (ví dụ lướt web)?']

colors = ['red', 'tan']
_label = ['học tập', 'giải trí']

plt.hist([so_gio_hoc_tap_moi_ngay, so_gio_khac_moi_ngay], histtype='bar', color=colors, label=_label)
plt.xlabel('Số giờ học tập/giải trí mỗi ngày qua internet', fontsize = 14)
plt.ylabel ('Số lượng người tham gia ks', fontsize = 14)

plt.legend(prop={'size': 10})
plt.title ('Biểu đồ histogram số giờ học mỗi ngày sử dụng internet', fontsize = 16)
plt.show()
In [1]:
import pandas as pd
from pandas import ExcelWriter
from pandas import ExcelFile
import numpy as np
import matplotlib.pyplot as plt

# Đọc dữ liệu từ file exel
df = pd.read_excel('AAA.xlsx')

new_df = df.iloc[:,[1,4,5,6,7,8,9]]
new_df.rename(columns={"Tuổi": "tuoi", "Giới tính": "gioitinh"})

# w.female[w.female == 'female'] = 1 
# w.female[w.female == 'male']   = 0

new_1_df = new_df.rename(columns={"Tuổi": "tuoi", "Giới tính ": "gioitinh", \
                              "Bạn đang sử dụng thiết bị nào để học trực tuyến? (có thể chọn tất cả các phương án phù hợp)": "thietbi",\
                              "Bạn dùng ứng dụng nào để tham gia học trực tuyến (chọn tất cả các phương án phù hợp)": "ungdung"})



# print (len(set(new_1_df.thietbi)), set(new_1_df.thietbi))
print ("Thiet bi su dung")
for i, name in enumerate(set(new_1_df.thietbi)):
    print ("%s: %s"%(i, name))
    new_1_df.thietbi[new_1_df.thietbi == name] = i

print ("Ung dung su dung")
for i, name in enumerate(set(new_1_df.ungdung)):
    print ("%s: %s"%(i, name))
    new_1_df.thietbi[new_1_df.ungdung == name] = i

# In ra de xem
print (new_1_df)
Thiet bi su dung
0: Máy tính để bàn (cố định)
1: nan
2: Máy tính để bàn (cố định), Điện thoại, Máy tính xách tay (Laptop), Thiết bị khác
3: Máy tính để bàn (cố định), Điện thoại
4: Máy tính để bàn (cố định), Máy tính xách tay (Laptop)
5: Điện thoại
6: Máy tính để bàn (cố định), Điện thoại, Máy tính xách tay (Laptop)
7: Điện thoại, Máy tính xách tay (Laptop), Thiết bị khác
8: Máy tính xách tay (Laptop)
9: Điện thoại, Máy tính xách tay (Laptop)
Ung dung su dung
0: nan
1: Zoom meeting, Google classroom, Microsoft Teams, Ứng dụng khác
2: Zoom meeting, Google classroom
3: Zoom meeting, Google classroom, Microsoft Teams
4: Zoom meeting
5: Zoom meeting, Google classroom, Ứng dụng khác
6: Zoom meeting, Ứng dụng khác
    tuoi gioitinh  Soluongmonhoc  gio_hoctap  gio_luotweb thietbi  \
0     19       Nữ            7.0         7.0          3.0       2   
1     18       Nữ            6.0         5.0          2.0       2   
2     18      Nam            7.0         8.0          3.0       2   
3     20      Nam            5.0         3.0          5.0       4   
4     19       Nữ            6.0         5.0          5.0       2   
..   ...      ...            ...         ...          ...     ...   
362   21       Nữ            7.0        14.0          0.5       5   
363   19       Nữ            4.0         5.0          3.0       2   
364   21       Nữ            7.0        11.0          2.0       2   
365   20       Nữ            6.0        12.0          2.0       5   
366   19       Nữ            6.0         9.0          2.0       2   

                                           ungdung  
0                   Zoom meeting, Google classroom  
1                   Zoom meeting, Google classroom  
2                   Zoom meeting, Google classroom  
3                                     Zoom meeting  
4                   Zoom meeting, Google classroom  
..                                             ...  
362  Zoom meeting, Google classroom, Ứng dụng khác  
363                 Zoom meeting, Google classroom  
364                 Zoom meeting, Google classroom  
365  Zoom meeting, Google classroom, Ứng dụng khác  
366                 Zoom meeting, Google classroom  

[367 rows x 7 columns]
<ipython-input-1-665e68e45cca>:26: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  new_1_df.thietbi[new_1_df.thietbi == name] = i
<ipython-input-1-665e68e45cca>:31: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  new_1_df.thietbi[new_1_df.ungdung == name] = i
In [ ]:
 
Notebooks AI
Notebooks AI Profile20060