python - 如何使用 Python 的 Panda 数据结构语法解决数据科学问题
问题描述
下午好。
我有这个问题,我正在尝试使用 Python 脚本语言中的“熊猫”统计数据结构和相关语法来解决。我已经从一所美国大学毕业并就业,目前正在学习 Coursera.org 的“Python for Data Science”课程,该课程由密歇根大学在 Coursera 的平台上在线提供,仅用于专业发展。因为我遵守 Coursera 的荣誉准则,所以我也不会向任何人分享答案。
首先,我得到了这个关于世界各国获得的奥运奖牌的熊猫数据框图表:
# Summer Gold Silver Bronze Total # Winter Gold.1 Silver.1 Bronze.1 Total.1 # Games Gold.2 Silver.2 Bronze.2 Combined total ID
Afghanistan 13 0 0 2 2 0 0 0 0 0 13 0 0 2 2 AFG
Algeria 12 5 2 8 15 3 0 0 0 0 15 5 2 8 15 ALG
Argentina 23 18 24 28 70 18 0 0 0 0 41 18 24 28 70 ARG
Armenia 5 1 2 9 12 6 0 0 0 0 11 1 2 9 12 ARM
Australasia 2 3 4 5 12 0 0 0 0 0 2 3 4 5 12 ANZ
第二个问题是,“哪个国家在夏季奥运会上获得的金牌最多?”
第三,关于如何使用 Python 的 panda 语法回答的提示是:“此函数应返回单个字符串值。”
第四,我尝试在 Python 的 panda 语法中输入这个作为答案:
import pandas as pd
df = pd.read_csv('olympics.csv', index_col=0, skiprows=1)
def answer_one():
if df.columns[:2]=='00':
df.rename(columns={col:'Country'+col[4:]}, inplace=True)
df_max = df[df[max('Gold')]]
return df_max['Country']
answer_one()
第五,我在 Coursera 的自动评分器中尝试了其他各种类似的答案,但它一直给出这个错误消息:
评估函数时出现问题
answer_one
,它引发了异常,因此被视为不正确。0.125 分未获奖。
你能帮我解决这个问题吗?欢迎任何提示/建议/评论。
谢谢,凯文
解决方案
import pandas as pd
def answer_one():
df1=pd.Series.max(df['Gold'])
df1=df[df['Gold']==df1]
return df1.index[0]
answer_one()
推荐阅读
- reactjs - 如何添加为属性并获取 React Konva 元素 ID
- android - 如何根据应用程序区域设置(英语或阿拉伯语)设置多个默认字体?
- r - 如何找到不适用卡方检验的 2x2 列联表的效果大小?
- python - Python:TypeError:inet_aton() 参数 1 必须是 str,而不是 None
- javascript - React:更改复选框后如何更新状态
- c# - 使用 Newtonsoft 反序列化 JSON
- php - 用于 Google API 的 PHP 和 Protobuf FieldMask
- sql-server - 无法将值 NULL 插入列不允许空值
- database - PostgreSQL + pgpool 复制与丢失平衡
- c++ - 为什么这个宏在 msvc c++17 vs2017 中没有正确扩展