位置:科技大田大数据产业专题>>资讯>>市场>>内容阅读
官方调研重磅发布,Pandas或将重构?
为指引 Pandas 未来开发方向,Pandas 官方团队于 2019 年夏搞了一次调研,这次调研历时 15 天,共有 1250 条反馈数据。问卷数据保存在 data 文件夹的 2019 csv zip 文件里。

作者:呆鸟来源:segmentfault

原文地址:2019 Pandas User Survey

绝大多数答卷人都具有丰富的 pandas 使用经验,使用频率也很高。

order = [ '少于 3 个月', '3 个月 至 1 年', '1 至 2 年', '3 至 5 年', '5 年以上', ] sns.countplot(y='您用 pandas 多久了?', data=df, order=order, color='k').set(title="您用 pandas 多久了?", ylabel="") sns.despine()

Python 开发者调研问卷问过的问题。

90% 的答卷人把 Python 作为主开发语言,Python 软件基金会调研报告里的数据为 84%。

pct_format = "{:0.2%}".format df['Python 是您的主打语言吗?'].str.replace( "否.*", "否").value_counts(normalize=True).apply(pct_format) 是 90.67% 否 9.33% Name: Python 是您的主打语言吗?, dtype: object

数据显示 Windows 用户居多。

oses = [ "Linux", "Windows", "MacOS" ] df['您用哪种操作系统?'].str.split(';').explode().value_counts().div( len(df)).loc[oses].apply(pct_format) Linux 61.57% Windows 60.21% MacOS 42.75% Name: 您用哪种操作系统?, dtype: object 这里用 0.25 版推出的 explode 方法定义了个函数。 def split_and_explode(s): return s.str.split(";").explode().to_frame()

conda 是最流行的虚拟环境工具。

replace = { "否,我不用虚拟环境": "否" } col = '您是否用过下列 Python 虚拟环境工具?(多选)' sns.countplot(y=col, data=split_and_explode(df[col]).replace(replace), color='k').set(title='您是否用过下列 Python 虚拟环境工具?', ylabel="") sns.despine()

开源软件团队很难了解用户实际爱用哪些功能,这次调研,我们特地提了一些问题,了解了大家的喜好。

CSV 与 Excel 是最流行的文件类型,真是让人喜忧参半。

sns.countplot(y='您常用哪个读写器读取数据?', data=df['您常用哪个读写器读取数据?'].str.split(';').explode().to_frame(), color='k').set(title="您常用哪个读写器读取数据?", ylabel="") sns.despine();

Dask, vaexmodin

  • 从对原生字符串数据类型与更少的内部复制需求来看,优化内存效率也是要值得一做的事情。
  • 紧接其后的优化需求是整数缺失值,这个功能其实已经在 免责声明:本网站部 分文章和信息来源于互联网,本网转载出于传递更多信息和学习之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请立即联系管理 员,我们会予以更改或删除相关文章,保证您的权利。对使用本网站信息和服务所引起的后果,本网站不作任何承诺。

    Copyright 版权所有 Copyright 2013-2014 福建省云创集成科技服务有限公司
    All Rights Reserved. 运营维护:三明市明网网络信息技术有限公司 业务咨询:0598-8233595 0598-5831286 技术咨询:0598-8915168