back to home

iamseancheney / python_for_data_analysis_2nd_chinese_version

《利用Python进行数据分析·第2版》

8,790 stars
2,757 forks
15 issues

AI Architecture Analysis

This repository is indexed by RepoMind. By analyzing iamseancheney/python_for_data_analysis_2nd_chinese_version in our AI interface, you can instantly generate complete architecture diagrams, visualize control flows, and perform automated security audits across the entire codebase.

Our Agentic Context Augmented Generation (Agentic CAG) engine loads full source files into context, avoiding the fragmentation of traditional RAG systems. Ask questions about the architecture, dependencies, or specific features to see it in action.

Embed this Badge

Showcase RepoMind's analysis directly in your repository's README.

[![Analyzed by RepoMind](https://img.shields.io/badge/Analyzed%20by-RepoMind-4F46E5?style=for-the-badge)](https://repomind-ai.vercel.app/repo/iamseancheney/python_for_data_analysis_2nd_chinese_version)
Preview:Analyzed by RepoMind

Repository Summary (README)

Preview
<a href="https://bestproxy.com/?keyword=m2nto9ln"> <img src="https://github.com/user-attachments/assets/7d02450d-9f3f-42ae-9372-5a2dadd0418f"> </a>

BestProxy全球独享专属资源池,优选海外195+国家/地区高质量住宅IP,本地ISP原生IP,不限量住宅代理、长效ISP代理、静态数据中心代理、网页爬虫API,城市级精准定位,支持HTTP(S)和SOCKS5协议,低检测风险,全方位代理服务解决方案,助力各种场景业务IP代理需求。$0.66/G起按需付费和长期套餐,适合不同预算需求,24/7多语言支持,联系客服免费试用500M。

<p align=center> <a href="https://bestproxy.com/?keyword=m2nto9ln">https://bestproxy.com/</a> </p> <!-- <a href="https://app.nstproxy.com/billing?utm_source=sean"> <img src="https://github.com/user-attachments/assets/f34bb61b-88ab-40bd-a03d-637999c18de9"> </a> [Nstproxy](https://app.nstproxy.com/billing?utm_source=sean) — 全球领先的数据抓取与自动化代理服务商,为企业与开发者提供覆盖 195+ 国家/地区、超1.1亿真实住宅IP 的高匿名代理网络。支持 住宅代理、ISP代理、移动代理、数据中心代理,实现城市级精准定位,完美适配电商监控、SEO数据、大规模爬虫任务等多种业务场景。 全网最低至 $0.1/GB 起按量付费;支持 HTTP(S)/SOCKS5 协议,具备 99.99% 高可用性与超低封禁率,轻松绕过各类反爬与风控机制。 提供 中文工程师技术支持、企业定制方案、免费试用 1GB,帮助您以最低成本启动。 <p align=center> <a href="https://www.nstproxy.com?utm_source=sean">https://www.nstproxy.com/</a> </p> -->
<div> <table style="width:100%"> <tr> <td align=center> <a href="https://u.jd.com/ZaRjN76"> <img src="https://picx.zhimg.com/80/v2-f56a3557f647f548d1f0d61f976441e3_1440w.png" height="300px"> </a> </td> <td align=center> <img src="https://img3.doubanio.com/view/subject/l/public/s33711257.jpg" height="300px"> </td> </tr> <tr align=center> <th> <a href="https://u.jd.com/ZaRjN76"> <p>利用Python进行数据分析》第3版</p> </a> </th> <th> <p>利用Python进行数据分析》第2版</p> </th> </tr> <tr> <th align=left> <p>各章导读视频:<a href="https://www.bilibili.com/video/BV1pC4y117Bh/">https://www.bilibili.com/video/BV1pC4y117Bh/</a></p> <p>微信读书:<a href="https://weread.qq.com/web/reader/adc32180813ab8786g014ba6">https://weread.qq.com/web/reader/adc32180813ab8786g014ba6</a></p> <p>学习笔记:<a href="https://github.com/iamseancheney/python_for_data_analysis_3rd_study_note">python_for_data_analysis_3rd_study_note</a></p> <p>勘误:<a href="https://github.com/iamseancheney/python_for_data_analysis_3rd_study_note/blob/main/%E5%8B%98%E8%AF%AF.md">链接(感谢读者们的反馈🙏)</a></p> <p>在简书上阅读: <a href="https://www.jianshu.com/p/16e04213aa91">https://www.jianshu.com/p/16e04213aa91</a></p> <p>第三版多了41页内容,Pandas升级为1.4.0、Python升级为3.10。第三版最大的变化是紧贴Pandas升级,主要是新增了方法和特性的内容。另外,第三版有作者的<a href="https://wesmckinney.com/book/">在线开源电子版</a>了,GitHub<a href="https://github.com/wesm/pydata-book">地址</a>。</p>

第三版目录略有调整,不如第二版和第一版的变化大:

  • 第4章NumPy基础新增了生成伪随机数;
  • 第7章数据清洗新增了扩展数据类型和分类数据,实际是把第二版中第12章的内容放到新版第7章里了;
  • 第11章时间序列新增了分组时间重采样。

曾经不止一次听别人抱怨,Pandas的知识点分散、零碎、不便于记忆。在细节上,作者这次在新版中摒弃了许多容易造成记忆混乱的用法。比如,用axis = "columns"替代axis = 1,简写方式破坏了代码的可读性,作者修改了许多类似的编程细节。新版对初学者更为友好了! </th> <th align=left> <p>在简书上阅读: <a href="https://www.jianshu.com/p/04d180d90a3f">https://www.jianshu.com/p/04d180d90a3f</a></p>

下载本书代码,GitHub<a href="https://github.com/wesm/pydata-book/tree/2nd-edition">地址</a>(建议把代码下载下来之后,安装好Anaconda,在目录文件夹中用Jupyter notebook打开)。

本书是2017年10月20号正式出版的,和第1版的不同之处有:

  • 包括Python教程内的所有代码升级为Python 3.6(第1版使用的是Python 2.7)
  • 更新了Anaconda和其它包的Python安装方法
  • 更新了Pandas为2017最新版
  • 新增了一章,关于更高级的Pandas工具,外加一些tips
  • 简要介绍了使用StatsModels和scikit-learn

对有些内容进行了重新排版。最大的改变是把第1版附录中的Python教程,单列成了现在的第2章和第3章,并且进行了扩充。 </th> </tr>

</table> </div>

《利用Python进行数据分析》升级版,《Polars权威指南》现已上市,Polars团队撰写,创始人Ritchie Vink作序,pandas创始人Wes Mckinney推荐,让你更高效地进行数据处理。

<div align=center> <table style="width:100%"> <tr> <td align=center> <a href="https://u.jd.com/ZGRsN3H"> <img src="https://github.com/user-attachments/assets/08513ac0-0ef8-4f30-ae0e-ca8a820ea0a2" height="300px"> </a> </td> </tr> <tr align=center> <th> <a href="https://u.jd.com/ZGRsN3H"> <p>《Polars权威指南》</p> </a> </th> </tr> </table> </div>

近年来,随着数据规模的爆炸式增长,数据处理工具的性能和效率愈发成为开发者关注的焦点。在Python生态中,pandas曾长期占据数据分析领域的主导地位,但其在处理大规模数据时的性能瓶颈也逐渐显现。此时,基于Rust构建、以Arrow内存格式为核心的高性能数据处理库<a href="https://pola.rs/">Polars</a>异军突起,凭借其卓越的速度和灵活的设计理念迅速吸引了全球开发者的目光。本书《Python Polars权威指南》正是对这一技术的系统性解读,也是国内首部深入剖析Polars技术细节的中文指南。

作为《利用Python进行数据分析(第3版)》的译者,通读<a href="https://u.jd.com/ZGRsN3H">《Polars权威指南》</a>一书后,再次感受到了一群技术人对数据科学的热爱。本书行文流畅、细节丰富、案例详实,是近些年少有的好书,对于提升Python编程技能、拓展数据科学知识极有帮助。


<div align=center> <!-- <table style="width:100%"> --> <!-- <tr align=center> --> <!-- <th>【Python数据分析群】,拉你入群</th> --> <!-- <th>AI科技论谈·分享AI新知</th> --> <!-- </tr> --> <!-- <tr> --> <!-- <td align=center> --> <!-- <img src="https://picx.zhimg.com/80/v2-3301f242afabf3c8365b9ecadef3de6d_1440w.png" height="300px"> --> <!-- </td> --> <!-- <td align=center> --> <!-- <img src="https://picx.zhimg.com/80/v2-72d0e4f4b373738b400c30a5757edb90_1440w.jpeg" width="160px"> --> <!-- </td> --> <!-- </tr> --> <!-- </table> --> </div> <div align=center> <table style="width:100%"> <tr align=center> <th>【Python数据分析群】,拉你入群</th> <th>用三个月完成了翻译,工作砌码回家码字,手竟然脱皮了 :joy:</th> <!-- <th>感谢赞赏 :sparkling_heart:</th> --> </tr> <tr> <td align=center> <img src="https://picx.zhimg.com/80/v2-3301f242afabf3c8365b9ecadef3de6d_1440w.png" height="300px"> </td> <td align=center> <img src="https://upload-images.jianshu.io/upload_images/7178691-260d699e695f8e81.jpg" height="300px"> </td> <!-- <td align=center> <img src="https://pic1.zhimg.com/80/v2-c499eb01a64368f08d77776d6f43e26e_1440w.png" width="160px"> </td> --> </tr> </table> </div>