《DeepSeek高效数据分析》书评
《DeepSeek高效数据分析:从数据清洗到行业案例》,王国平 著,清华大学出版社,2025年11月出版。
我是被书名欺骗,才打开本书,并快速翻完了整本内容,得到结论:这的确是一本会利用风口噱头的拼凑物,比较适合读书打卡凑数,因为的确可以很快翻完。
这本书的主体内容,对于"从业10余年"的"资深数据分析专家"的作者,的确可谓信手拈来,能轻松地、很有条理地从数据读取、清洗、预处理开始讲起,再到数据探索、回归聚类、时序、模型评估、报告生成等,最后再选取金融量化和电商平台的数据分析作为案例分别展示,正好也突出了作者所谓"注重实践"。每个环节,都以图表形式,展示向DeepSeek输入的提示词"你作为一名资深数据分析专家,具备以下技能……“云云,然后再展示DeepSeek的相应回答,其中包含了Python代码,只需继续号召读者直接运行它即可完成分析。对于初学者,应该确实非常容易上手,可谓"速成秘籍”。平心而论,若将这些关于DeepSeek的缝补去掉,似乎全书也基本能通顺,不过可能就显得更像"干货满满"的考点罗列式教辅讲义了(既然是讲义,那就还是做正面评价的推荐吧)。
值得可惜的是,这本书的生存周期应该非常短,大概在刚出版的时候就已经过时。以现在的大模型(不管是DeepSeek还是其他的主流工具),按照我自己的使用经验,其实完全不用大费周折、大篇幅地描述各项技能,只需直接把希望做的数据分析的目标说出来,就已经足够得到理想的结果,配合上VScode或Zed之类的文本编辑工具,甚至都无需(像书中所呈现的用法那样)手工做各种代码复制粘贴,就能直接完成任务。这就是AI时代。
至于AI给出的代码、结果图表、乃至解读结论,正确与否,我想,那应该还是只能看AI使用者自身的专业素养来做出判断了。