Python怎么实现光速定位并提取两个文件的不同之处


这篇文章主要讲解了“Python怎么实现光速定位并提取两个文件的不同之处”,文中的讲解内容简单清晰,易于学习与理解,下面免费云主机域名请大家跟着小编的思路慢慢深入,一起来研究和学习“Python怎么实现光速定位并提取两个文件的不同之处”吧!为了方便说明,我创建了一个简单的Excel用于示例可以看到上方两个Excel表格中共有五处不同,现在我们使用Python来快速定位这五处不同,这次不需要openpyxl,使用Pandas就能轻松搞定,首先导入相关库并读取数据其实在Pandas中一行代码就能找到两个DataFrame的不同可以看到,如果一样的数据就是NaN,而变化的数据则以它的值存储,但是如果这么做的话,我们仅仅找到数据不同的位置,并且数据量大的话盯着找到不同也挺消耗时间的,所以我们进一步研究。先换一种方式找到不同的值接着再使用NumPy根据True/False定位元素位置,同时将值的改变写入原表格并保存现在就生成了一个新的Excel来提示我们哪里发生了变化这样看起来就舒服了很多(高亮是手动的),当然在进行两个Excel比较的时候一定要注意这两个Excel的数据格式要差不多!两份Word比较起来相对于Excel就困难一点。首先我们还是创建两份有区别的Word文档,内容取自百度百科中的Python介绍[1]左边的为原始word右边的word是我修改了几处的文档, 现在我们用Python来快速找到两份文档的不同。读取文件使用到的是docx库[2] ,因为涉及到中文所以我们需要先读取docx文件,然后分段再根据标点符号分句,具体代码如下使用上面这段代码读一下两个word试试可以看到我们的word文件已经按照不同段落分好句存在两层list中,所以接下来的问题就转换为比较两个list,而这又是我们熟悉的上面的判断为最简单的形式:两个word中仅有文字改变,而段落、句子数量均没有改变,我们来试一下效果只要一秒,Python就找到了两份word文档之间的不同之处并定位!感谢各位的阅读,以上就是“Python怎么实现光速定位并提取两个文件的不同之处”的内容了,经过本文的学习后,相信大家对Python怎么实现光速定位并提取两个文件的不同之处这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是百云主机,小编将为大家推送更多相关知识点的文章,欢迎关注!

相关推荐: PHP中的DI依赖注入怎么应用

今天小编给大家分享一下PHP中的DI依赖注入怎么应用的相关免费云主机域名知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。依赖注入DI 其实本质上是指对类…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 03/30 18:43
下一篇 03/30 18:43

相关推荐