首页 > 解决方案 > 试图找到一种方法来删除或显示与 python 的类似引用

问题描述

我有一个问题,我需要你的帮助。我有一个 word 文件,其中包含许多参考资料,例如:

[1] M.-H. Han、Y. Li 和 C.-H。黄,“纳米MOSFET器件和电路中固有参数波动引起的高频特性的影响,”微电子可靠性,卷。50,第 657-661 页,2010 年。

[2] E. Maricau 和 G. Gielen,“用于纳米 CMOS 可靠性的计算机辅助模拟电路设计”,电路和系统中的新兴和精选主题,IEEE 期刊,第一卷。1,第 50-58 页,2011 年。. .

其中一些参考文献可能相似,但它们的编号不同。你有什么想法可以找到一种方法来删除或显示#python 的类似引用吗?谢谢

标签: pythontextms-word

解决方案


您可以将脚注文本拆分为数字和参考的其余部分:

>>> footnote = '[1] P. Wood, "Example Thesis," Some collection, pp 45-46, 2018'
>>> number, reference = footnote.split(' ', 1)
>>> reference
'P. Wood, "Example Thesis," Some collection, pp 45-46, 2018'

Python 有一个Counter类可用于构建直方图。

您可以添加对Counter对象的引用,然后在有多个对象时对其进行查询:

>>> from collections import Counter

>>> counter = Counter()
>>> counter[reference] += 1

您可以创建所有脚注的循环:

>>> for footnote in footnotes:
...     number, reference = footnote.split(' ', 1)
...     counter[reference] += 1

然后访问大于 的计数1

>>> duplicates = [item for item, count in counter.most_common()
...               if count > 1]

推荐阅读