首页 > 解决方案 > 使用命名实体识别的自动摘要

问题描述

我想使用命名实体识别(NER)根据给定的数据集自动汇总机票。

所以基本上这是我的数据集。

在此处输入图像描述

在这里,我需要在 pdf 中创建有关乘客详细信息的摘要,例如:

PNR 编号 ____(PNRNum) 是指乘客姓名 ____(姓名) 从 ____(Dep Airport),____(Start Country) 到 ____(Arr Airport),____(End Country) 从 ____(Start Time) 开始。航班号是 ____(Flight No),即 _____(Int Dom),使用基本票价 _____(基本票价)的 _____(舱位)机票。

在这里,当 PNR 编号应作为输入输入时,应在第一个空白处输入,并且应在剩余的空白处填写数据集中的相应数据。

airline = pd.read_csv("AIR-LINE.csv")
def create_airline_ticket():
    c = canvas.Canvas('AIRlines.pdf')

    c.setFont("Courier", 20)
    c.drawCentredString(300, 700, 'Airline Ticket')
    c.setFont("Courier", 14)
    form = c.acroForm

    c.drawString(10, 650, 'The PNR Number')
    options = [('airline.loc[[0, 10], :]')]
    form.choice(name='choice1', tooltip='Field choice1',
                value='A',
                x=165, y=645, width=72, height=20,
                borderColor=magenta, fillColor=pink, 
                textColor=blue, forceBorder=True, options=options)

    c.save()

我想使用 ReportLabs 模块来使用其中可用的列表框。但它没有相应地进行。我必须用其他方式。

那么你能建议我一步一步的程序吗?由于我是python的初学者,我可以轻松学习。谢谢。

标签: pythonnlpspacynamed-entity-recognition

解决方案


是的,我肯定会推荐带有 python 的 SpaCy。另一种选择是斯坦福纳。

不明白你说的引用是什么意思?你的意思是如果其他人试图做机票汇总?


推荐阅读