标签存档: 文本标注

AILA:基于 Attention 的深度神经网络进行文本类别标注 (AILA: Attentive Interactive Labeling Assistant for Document Classification through Attention-based Deep Neural Networks)

文本分类(Text Classification)已经运用到越来越多的自然语言处理任务(Natural Langurage Processing,NLP)上,如垃圾邮件检测(Span Detection), 假新闻过滤(Fake news filtering),情感分析(Sentiment Analysis)等等。基于深度学习的这类任务都需要大量的标注数据,然而标注是一个十分耗时耗力的过程,需要标注者长时间的注意力。特别地,对于一些特定领域的数据,如法律、医学等等,更要求标注者有着一定的专业知识。如果系统能够自动的高亮出文本中对于文本类别影响较大的关键词可以一定程度上减轻标注者的任务。

继续阅读 »