NLP四大任务
序列标注:分词、词性标注、语义标注和命名实体识别
分类任务:文本分类、情感分析和文本聚类
句子对关系判断:自然语言推理、 问答QA、文本语义相似度
生成任务: 机器翻译、文本摘要、IR等
开放域问答系统, QA系统模仿人们怎样通过阅读互联网查找答案,并且返回一般答案。
现有的自然的语言模型集中于从一篇短小的文章抽取内容而不是通过阅读一整篇内容获取合适的上下文语境。结果,这个回答是复杂的并且冗长的。一个好的答案,succinct(简洁)和 revelant关联的
在这个比赛中,你的目标是预测短的和长答案, 回答真实的关于wikipedia问题,数据集是Google Natural Questions, 包含它自己的独特的私有测试集。一个可视化的例子显示了长的 和 短的答案,为了奖励top teams, 有一个特别的awards for using Tensorflow 2.0 APIs
如果成功, 这个challenge 将会激励更有效率和健壮的QA系统.
自然语言处理中,会经常涉及几种计算两个文本相似度的问题。提升信息检索系统的召回率,问答系统中的,需要计算的query和候选集的相似度; ## 文本相似度方法 * 基于统计的方法 主要是无监督学习,句子、段落, 较大粒度的文本。 * 基于语义的方法 大部分是基于深度学习的有监督学习,一般词语或句子, 较小粒度的文本。
请关注我的知乎账号fly,用的比较多
以后会不定时更新,NLP的笔记和总结,主要关注深度学习,决策树,多模态,NLP,GAN,图网络等最新的论文和技术。 pytorch和TF2.0,paddle最近也会了解,有兴趣的同学联系我谢谢~~