聊天机器人(Chatbot)是经由对话或文字进行交谈的计算机程序。其能够模拟人类对话,通过图灵测试。自 1966 年以来人类从未停止过对聊天机器人的探索。现如今,苹果语音助手 Siri,微软的小冰、小娜、Rinna、Tay、Zo、Rukkkuh,亚马逊的Echo,百度的小度机器人,京东JIMI客服机器人,网易七鱼等 Chatbot 纷纷进驻到生活的各个领域,改变着我们的生活。
历史发展脉络
1966 年,MIT 的计算机科学家 Joseph Weizenbaum 发表了 ELIZA,它可以根据人工设计的脚本与人类交流,是世界上第一个模仿人类谈话的机器人;
1971 年, 斯坦福大学的 Kenneth Colby 开发出 Parry 聊天机器人,它模仿偏执狂患者,这是第一个通过图灵测试的聊天机器人;
1988 年,加州大学伯克利分校的 Robert Wilensky 等人开发了名为 UNIX Consultant 的聊天机器人系统;
1990 年,美国人 Hugh Loebner 设立 Loebner Prize,奖励首个与人类回复无差别的计算机程序,即聊天机器人系统;
1995 年,Richard Wallace 博士开发的 ALICE 系统允许用户自定义自己的聊天机器人,被认为是 20 世纪最伟大的聊天机器人。ALICE 在 2000、2001 和 2004 年三次斩获勒布纳人工智能奖(Loebner Prize),该奖项颁发给最像人类的系统;
2001 年,SmarterChild 在短信和即时信息中广泛流行,聊天机器人第一次被应用在即时通信领域;
2006 年,IBM Watson 能够用自然语言回答问题;
2010 年,苹果语音助手 Siri 诞生;
之后,全球各大公司开始推出 Chatbots 平台或开源架构。
必读论文推荐
Dialog State Tracking: A Neural Reading Comprehension Approach
作者:Shuyang Gao, Abhishek Sethi, Sanchit Agarwal, Tagyoung Chung, Dilek Hakkani-Tur
链接:
https://www.aminer.cn/pub/5de0b9f3df1a9c0c41598a75/dialog-state-tracking-a-neural-reading-comprehension-approach
对话状态追踪用于在给定所有先前对话的情况下估计当前的对话状态。机器阅读理解则侧重于构建系统,以读取文本段落并回答基于段落理解的问题。本篇论文将对话状态追踪转化为一项机器阅读理解任务,以基于上下文回答当前的对话状态是什么这一问题。传统的状态跟踪方法通常将对话状态预测为本体中所有可能的槽值在封闭集合上的分布,而本文使用简单的基于注意力的神经网络来指向对话中的槽值。
Topical-Chat: Towards Knowledge-Grounded Open-Domain Conversations
作者:Karthik Gopalakrishnan, Behnam Hedayatnia, Qinlang Chen, Anna Gottardi, Sanjeev Kwatra, Anu Venkatesh, Raefer Gabriel, Dilek Hakkani-Tür
发表:Interspeech Conference
链接:
https://www.aminer.cn/pub/5db92b0647c8f7664621a7e6/topical-chat-towards-knowledge-grounded-open-domain-conversations
建立可以与人类进行深层次、开放性对话的社交机器人,是人工智能领域的重大挑战之一。Amazon 团队开发的 Topical-Chat 是一个基于知识的人-人之间开放领域对话数据集(Knowledge-Grounded Open-Domain Conversations)。其中的基础知识涵盖 8 个广泛的主题,并且对话伙伴没有明确定义的角色,有助于对开放域对话式 AI 的进一步研究。本文还在 Topical-Chat 上训练了几种最新的编码器-解码器对话模型,并使用自动和人工评估以进行基准测试。
MoEL: Mixture of Empathetic Listeners
作者:Zhaojiang Lin, Andrea Madotto, Jamin Shin, Peng Xu, Pascale Fung
链接:
https://www.aminer.cn/pub/5db9294b47c8f766461f2f8d/moel-mixture-of-empathetic-listeners
以往对移情对话系统的研究主要关注在特定情绪下产生的反应。但是,产生共情不仅需要具备生成情绪反应的能力,更需要理解用户的情绪并适当地予以回复。本篇论文提出全新的基于端到端(End-to-End)在对话系统中建立移情模型的方法:移情听众的混合物(MoEL)。这一模型首先捕获用户的情绪并输出情绪分布。基于此,MoEL 将结合优化后的侦听器的对某些情绪做出的反应,从而产生移情。
Ethical Challenges in Data-Driven Dialogue Systems
作者:Peter Henderson, Koustuv Sinha, Nicolas Angelard-Gontier, Nan Rosemary Ke, Genevieve Fried, Ryan Lowe, Joelle Pineau
发表:In the 2018 AAAI/ACM Conference on AI, Ethics, and Society
链接:
https://www.aminer.cn/pub/5a4aef9e17c44a2190f7a8b1/ethical-challenges-in-data-driven-dialogue-systems
本篇论文重点介绍对话系统研究中可能出现的道德问题,包括:数据驱动系统中的隐性偏见、对抗性示例的出现、潜在的隐私侵犯源、安全问题,强化学习系统的特殊考虑以及可复制性问题等。
MultiWOZ - A Large-Scale Multi-Domain Wizard-of-Oz Dataset for Task-Oriented Dialogue Modelling
作者:Pawel Budzianowski, Tsung-Hsien Wen, Bo-Hsiang Tseng, Iigo Casanueva,Stefan Ultes, Osman Ramadan, Milica Gasic
链接:
https://www.aminer.cn/pub/5bdc315017c44a1f58a05b9f/multiwoz-a-large-scale-multi-domain-wizard-of-oz-dataset-for-task
尽管机器学习已成为对话研究界的主要场景,但真正的突破已被可用数据的规模所阻碍。为了解决这个基本障碍,本篇论文引入了 Multi-Domain Wizard-of-Oz 数据集(MultiWOZ),这是一个跨越多个领域和主题的完全标记的人与人的书面对话数据集。它的对话数量达到了 10k,比所有先前注释的面向任务的语料库大至少一个数量级。除了是标有对话信念状态和对话行为的开源数据集之外,这项工作的贡献有两方面:首先,提供数据收集程序的详细描述以及数据结构和分析的摘要。数据收集渠道完全基于众包,无需聘请专业注释人员;其次,报告了一组信念跟踪,对话行为和回复生成的基准结果,显示了数据的可用性,并为未来的研究设定了基线。
A Survey of Available Corpora For Building Data-Driven Dialogue Systems: The Journal Version
作者:Iulian Vlad Serban, Ryan Lowe, Peter Henderson, Laurent Charlin, Joelle Pineau
发表:Dialogue & Discourse
链接:
https://www.aminer.cn/pub/5b3d98bd17c44a510f800274/a-survey-of-available-corpora-for-building-data-driven-dialogue-systems-the
本篇论文告诉我们目前有哪些可用于对话生成系统的开源数据集,并且分析了它们各自的重要特性,以及该如何使用他们。此外讨论了它们除了对话系统外的其他用途,以及这些数据集对应的检测方法。
The Design and Implementation of XiaoIce, an Empathetic Social Chatbot
作者:Li Zhou, Jianfeng Gao, Di Li, Heung-Yeung Shum
发表:Computational Linguistics
链接:
https://www.aminer.cn/pub/5c5ce50d17c44a400fc38d54/the-design-and-implementation-of-xiaoice-an-empathetic-social-chatbot
这是由微软研究员发表的关于智能语音助手小冰的论文。小冰是一个独特的人工智能伴侣,具有情感联系,满足人类对交流、感情和社会归属的需求。本篇论文在系统设计中考虑了智商和情商,将人机社交聊天作为马尔可夫决策过程(MDP)的决策,并优化了小冰的长期用户参与度和预期的每次会话对话。本篇文章详细介绍了系统架构和关键组件,包括对话管理器、核心聊天、技能和移情计算模块;并展示了小冰如何动态识别人类的感受和状态,理解用户意图,并在长时间的对话中响应用户需求。
A Network-based End-to-End Trainable Task-oriented Dialogue System
作者:Lina Maria Rojas-Barahona,Milica Gasic, Nikola Mrksic, Pei-Hao Su, Stefan Ultes, Tsung-Hsien Wen, Steve J. Young, David Vandyke
链接:
https://www.aminer.cn/pub/59ae3c3a2bbe271c4c71fcd9/a-network-based-end-to-end-trainable-task-oriented-dialogue-system
让机器去和人类自然的交谈是具有挑战性的。最近的任务型对话系统需要创造几个部分并且通常这需要大量的人工干预,或者需要标注数据去解决各部分训练的问题。本篇论文提出了一种端到端的任务型对话系统(End-to-End trainable system),它采取了一种基于管道框架的新颖的收集对话数据的方法。这个方法确保轻松实现对话系统而不用过多的人工干预。
Neural Belief Tracker: Data-Driven Dialogue State Tracking
作者:Nikola Mrksic, Diarmuid Séaghdha, Tsung-Hsien Wen, Blaise Thomson, Steve J. Young
链接:
https://www.aminer.cn/pub/57a4e921ac44365e35c9913a/neural-belief-tracker-data-driven-dialogue-state-tracking
现代口语对话系统的核心组成部分之一是 belief tracker,它可以在对话的每一步估计用户的目标。然而,目前大多数方法难以扩展到更大、更复杂的对话领域。这是由于他们依赖:a)口语理解(Spoken Language Understanding,SLU)模型,需要大量注释的训练数据;或者 b)手工制作的词汇表,用于捕捉用户语言中的一些词语变种。本篇论文提出了一个新的 Neural Belief Tracking(NBT)框架,通过将模型建立在表征学习上以此克服了这些问题。NBT 模型对预训练的词向量进行推理,学习将它们组合成用户话语和对话上下文的分布式表示。
Towards an Automatic Turing Test: Learning to Evaluate Dialogue Responses
作者:Ryan Lowe, Michael Noseworthy, Iulian Vlad Serban, Nicolas Angelard-Gontier,Yoshua Bengio, Joelle Pineau
链接:
https://www.aminer.cn/pub/59ae3c262bbe271c4c71ea58/towards-an-automatic-turing-test-learning-to-evaluate-dialogue-responses
本篇论文使用语境和真实反应来对模型生成的反应进行打分,并和人类打分的分值进行比较,从而达到一种自动进行图灵检测效果。训练出来的模型可以生成符合人类判断、能回答输入语句的对话。在给定地面实况的情况下,以往的工作都是计算生成话语和地面实况的相似性(包括字面上、语义上),本篇论文从人的理解角度出发,对生成的反应进行度量。
Adversarial Learning for Neural Dialogue Generation
作者:Jiwei Li, Will Monroe, Tianlin Shi, Alan Ritter, Dan Jurafsky
链接:
https://www.aminer.cn/pub/58d82fcbd649053542fd6082/adversarial-learning-for-neural-dialogue-generation
To Plan or not to Plan? Discourse Planning in Slot-Value Informed Sequence to Sequence Models for Language Generation
作者:Neha Nayak, Dilek Hakkani-Tür, Marilyn A. Walker, Larry P. Heck
发表:Interspeech Conference
链接:
https://www.aminer.cn/pub/5a73cb6317c44a0b30358265/to-plan-or-not-to-plan-discourse-planning-in-slot-value-informed
Training End-to-End Dialogue Systems with the Ubuntu Dialogue Corpus
作者:Ryan Thomas Lowe, Nissan Pow, Iulian Vlad Serban, Laurent Charlin, Chia-Wei Liu, Joelle Pineau
发表:Dialogue & Discourse
链接:
https://www.aminer.cn/pub/58d82fecd649053542fdc665/training-end-to-end-dialogue-systems-with-the-ubuntu-dialogue-corpus
A Copy-Augmented Sequence-to-Sequence Architecture Gives Good Performance on Task-Oriented Dialogue
作者:Mihail Eric, Christopher D. Manning
链接:
https://www.aminer.cn/pub/58d82fd2d649053542fd76c7/a-copy-augmented-sequence-to-sequence-architecture-gives-good-performance-on-task
Learning Symmetric Collaborative Dialogue Agents with Dynamic Knowledge Graph Embeddings
作者:He He, Anusha Balakrishnan, Mihail Eric, Percy Liang
链接:
https://www.aminer.cn/pub/599c7953601a182cd263067d/learning-symmetric-collaborative-dialogue-agents-with-dynamic-knowledge-graph-embeddings
Key-Value Retrieval Networks for Task-Oriented Dialogue
作者:Mihail Eric, Lakshmi Krishnan, Francois Charette, Christopher D. Manning
链接:
https://www.aminer.cn/pub/5d9edbfa47c8f7664602e485/key-value-retrieval-networks-for-task-oriented-dialogue
Learning Robust Dialog Policies in Noisy Environments
作者:Maryam Fazel-Zarandi, Shang-Wen Li, Jin Cao, Jared Casale, Peter Henderson, David Whitney, Alborz Geramifard
链接:
https://www.aminer.cn/pub/5a73cbc317c44a0b3035eb5a/learning-robust-dialog-policies-in-noisy-environments
Hybrid Code Networks: practical and efficient end-to-end dialog control with supervised and reinforcement learning
作者:Jason D. Williams, Kavosh Asadi, Geoffrey Zweig
链接:
https://www.aminer.cn/pub/58d82fcbd649053542fd5e67/hybrid-code-networks-practical-and-efficient-end-to-end-dialog-control-with
The Dialog State Tracking Challenge Series: A Review
作者:Jason D. Williams, Antoine Raux, Matthew Henderson
发表:Dialogue & Discourse
链接:
https://www.aminer.cn/pub/57a4e937ac44365e35c9cbfe/the-dialog-state-tracking-challenge-series-a-review
How NOT To Evaluate Your Dialogue System: An Empirical Study of Unsupervised Evaluation Metrics for Dialogue Response Generation
作者:Chia-Wei Liu, Ryan Lowe, Iulian Vlad Serban, Michael Noseworthy, Laurent Charlin, Joelle Pineau
链接:
https://www.aminer.cn/pub/573696106e3b12023e5239eb/how-not-to-evaluate-your-dialogue-system-an-empirical-study-of-unsupervised
转自 学术头条
来源:oschina
链接:https://my.oschina.net/u/4365362/blog/3274224