![]() |
清华大学万词王,首个支持中文及跨语言查询的开源在线反向词典 |
旁观者
L21
• 2021-12-08 • 回复 0 • 最后编辑于2021-12-08 22:59 • 只看楼主
• 举报
|
最近,清华大学在GitHub开源了一项神器叫万词王(Want Wrong),号称是首个支持中文及跨语言查询的开源在线反向词典。
什么叫反向词典呢?普通的词典告诉你某个词语的定义,而反向词典恰好相反,可以告诉你哪些词语符合你输入描述的意思。下图为万词王在线反向词典的页面截图,其中演示了反向查词的一个示例,输入“山非常高”,系统将返回一系列模型认为表达“山非常高”意思的词语,例如“高峻”、“巍峨”等。
反向词典可以用来做什么?
解决“舌尖现象”(tip-of-the-tongue,又称话到嘴边说不出来),即暂时性忘词的问题
帮助语言学习者学习、巩固词汇
改善选词性失语者患者的生活质量,该病的症状是可以识别并描述一个物体,但是无法记起该物体的名字
简单来说,就是现在的年轻人都会有词穷的时候,当你词穷的时候,这个工具就可以派上用场了,比如你心慌意乱拿不定主意的时候,不知道用哪个词,你就可以将它输进去,就会得到犹豫不决、不意乱心慌等100个词语。而且词性和韵脚也是可以自定义选择。
除此之外,它还支持汉语、英语、汉英、英汉等多种不同转化方式。
整体的系统架构也很简单:
万词王的核心模型是之前清华大学计算机系自然语言处理实验室(THUNLP)发表在AAAI-20上的一篇论文提出的多通道反向词典模型:Multi-channel Reverse Dictionary Model [论文] [代码],其模型架构如下所示:
GitHub地址:https://github.com/thunlp/WantWords
官网:https://wantwords.thunlp.org/
声明:本文系转载文章,仅供学习交流使用,侵权请联系删除