有没有这样的文本匹配、分类模型、包?

查看 31|回复 0
作者:NoOneNoBody   
预设一个字典
例如 其中有 “半泽直树” (简体)
输入“『半沢直樹』(はんざわ なおき)は、TBS 系列「日曜劇場」枠で放送された、池井戸潤の小説「半沢直樹シリーズ」を原作としたテレビドラマである。主演は堺雅人。 ”
能找到最接近的词是 “半泽直树”
这里涉及繁体字、异体字问题,原文“直”也是异体字,复制到这里就变了
又如,“Yuuka Hanazawa” 能匹配出 "Hanazawa Yuka",这里涉及姓名前后写法、日语罗马字拼写的差异
没有搜到,中日韩的项目本来就稀少,跨民族语言的更少
看看有没有动漫爱好者知道一些特别的项目可以做这个
您需要登录后才可以回帖 登录 | 立即注册

返回顶部