Learning Chinese Word Embeddings With Words and Subcharacter N-Grams

Co-occurrence information between words is the basis of training word embeddings; besides, Chinese characters are composed of subcharacters, words made up by the same characters or subcharacters usually have similar semantics, but this internal substructure information is usually neglected in popula...

Full description

Bibliographic Details
Main Authors:	Ruizhi Kang, Hongjun Zhang, Wenning Hao, Kai Cheng, Guanglu Zhang
Format:	Article
Language:	English
Published:	IEEE 2019-01-01
Series:	IEEE Access
Subjects:	Chinese word embedding subcharacter n-gram language model
Online Access:	https://ieeexplore.ieee.org/document/8675926/

Internet

https://ieeexplore.ieee.org/document/8675926/

Learning Chinese Word Embeddings With Words and Subcharacter N-Grams

Internet

Similar Items