post_img

中文词频统计

摘要

基本原理 我们不采用通过音节来辨别的办法:中文中的双音节(如琵琶、忐忑)、多音节词(如胡萝卜),而是通过大量文本来分别每2字词、3 …