post_img

Top-K Solution

摘要

1. 小规模 / 一次性批量数据 2. 大规模数据 / K 远小于 N 为什么是小顶堆? 因为我们希望淘汰那些相对较小的元素。根据 …

post_img

中文词频统计

摘要

基本原理 我们不采用通过音节来辨别的办法:中文中的双音节(如琵琶、忐忑)、多音节词(如胡萝卜),而是通过大量文本来分别每2字词、3 …