词频统计工具
统计每个词出现的次数,并给出排名、数量和百分比。支持停用词过滤、Top-N 显示以及导出完整表格为 CSV。
| # | 词语 | 次数 | % |
|---|---|---|---|
| 粘贴文本即可查看表格。 | |||
使用方法
- 1 将文本粘贴到左侧文本框中。
- 2 选择要显示的高频词数量。
- 3 可选:忽略常见的英文停用词,如 “the” 和 “a”。
- 4 将完整表格导出为 CSV 以便进一步分析。
为什么使用此工具
- 分词器支持 Unicode,能正确处理带重音符号的字母、数字和撇号。
- 默认开启停用词过滤,让真正有意义的关键词更突出。
- 百分比列反映的是过滤后词元总数中的占比。
- 导出的 CSV 文件包含完整的未过滤表格,而不仅仅是当前显示的 Top-N。
常见问题
文本是如何被分词(tokenize)的?
文本会先转换为小写,然后通过正则表达式 /[a-zà-ÿ\d']+/giu 匹配连续的字母、数字和撇号字符。因此 “don't” 仍会被视为一个词元;标点符号和表情符号则会作为分隔符。
哪些停用词会被忽略?
使用的是一份简短的英文停用词表,包含常见的冠词、介词、代词和助动词——与我们的 Word & Character Counter 工具中「高频关键词」功能所使用的列表相同。
百分比是基于过滤后的词元还是原始词元计算的?
如果启用了停用词过滤,则基于过滤后的数量计算;否则基于词元总数计算。无论哪种方式,该列都反映的是实际被统计的词的占比。
有哪些相关工具?
如需包含阅读时间的整体文本摘要,可使用 Word & Character Counter;如果需要按出现次数筛选行,可使用 Filter Lines。
什么是 词频统计工具?
词频统计工具(Word Frequency Counter)用于统计文本中每个词出现的次数,并显示其排名、数量和占比。工具内置停用词过滤、Top-N 选项,并支持将完整表格导出为 CSV。整个过程完全在浏览器中运行,用于分析关键词密度和高频词,无需将数据上传到服务器。
词频统计工具 是 Zerethon Tools 提供的免费 开发者 工具。统计每个词出现的次数,并给出排名、数量和百分比。支持停用词过滤、Top-N 显示以及导出完整表格为 CSV。. 完全在浏览器中运行 — 无需注册,无需上传。
- 分类
- 开发者
- 价格
- 免费
- 隐私
- 基于浏览器
- 注册
- 无需
隐私
除非另有说明,否则你的数据永远不会离开浏览器。词频统计工具 完全在客户端运行 — 无需上传服务器,不记录日志,不追踪你输入的内容。
操作指南
相关工具
在 Zerethon Social 上创作、分享与成长
免费注册。赚取积分,收集成就,与全球创作者建立联系。